CN114168619B - 语言转换模型的训练方法及装置 - Google Patents

语言转换模型的训练方法及装置 Download PDF

Info

Publication number
CN114168619B
CN114168619B CN202210120493.7A CN202210120493A CN114168619B CN 114168619 B CN114168619 B CN 114168619B CN 202210120493 A CN202210120493 A CN 202210120493A CN 114168619 B CN114168619 B CN 114168619B
Authority
CN
China
Prior art keywords
conversion model
language conversion
data
structured query
natural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210120493.7A
Other languages
English (en)
Other versions
CN114168619A (zh
Inventor
惠彬原
耿瑞莹
黎槟华
石翔
李永彬
孙健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Damo Institute Hangzhou Technology Co Ltd
Original Assignee
Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Damo Institute Hangzhou Technology Co Ltd filed Critical Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority to CN202210120493.7A priority Critical patent/CN114168619B/zh
Publication of CN114168619A publication Critical patent/CN114168619A/zh
Application granted granted Critical
Publication of CN114168619B publication Critical patent/CN114168619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种语言转换模型的训练方法及装置,包括:获取数据表中的数据元素;生成用于查询数据元素的结构化查询语句样本和自然语句样本,自然语句样本中的词语与数据表中的数据元素之间具有映射关系;基于数据元素、自然语句样本、结构化查询语句样本和映射关系,对初始语言转换模型进行训练,得到目标语言转换模型。本申请中整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,本申请可以基于数据表的数据元素与自然语句中的词语之间的显性的映射关系,进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。

Description

语言转换模型的训练方法及装置
技术领域
本申请涉及计算机技术领域,特别是涉及一种语言转换模型的训练方法及装置、数据查询方法及装置、物流数据查询方法及装置、智能语音设备控制方法及装置、电子设备、机器可读介质。
背景技术
人机问答系统是人机交互场景中的重要应用环节,人机问答系统可以处理用户输入的自然语言问题,得到相应的答案并反馈给用户。
在目前,人机问答系统可以通过利用人工标注的训练数据训练得到的语义意图识别模型,识别用户输入的自然语言问题的语义意图,并基于与语义意图关联的答复内容模板,反馈给用户与其问题的语义意图匹配的答复内容。
但是,目前的方案中,人工标注训练数据成本较高,且由于语义意图识别过程存在的模糊性,导致难以针对用户的问题反馈精确的答复内容。
发明内容
本申请实施例提供了一种语言转换模型的训练方法及数据查询方法,以解决相关技术中人工标注训练数据成本较高,且难以针对用户的问题反馈精确的答复内容的问题。
相应的,本申请实施例还提供了一种语言转换模型的训练装置、语言转换装置、电子设备以及存储介质,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种语言转换模型的训练方法,所述方法包括:
获取数据表中的数据元素;
生成用于查询所述数据元素的结构化查询语句样本和自然语句样本,所述自然语句样本中的词语与所述数据表中的数据元素之间具有映射关系;
基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,得到目标语言转换模型,所述目标语言转换模型用于将自然语句转换为针对所述数据表的结构化查询语句。
本申请实施例公开了一种数据查询方法,所述方法包括:
获取自然查询语句;
将所述自然查询语句输入目标语言转换模型,得到针对数据表的结构化查询语句;
根据所述结构化查询语句,在所述数据表中获取对应的数据内容;
其中,所述目标语言转换模型是基于述的语言转换模型的训练方法所训练得到的。
本申请实施例公开了一种物流数据查询方法,包括:
获取物流数据表中的物流信息元素;
生成用于查询所述物流信息元素的物流结构化查询语句样本和物流自然语句样本,所述物流自然语句样本中的词语与所述物流数据表中的物流信息元素之间具有映射关系;
基于所述物流信息元素、所述物流自然语句样本、所述物流结构化查询语句样本和所述映射关系,对初始物流语言转换模型进行训练,得到目标物流语言转换模型;
在获取到物流自然语句的情况下,将所述物流自然语句输入目标物流语言转换模型,得到针对物流数据表的物流结构化查询语句,并根据所述物流结构化查询语句,在所述物流数据表中获取对应的物流信息内容。
本申请实施例公开了一种智能语音设备控制方法,包括:
获取设备指令数据表中的指令信息元素;
生成用于查询所述指令信息元素的控制结构化查询语句样本和自然控制语句样本,所述自然控制语句样本中的词语与所述设备指令数据表中的指令信息元素之间具有映射关系;
基于所述指令信息元素、所述自然控制语句样本、所述控制结构化查询语句样本和所述映射关系,对初始指令语言转换模型进行训练,得到目标指令语言转换模型;
在获取到自然控制语句的情况下,将所述自然控制语句输入目标指令语言转换模型,得到控制结构化查询语句,根据所述控制结构化查询语句在所述物流数据表中获取对应的指令信息内容,并根据所述指令信息内容控制智能设备。
本申请实施例公开了一种语言转换模型的训练装置,所述装置包括:
第一获取模块,用于获取数据表中的数据元素;
生成模块,用于生成用于查询所述数据元素的结构化查询语句样本和自然语句样本,所述自然语句样本中的词语与所述数据表中的数据元素之间具有映射关系;
训练模块,用于基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,得到目标语言转换模型,所述目标语言转换模型用于将自然语句转换为针对所述数据表的结构化查询语句。
本申请实施例公开了一种数据查询装置,所述装置包括:
第二获取模块,用于获取自然查询语句;
转换模块,用于将所述自然查询语句输入目标语言转换模型,得到针对数据表的结构化查询语句;
查询模块,用于根据所述结构化查询语句,在所述数据表中获取对应的数据内容;
其中,所述目标语言转换模型是基于所述的语言转换模型的训练装置所训练得到的。
本申请实施例公开了一种物流数据查询装置,包括:
第三获取模块,用于获取物流数据表中的物流信息元素;
物流样本生成模块,用于生成用于查询所述物流信息元素的物流结构化查询语句样本和物流自然语句样本,所述物流自然语句样本中的词语与所述物流数据表中的物流信息元素之间具有映射关系;
物流训练模块,用于基于所述物流信息元素、所述物流自然语句样本、所述物流结构化查询语句样本和所述映射关系,对初始物流语言转换模型进行训练,得到目标物流语言转换模型;
物流查询模块,用于在获取到物流自然语句的情况下,将所述物流自然语句输入目标物流语言转换模型,得到针对物流数据表的物流结构化查询语句,并根据所述物流结构化查询语句,在所述物流数据表中获取对应的物流信息内容。
本申请实施例公开了一种智能语音设备控制装置,包括:
第四获取模块,用于获取设备指令数据表中的指令信息元素;
控制样本生成模块,用于生成用于查询所述指令信息元素的控制结构化查询语句样本和自然控制语句样本,所述自然控制语句样本中的词语与所述设备指令数据表中的指令信息元素之间具有映射关系;
控制训练模块,用于基于所述指令信息元素、所述自然控制语句样本、所述控制结构化查询语句样本和所述映射关系,对初始指令语言转换模型进行训练,得到目标指令语言转换模型;
控制模块,用于在获取到自然控制语句的情况下,将所述自然控制语句输入目标指令语言转换模型,得到控制结构化查询语句,根据所述控制结构化查询语句在所述物流数据表中获取对应的指令信息内容,并根据所述指令信息内容控制智能设备。
本申请实施例还公开了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例中一个或多个所述的方法。
本申请实施例还公开了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例中一个或多个所述的方法。
与相关技术相比,本申请实施例包括以下优点:
本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例的一种模板语言转换模型的训练方法的架构图;
图2是本申请实施例的一种训练数据生成模块的结构图;
图3是本申请实施例的一种应用场景的界面图;
图4是本申请实施例的另一种应用场景的界面图;
图5是本申请实施例的另一种应用场景的界面图;
图6是本申请实施例的一种语言转换模型的训练方法的步骤流程图;
图7是本申请实施例的另一种语言转换模型的训练方法实施例的步骤流程图;
图8是本申请实施例的一种语言转换模型的训练方法的步骤流程图;
图9是本申请实施例的一种数据元素和词语的映射关系示意图;
图10是本申请实施例的一种词级别的自监督训练示意图;
图11是本申请实施例的一种基于模式知识的自然语句扰动训练示意图;
图12是本申请实施例的一种物流数据查询方法的步骤流程图;
图13是本申请实施例的一种智能语音设备控制方法的步骤流程图;
图14是本申请实施例的一种语言转换模型的训练装置的结构框图;
图15是本申请实施例的一种数据查询装置的结构框图;
图16是本申请实施例的一种物流数据查询装置的结构框图;
图17是本申请实施例的一种智能语音设备控制装置的结构框图;
图18是本申请一实施例提供的装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
为使本领域技术人员更好地理解本申请,以下对本申请涉及的概念进行说明:
数据表:结构化查询语句(SQL,Structured Query Language)数据库中的数据表,用于存储数据,数据存入数据库的对应数据表后,即完成了待存储数据的永久化,此后可以通过访问查询数据库的数据表,来获取数据的数据内容。
数据元素:也称作数据表的模式,指数据表中的表名、列名、值等信息。
自然语句:由自然语言构成的语句,如“请告诉我班里身高最高的男生
Figure 280834DEST_PATH_IMAGE001
”就是一个自然语言问句。
结构化查询语句(SQL,Structured Query Language):是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统,具有数据定义、数据操纵、和数据控制的功能。
Table QA:一种基于表格知识的人机交互系统,其实现将用户输入的自然语句转换为SQL,并在数据库的数据表中找到SQL对应的结果反馈给用户的功能。
语言转换模型:一种通过语言理解(semantic parsing)的方式,将人类的自然语句(Text)转换为SQL语句(SQL)的模型。
模式链接:指数据表中的模式与自然语句的词语之间的映射关系。
本申请实施例的一种实现方式中,语言转换模型的训练方法可应用于Table QA场景,该场景下可以先将数据内容持久化存储在SQL数据库的对应数据表中,进而后续获取用户输入的自然语句,并基于目标语言转换模型自动将自然语句转换为SQL,最后通过SQL,在SQL数据库的数据表中查找准确的数据内容反馈给用户,从而完成人机问答交互过程,即本申请实施例旨在解决如何通过目标语言转换模型将自然语句转换为准确的SQL的目的。
参照图1,其示出了本申请实施例提供的一种模板语言转换模型的训练方法的架构图,包括:客户端和服务端,服务端包括:数据库、训练数据生成模块、训练数据评估模块、训练模块、查询模块。在该场景下,数据库、训练数据生成模块、训练数据评估模块、语言转换模型、查询模块可以部署在同一终端设备(如图1的服务端)中,也可以部署在不同终端设备中,本申请实施例对此不做限定。
其中,服务端可以提供给客户端可供操作的人机交互界面,客户端用户可以在人机交互界面输入自然语句,并从人机交互界面中获取到服务端针对自然语句查询反馈的数据内容;数据库可以将数据内容存储在对应数据表中,服务端可以通过SQL在数据库的数据表中查询对应的数据内容。
需要强调的是,在本申请中涉及到的数据内容,如果涉及到用户的数据,这些数据都是经过用户或者各个相关权益方授权后才获取的数据。
在本申请实施例中,目标语言转换模型的设计具有多个诉求:1、训练数据的自动化高质量生成,减少人工标注的参与;2、模型训练过程能够有效缓解数据噪声的问题;3、语言转换模型基于Table QA场景下显性的模式链接关系建模,提升模型的性能。
首先基于上述诉求1,本申请实施例可以通过训练数据生成模块,基于机器学习和深度学习的技术理论,批量自动化的生成高质量的训练数据,且降低人工标注的参与,具体可以参照图2,训练数据生成模块可以从数据表的表头、列名、值中提取数据元素作为数据表的模式,进一步基于预设的结构化查询语句生成规则,生成多条SQL样本,该过程具体为:结构化查询语句生成规则可以定义SQL句式模板,通过将多个数据元素按照随机条件随机填充至SQL句式模板中的各个待填充位置,可以得到多条SQL样本。
例如,假设提取得到的数据元素包括:姓名、身高、体重、岁数;结构化查询语句生成规则定义的SQL句式模板为:SELECT()FROM学生 WHERE()。则将数据元素随机填充至SQL句式模板,可以得到的SQL样本包括:
SELECT MAX(身高)FROM学生 WHERE(岁数>10)//表征查询岁数大于10岁且身高最高的学生的身高;
SELECT MIN(岁数)FROM学生 WHERE(身高>175)//表征查询岁数最小且身高大于175的学生的岁数;
SELECT(姓名)FROM学生 WHERE(身高>175)//表征查询身高大于175的学生的姓名;
参照图2,在得到多条SQL样本后,可以将SQL样本输入基于语料训练得到的深度学习模型,通过深度学习模型将SQL样本转换为对应的自然语句样本,从而自动化、批量的得到大量高质量自然语句样本,从而基于数据元素—SQL样本—自然语句样本的对应关系,构建多条训练数据,整个训练数据生成过程降低了人工参与度,提高了生成效率和质量。其中,深度学习模型可以为seq2seq模型(一种循环神经网络的变种),该模型包括编码器和解码器,是在输出长度不确定的场景中优选采用的模型,输出长度不确定的场景在机器翻译的任务中经常出现,因此该模型适用于本申请实施例将SQL语言转换为自然语言的场景,可以将SQL样本转换为自然语句样本。
进一步的,基于上述诉求2,语言转换模型基于大规模的训练数据进行训练,且由于不同训练数据存在不同程度数据噪声的原因,模型在训练过程中若输入较复杂的训练数据,会较易造成欠拟合;而输入较简单的训练数据,又会较易造成过拟合,这两种情况都会影响模型的性能。
为了解决上述问题,参照图1,本申请实施例可以通过训练数据评估模块,进一步的评估每条训练数据的数据难易度,以及语言转换模型当前的模型接受度,并根据数据难易度和模型接受度,按照由简单到困难的次序将各个训练数据依次输入语言转换模型,达到由简单到困难的学习方式的应用,降低数据噪声的影响以及过拟合和欠拟合现象出现的几率,提升模型性能。
进一步的,基于上述诉求3,本申请实施例可以基于Table QA场景下数据表的数据元素与自然语句中的词语之间具有强关联的特性,构建数据表的数据元素与自然语句中的词语之间的映射关系,并通过图1中的训练模块,基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
例如,假设数据元素包括:姓名、身高、生理区别、学号;一条自然语句为“请告诉我班上最高的男生的身高及学号”,则基于对数据元素和自然语句中词语之间强关联的分析,可以建立:数据元素身高—词语最高—词语身高的映射关系;数据元素学号—词语学号的映射关系;数据元素生理区别—词语男生的映射关系;并且通过解析SQL的生成规则,还可以将该映射关系与SQL中的关键词进行关联,从而在训练过程中,可以使得模型能够准确预测自然语句中的哪些词应该和哪些数据元素进行链接,以及这种链接关系对应SQL中的哪些关键词,从而输出更优的自然语句。
参照图1,在训练得到目标语言转换模型后,即可将目标语言转换模型应用在具体的Table QA场景中,此时客户端可以根据服务端提供的人机交互界面,在其中输入自然语句,服务端的查询模块可以将自然语句输入目标语言转换模型中转换为对应的SQL,并利用转换后的SQL在数据库中查找对应的查询结果,将查询结果提供人机交互界面反馈给客户端,从而完成人机对答。
针对服务端与客户端的人机交互,可以实现的几种具体场景如下:
在一种快递包裹的物流信息查询场景中,参照图3,其示出了本申请实施例提供的一种应用场景的界面图,在快递包裹的物流信息查询场景中,客户端可以在服务端提供的物流客服问答界面查询快递包裹的物流信息,并得到服务端的查询结果。具体的,服务端的物流信息数据库中可以存储快递包裹的订单号、配送进度、预计送达时间等信息,在客户端发送“查一下订单号为xx的包裹当前的配送进度以及预计送达时间”的自然语句时,服务端可以通过查询模块的目标语言转换模型,将该自然语句转换为SQL,并通过转换的SQL在物流信息数据库中查到订单号为xx的包裹的物流信息,最后将“订单号为xx的包裹当前的配送进度为xxx;预计送达时间为xxxx”的反馈信息通过物流客服问答界面反馈给客户端。
在另一种教务系统的人机问答场景中,参照图4,其示出了本申请实施例提供的另一种应用场景的界面图,在教务系统的人机问答场景中,客户端可以在服务端提供的教务系统问答界面查询教务信息,并得到服务端的查询结果。具体的,服务端的教务信息数据库中可以存储学生姓名、班级、学号等教务信息,在客户端发送“查一下姓名为xx的学生的班级和学号”的自然语句时,服务端可以通过查询模块的目标语言转换模型,将该自然语句转换为SQL,并通过转换的SQL在教务信息数据库中查到姓名为xx的学生的教务信息,最后将“姓名为xx的学生的班级为xxx,学号为xxxx”的反馈信息通过教务系统问答界面反馈给客户端。
在另一种智能语音设备的控制场景中,参照图5,其示出了本申请实施例提供的另一种应用场景的界面图,在智能语音设备的控制中,客户端可以在服务端提供的智能语音设备控制界面中发出针对智能设备的语音控制命令,并得到服务端反馈的执行结果。具体的,服务端的设备指令数据库中可以存储各个设备针对不同操作的控制指令,在客户端发起“控制设备xx执行操作1”的语音控制命令时,可以将该语音控制命令先转换为自然语句,服务端可以通过查询模块的目标语言转换模型,将该自然语句转换为SQL,并通过转换的SQL在设备指令数据库中查到设备xx的针对操作1的控制指令,并根据该控制指令控制对应的智能设备执行操作1,最后将“设备xx正在执行操作1中”的反馈信息通过智能语音设备控制界面反馈给客户端。
本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图6,其示出了本申请实施例提供的一种语言转换模型的训练方法的步骤流程图,包括:
步骤101,获取数据表中的数据元素。
在本申请实施例中,数据表是SQL数据库中的数据表,用于存储数据,数据存入数据库的对应数据表后,即完成了待存储数据的永久化,此后可以通过访问查询数据库的数据表,来获取数据的数据内容。
数据元素也称作数据表的模式,指数据表中的表名、列名、值等信息,本申请实施例可以提取数据表中的数据元素来构建训练数据。
步骤102,生成用于查询所述数据元素的结构化查询语句样本和自然语句样本,所述自然语句样本中的词语与所述数据表中的数据元素之间具有映射关系。
本申请实施例可以基于机器学习和深度学习的技术理论,批量自动化的生成高质量的训练数据,且降低人工标注的参与,具体的,在从数据表的表头、列名、值中提取数据元素作为数据表的模式后,可以进一步基于预设的结构化查询语句生成规则,基于数据元素生成多条SQL样本,在得到多条SQL样本后,可以将SQL样本输入基于语料训练得到的深度学习模型,通过深度学习模型将SQL样本转换为对应的自然语句样本,从而自动化、批量的得到大量高质量自然语句样本。
步骤103,基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,得到目标语言转换模型,所述目标语言转换模型用于将自然语句转换为针对所述数据表的结构化查询语句。
根据对实际Table QA场景下数据表和用户的自然语句的分析,可以得到Table QA场景下数据表的数据元素与自然语句中的词语之间具有强关联的特性,如,教务系统数据表的数据元素姓名可以与自然语句中人的各种名称之间存在强关联;教务系统数据表的数据元素生理区别可以与自然语句中男性、女性词语之间存在强关联;本申请实施例可以基于这种特性构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
综上所述,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图7,其示出了本申请实施例提供的一种数据查询方法的步骤流程图,包括:
步骤201,获取自然查询语句。
步骤202,将所述自然查询语句输入目标语言转换模型,得到针对数据表的结构化查询语句。
步骤203,根据所述结构化查询语句,在所述数据表中获取对应的数据内容。
参照图1,在训练得到目标语言转换模型后,即可将目标语言转换模型应用在具体的Table QA场景中,此时客户端可以根据服务端提供的人机交互界面,在其中输入自然语句,服务端的查询模块可以将自然语句输入目标语言转换模型中转换为对应的SQL,并利用转换后的SQL在数据库中查找对应的查询结果,将查询结果提供人机交互界面反馈给客户端,从而完成人机对答。具体的,数据查询的场景应用过程可以参照图3-5的相关描述,此次不做赘述。
综上所述,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图8,示出了本申请的另一种语言转换模型的训练方法实施例的步骤流程图。包括:
步骤301,获取数据表中的数据元素。
该步骤具体可以参照上述步骤101,此处不再赘述。
步骤302,根据所述数据元素和预设的结构化查询语句生成规则,生成结构化查询语句样本。
在本申请实施例中,SQL具有相应的SQL生成规则,SQL生成规则定义了SQL的句式模板,通过将数据元素插入SQL的句式模板中的相应位置,可以生成一个SQL。
例如,SQL语法候选集中的一个SQL句式模板为:
SQL=SELECT|SELECTWHERE|SELECTORDER;
其中,上述三个部分构成树形结构,即SELECT部分为SELECTWHERE部分的父节点,SELECTWHERE部分为SELECTORDER部分的父节点;SELECT表示查询动作;SELECTWHERE表示查询的对象;SELECTWHERE表示查询的次序。
具体的,SELECTWHERE部分的WHERE= WHERE CONDITIONS,WHERE CONDITIONS用于表示查询对象的条件;
WHERE CONDITIONS部分的CONDITIONS= A op VALUE,A用于表示查询所需的计算函数,op为比较运算符,具有‘==’|‘!=’|‘>=’|‘<=’等形式,VALUE用于表示比较的值。
A= C | MIN C | MAX C | AVG C | COUNT C;C为数据表的数据元素,MIN、MAX、AVG、COUNT为不同的计算函数。
假设数据库为教务信息数据库,提取的数据元素为姓名、身高、体重、岁数,则基于上述SQL生成规则,将数据元素随机填充至SQL句式模板,可以得到的SQL样本包括:
SELECT MAX(身高)FROM学生 WHERE(岁数>10)//表征查询岁数大于10岁且身高最高的学生的身高;
SELECT MIN(岁数)FROM学生 WHERE(身高>175)//表征查询岁数最小且身高大于175的学生的岁数;
SELECT(姓名)FROM学生 WHERE(身高>175)//表征查询身高大于175的学生的姓名;
步骤303,基于深度学习模型,将所述结构化查询语句样本转换为自然语句样本。
在得到多条SQL样本后,可以将SQL样本输入基于语料训练得到的深度学习模型,通过深度学习模型将SQL样本转换为对应的自然语句样本,从而自动化、批量的得到大量高质量自然语句样本,从而基于数据元素—SQL样本—自然语句样本的对应关系,构建多条训练数据,整个训练数据生成过程降低了人工参与度,提高了生成效率和质量。其中,深度学习模型可以为seq2seq模型,该模型包括编码器和解码器,是在输出长度不确定的场景中优选采用的模型,输出长度不确定的场景在机器翻译的任务中经常出现,因此该模型适用于本申请实施例将SQL语言转换为自然语言的场景,可以将SQL样本转换为自然语句样本。
步骤304,基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,得到目标语言转换模型,所述目标语言转换模型用于将自然语句转换为针对所述数据表的结构化查询语句。
该步骤具体可以参照步骤103,此处不再赘述。
可选的,在一种实现方式中,步骤304具体可以包括:
子步骤3041,基于所述映射关系,通过所述初始语言转换模型确定由所述数据元素、所述自然语句样本中的词语构成的组合与所述映射关系匹配的概率。
在本申请实施例中,通过一个示例对映射关系的建立进行说明,参照图9,其示出了本申请实施例提供的一种数据元素和词语的映射关系示意图,假设在教务信息数据库中提取得到数据元素:姓名、身高、生理区别、学号;则针对自然语句“请告诉我班上最高的男生的身高及学号”,可以得到数据元素身高与词语最高、词语身高的映射关系、数据元素生理区别与词语男生的映射关系以及数据元素学号和词语学号的映射关系。
在将自然语句和数据元素输入初始语言转换模型中进行训练时,初始语言转换模型可以将由数据元素和自然语句样本中的词语一一组合,构成多个组合,并针对每个映射关系,计算每个组合和和映射关系的匹配的概率(文本相似度),如,针对生理区别—男生的映射关系,组合(告诉—姓名)和该映射关系的匹配度为10%,针对生理区别—男生的映射关系,组合(生理区别—姓名)和该映射关系的匹配度为50%;针对生理区别—男生的映射关系,组合(生理区别—男生)和该映射关系的匹配度为90%...
子步骤3042,根据所述概率符合预设条件的目标组合和预设的结构化查询语句生成规则,通过所述初始语言转换模型构建目标结构化查询语句。
在本申请实施例中,可以将针对一个映射关系确定的所有组合的概率中概率最大的组合,确定为针对该映射关系的目标组合,再结合所有目标组合和预设的结构化查询语句生成规则,可以构建一条针对输入的自然语句样本的目标结构化查询语句。
可选的,所述结构化查询语句生成规则包括:结构化查询语句中与所述数据元素对应的关键词;所述子步骤3042具体可以包括:
子步骤A1、根据所述结构化查询语句生成规则,确定所述目标组合在结构化查询语句中对应的关键词。
子步骤A2、根据所述目标组合以及所述目标组合在结构化查询语句中对应的关键词,生成目标结构化查询语句。
在本申请实施例中,针对子步骤3041提供的示例以及图9,在分析映射关系和SQL生成规则定义的SQL句式模板的过程中,可以确定结构化查询语句中与数据元素对应的关键词,如数据元素身高对应SQL句式模板中的SELECT-Mention关键词和SELECT-Agg关键词;数据元素生理区别对应SQL句式模板中的WHERE-Value关键词;数据元素学号对应SQL句式模板中的SELECT-Mentio关键词。
则基于这种对应关系,可以确定数据元素应该在SQL句式中的具体位置,从而根据目标组合以及所述目标组合在结构化查询语句中对应的关键词,生成目标结构化查询语句。
子步骤3043,根据由所述目标结构化查询语句和所述结构化查询语句样本之间的损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述模板语言转换模型。
在该步骤中,目标结构化查询语句可以作为一次训练过程中初始语言转换模型的输出值,将该输出值与作为标定值的结构化查询语句样本进行损失值计算,可以得到该次训练的损失值,基于损失值确定的损失函数,可以对初始语言转换模型的参数进行训练,从而多轮训练操作结束满足训练目标后,得到目标语言转换模型。本申请实施例对损失函数的选取不做限定。
本申请实施例通过基于显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
可选的,在另一种实现方式中,步骤304具体可以包括:
子步骤3044,将所述自然语句样本中的第一词语替换为其他文本,得到第一自然语句样本,所述第一词语为所述自然语句样本中的任一词语。
子步骤3045,将所述第一自然语句样本和所述数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的与所述第一词语对应的第二词语,以及目标结构化查询语句。
子步骤3046,根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一词语和所述第二词语之间的第二损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述模板语言转换模型。
针对上述子步骤3044-3046,本申请实施例还提供了一种词级别的自监督训练任务,具体可以将训练过程中语言输入初始语言转换模型的自然语句样本中的第一词语替换为其他文本,得到第一自然语句样本,并将第一自然语句样本和数据元素输入初始语言转换模型,初始语言转换模型除了输出目标结构化查询语句之外,还可以输出与第一词语对应的第二词语,即初始语言转换模型根据上下文信息输出的第二词语可以作为恢复后的第一词语。
最后,目标结构化查询语句可以作为一次训练过程中初始语言转换模型的输出值,与作为标定值的结构化查询语句样本进行第一损失值计算,以及将第二词语作为一次训练过程中初始语言转换模型的输出值,与作为标定值的第一词语进行第二损失值计算,基于第一损失值和第二损失值确定的损失函数,可以对初始语言转换模型的参数进行训练,从而多轮训练操作结束满足训练目标后,得到目标语言转换模型。
具体的,参照图10,其示出了本申请实施例提供的一种词级别的自监督训练示意图,针对自然语句样本“请告诉我班上最高的男生的身高及学号”,本申请实施例可以将其中的词语“班”替换为空值进行遮蔽,并将数据元素和遮蔽了“班”后的自然语句样本输入初始语言转换模型,其训练目标是初始语言转换模型能够恢复遮蔽为空值的词语“班”。需要说明的是,本申请实施例也可以不将词语“班”替换为空值,而是将其替换为不同的另一个词,本申请实施例对此不做限定。
可选的,在另一种实现方式中,步骤304具体可以包括:
子步骤3047,将多个所述数据元素中的第一数据元素替换为其他文本,所述第一数据元素为所述数据元素中的任一数据元素。
子步骤3048,将所述自然语句样本和执行了替换操作的多个数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的与所述第一数据元素对应的第二数据元素,以及目标结构化查询语句。
子步骤3049,根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一数据元素和所述第二数据元素之间的第三损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述模板语言转换模型。
针对上述子步骤3047-3049,本申请实施例还提供了另一种词级别的自监督训练任务,具体可以将训练过程中语言输入初始语言转换模型的多个所述数据元素中的第一数据元素替换为其他文本,并将自然语句样本和执行了替换操作的数据元素输入初始语言转换模型,初始语言转换模型除了输出目标结构化查询语句之外,还可以输出与第一数据元素对应的第二数据元素,即初始语言转换模型根据上下文信息输出的第二数据元素可以作为恢复后的第一数据元素。
最后,目标结构化查询语句可以作为一次训练过程中初始语言转换模型的输出值,与作为标定值的结构化查询语句样本进行第一损失值计算,以及将第二数据元素作为一次训练过程中初始语言转换模型的输出值,与作为标定值的第一数据元素进行第三损失值计算,基于第一损失值和第三损失值确定的损失函数,可以对初始语言转换模型的参数进行训练,从而多轮训练操作结束满足训练目标后,得到目标语言转换模型。需要说明的是,本申请实施例也可以将数据元素替换为空值,本申请实施例对此不做限定。
具体的,参照图10,针对数据元素:“姓名、身高、生理区别、学号,本申请实施例可以将其中的数据元素姓名替换为具体值丹尼,并将自然语句样本和执行了替换操作后的多个数据元素输入初始语言转换模型,其训练目标是初始语言转换模型能够恢复数据元素姓名。
需要说明的是,上述子步骤3044-3046和上述子步骤3047-3049描述的两种词级别的自监督任务也可以同时进行,即既对自然语句样本中的词语进行替换,也对数据元素进行替换,从而通过训练使得语言转换模型可以恢复替换项,从而进一步提升模型的性能,提高模型的鲁棒性。
可选的,在另一种实现方式中,步骤304具体可以包括:
子步骤30410,将所述自然语句样本中第三词语的词序由第一词序调整为第二词序,得到第二自然语句样本,所述第三词语为所述映射关系中的词语。
子步骤30411,将所述第二自然语句样本和所述数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的第三词语的第三语序,以及目标结构化查询语句。
子步骤30412,根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一语序和所述第三语序之间的第四损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述模板语言转换模型。
针对上述子步骤30410-30412,本申请实施例还提供了一种基于模式知识的自然语句扰动任务,具体可以将训练过程中语言输入初始语言转换模型的自然语句样本中的存在于映射关系中的词语的词序进行打乱,并将打乱后的自然语句样本和数据元素输入初始语言转换模型,初始语言转换模型除了输出目标结构化查询语句之外,还可以输出自然语句样本中的词语恢复后的词序,即初始语言转换模型在作为模式的数据元素存在的情况下,能够训练其找到合适的词语词序表征,从而进一步提升模型的性能,提高模型的鲁棒性。
具体的,参照图11,其示出了本申请实施例提供的一种基于模式知识的自然语句扰动训练示意图,针对自然语句样本“请告诉我班上最高的男生的身高及学号”,本申请实施例可以将其中存在于映射关系中的词语的词序打乱,得到“请告诉我班上身高的学号的最高以及男生”并将数据元素和打乱后的自然语句样本输入初始语言转换模型,其训练目标是初始语言转换模型能够输出打乱的词语的正确词序:最高、男生、身高、学号。
可选的,在另一种实现方式中,步骤304具体可以包括:
子步骤30413,获取由一条自然语句样本和一条结构化查询语句样本构成的训练数据所对应的数据难易度。
子步骤30414,按照所述数据难易度由小到大的顺序将所述训练数据依次输入所述初始语言转换模型,并基于所述映射关系对所述初始语言转换模型进行训练。
可选的,所述数据难易度与所述训练数据的文本总长度成正比例关系。
在本申请实施例中,由于不同的训练数据存在不同的数据噪声,且数据噪声和数据难易度、数据的文本长度之间成正比例关系,因此,本申请实施例可以通过与训练数据的文本总长度成正比例关系的数据难易度对训练数据的难易程度进行量化。
具体的,模型的训练过程类似于人的学习过程,人的学习过程是由简单到复杂,从干净到冗余的过程,通过类比这种学习方式,对语言转换模型的训练也可以采用先学习较易的数据再学习较难的数据的方式,从而按照所述数据难易度由小到大的顺序将所述训练数据依次输入所述初始语言转换模型,并基于所述映射关系对所述初始语言转换模型进行训练,从而降低数据噪声带来的干扰,并且这种合适的训练方式有助于降低训练过程中出现过拟合和欠拟合的现象发生的几率。
例如,三条训练数据,各自的数据难易度分别为难、普通、简单,则可以先输入简单的训练数据进行训练,再输入普通的训练数据进行训练,最后输入难的训练数据进行训练。
可选的,子步骤30414具体可以包括:
子步骤B1,根据所述初始语言转换模型当前的训练步长,确定所述训练数据针对所述初始语言转换模型的模型接受度。
可选的,所述模型接受度与所述初始语言转换模型当前的训练步长、所述初始语言转换模型的最大训练步长、所述训练数据的数据难易度成比例关系。
针对训练数据的数据难易度d,可以基于其与训练数据的文本总长度成正比例关系的特性,确定数据难易度d=|I|,I表示一条训练数据的文本总长度,因此可以看到,输入的自然语句样本和数据元素的文本总长度越大,该训练数据的数据难易度就越高。
本申请实施例在通过数据难易度对训练数据的难易程度进行量化的基础上,还可以通过与初始语言转换模型当前的训练步长、初始语言转换模型的最大训练步长、训练数据的数据难易度成比例关系的模型接受度,对模型对训练数据的接受程度进行量化。
具体的,模型的模型接受度
Figure 666816DEST_PATH_IMAGE002
;其中,d为训练数据的数据难易度,t为当前训练的步数,T为最大训练步数。
子步骤B2,在所述训练数据的数据难易度小于或等于所述训练数据的模型接受度的情况下,根据所述训练数据和所述映射关系对所述初始语言转换模型进行训练。
在该步骤中,在训练数据的数据难易度小于或等于训练数据的模型接受度的情况下,可以认为此次输入的训练数据的数据难易度合适,能够被初始语言转换模型所接受,则可以根据所述训练数据和映射关系对初始语言转换模型进行训练。
子步骤B3,在所述训练数据的数据难易度大于所述训练数据的模型接受度的情况下,根据其他训练数据和所述映射关系对所述初始语言转换模型进行训练,所述其他训练数据的数据难易度小于或等于所述其他训练数据的模型接受度。
在该步骤中,在训练数据的数据难易度小于或等于训练数据的模型接受度的情况下,可以认为此次输入的训练数据的数据难易度较高,不能够被初始语言转换模型所接受,则可以将该训练数据放回训练数据库,并遍历其他训练数据,直至遍历到数据难易度小于或等于所述其他训练数据的模型接受度的其他训练数据。
综上所述,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图12,其示出了本申请实施例提供的一种物流数据查询方法的步骤流程图,包括:
步骤601、获取物流数据表中的物流信息元素。
步骤602、生成用于查询所述物流信息元素的物流结构化查询语句样本和物流自然语句样本,所述物流自然语句样本中的词语与所述物流数据表中的物流信息元素之间具有映射关系。
步骤603、基于所述物流信息元素、所述物流自然语句样本、所述物流结构化查询语句样本和所述映射关系,对初始物流语言转换模型进行训练,得到目标物流语言转换模型。
步骤604、在获取到物流自然语句的情况下,将所述物流自然语句输入目标物流语言转换模型,得到针对物流数据表的物流结构化查询语句,并根据所述物流结构化查询语句,在所述物流数据表中获取对应的物流信息内容。
其中,在物流场景下,目标物流语言转换模型可以是基于物流数据表中的物流信息元素生成的物流结构化查询语句样本、物流自然语句样本以及物流自然语句样本中的词语与所述物流数据表中的物流信息元素之间具有映射关系所训练得到的模型,步骤601-604基于目标物流语言转换模型的具体应用描述可以参照上述实施例图3的相关描述,此处不再赘述。
综上所述,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图13,其示出了本申请实施例提供的一种智能语音设备控制方法的步骤流程图,包括:
步骤701、获取设备指令数据表中的指令信息元素。
步骤702、生成用于查询所述指令信息元素的控制结构化查询语句样本和自然控制语句样本,所述自然控制语句样本中的词语与所述设备指令数据表中的指令信息元素之间具有映射关系。
步骤703、基于所述指令信息元素、所述自然控制语句样本、所述控制结构化查询语句样本和所述映射关系,对初始指令语言转换模型进行训练,得到目标指令语言转换模型。
步骤704、在获取到自然控制语句的情况下,将所述自然控制语句输入目标指令语言转换模型,得到控制结构化查询语句,根据所述控制结构化查询语句在所述物流数据表中获取对应的指令信息内容,并根据所述指令信息内容控制智能设备。
其中,在智能设备控制场景下,目标控制语言转换模型可以是基于设备指令数据表中的指令信息元素生成的控制结构化查询语句样本、自然控制语句样本,以及自然控制语句样本中的词语与所述设备指令数据表中的指令信息元素之间具有映射关系所训练得到的模型,步骤701-704基于目标物流语言转换模型的具体应用描述可以参照上述实施例图5的相关描述,此处不再赘述。
综上所述,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图14,其示出了本申请实施例提供的一种语言转换模型的训练装置的框图,包括:
第一获取模块401,用于获取数据表中的数据元素;
生成模块402,用于生成用于查询所述数据元素的结构化查询语句样本和自然语句样本,所述自然语句样本中的词语与所述数据表中的数据元素之间具有映射关系;
训练模块403,用于基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,得到目标语言转换模型,所述目标语言转换模型用于将自然语句转换为针对所述数据表的结构化查询语句。
可选的,所述生成模块402,包括:
生成子模块,用于根据所述数据元素和预设的结构化查询语句生成规则,生成结构化查询语句样本;
转换子模块,用于基于深度学习模型,将所述结构化查询语句样本转换为自然语句样本。
可选的,所述训练模块403,包括:
计算子模块,用于基于所述映射关系,通过所述初始语言转换模型确定由所述数据元素、所述自然语句样本中的词语构成的组合与所述映射关系匹配的概率;
构建子模块,用于根据所述概率符合预设条件的目标组合和预设的结构化查询语句生成规则,通过所述初始语言转换模型构建目标结构化查询语句;
第一训练子模块,用于根据由所述目标结构化查询语句和所述结构化查询语句样本之间的损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述模板语言转换模型。
可选的,所述结构化查询语句生成规则包括:结构化查询语句中与所述数据元素对应的关键词;
所述构建子模块,包括:
确定单元,用于根据所述结构化查询语句生成规则,确定所述目标组合在结构化查询语句中对应的关键词;
生成单元,用于根据所述目标组合以及所述目标组合在结构化查询语句中对应的关键词,生成目标结构化查询语句。
可选的,所述训练模块403,包括:
第一替换子模块,用于将所述自然语句样本中的第一词语替换为其他文本,得到第一自然语句样本,所述第一词语为所述自然语句样本中的任一词语;
第一输出子模块,用于将所述第一自然语句样本和所述数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的与所述第一词语对应的第二词语,以及目标结构化查询语句;
第二训练子模块,用于根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一词语和所述第二词语之间的第二损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述模板语言转换模型。
可选的,所述训练模块403,包括:
第二替换子模块,用于将多个所述数据元素中的第一数据元素替换为其他文本,所述第一数据元素为所述数据元素中的任一数据元素;
第二输出子模块,用于将所述自然语句样本和执行了替换操作的多个数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的与所述第一数据元素对应的第二数据元素,以及目标结构化查询语句;
第三训练子模块,用于根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一数据元素和所述第二数据元素之间的第三损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述模板语言转换模型。
可选的,所述训练模块403,包括:
调整子模块,用于将所述自然语句样本中第三词语的词序由第一词序调整为第二词序,得到第二自然语句样本,所述第三词语为所述映射关系中的词语;
第三输出子模块,用于将所述第二自然语句样本和所述数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的第三词语的第三语序,以及目标结构化查询语句;
第四训练子模块,用于根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一语序和所述第三语序之间的第四损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述模板语言转换模型。
可选的,所述训练模块403,包括:
难易度子模块,用于获取由一条自然语句样本和一条结构化查询语句样本构成的训练数据所对应的数据难易度;
排序子模块,用于按照所述数据难易度由小到大的顺序将所述训练数据依次输入所述初始语言转换模型,并基于所述映射关系对所述初始语言转换模型进行训练。
可选的,所述排序子模块,包括:
接受度单元,用于根据所述初始语言转换模型当前的训练步长,确定所述训练数据针对所述初始语言转换模型的模型接受度;
第一处理单元,用于在所述训练数据的数据难易度小于或等于所述训练数据的模型接受度的情况下,根据所述训练数据和所述映射关系对所述初始语言转换模型进行训练;
第二处理单元,用于在所述训练数据的数据难易度大于所述训练数据的模型接受度的情况下,根据其他训练数据和所述映射关系对所述初始语言转换模型进行训练,所述其他训练数据的数据难易度小于或等于所述其他训练数据的模型接受度。
可选的,所述数据难易度与所述训练数据的文本总长度成正比例关系。
可选的,所述模型接受度与所述初始语言转换模型当前的训练步长、所述初始语言转换模型的最大训练步长、所述训练数据的数据难易度成比例关系。
综上,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图15,其示出了本申请实施例提供的一种数据查询装置的框图,包括:
第二获取模块501,用于获取自然查询语句;
转换模块502,用于将所述自然查询语句输入目标语言转换模型,得到针对数据表的结构化查询语句;
查询模块503,用于根据所述结构化查询语句,在所述数据表中获取对应的数据内容;
其中,所述目标语言转换模型是基于所述的语言转换模型的训练装置所训练得到的。
综上,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图16,其示出了本申请实施例提供的一种物流数据查询装置的框图,包括:
第三获取模块801,用于获取物流数据表中的物流信息元素;
物流样本生成模块802,用于生成用于查询所述物流信息元素的物流结构化查询语句样本和物流自然语句样本,所述物流自然语句样本中的词语与所述物流数据表中的物流信息元素之间具有映射关系;
物流训练模块803,用于基于所述物流信息元素、所述物流自然语句样本、所述物流结构化查询语句样本和所述映射关系,对初始物流语言转换模型进行训练,得到目标物流语言转换模型;
物流查询模块804,用于在获取到物流自然语句的情况下,将所述物流自然语句输入目标物流语言转换模型,得到针对物流数据表的物流结构化查询语句,并根据所述物流结构化查询语句,在所述物流数据表中获取对应的物流信息内容。
综上,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
参照图17,其示出了本申请实施例提供的一种智能语音设备控制装置的框图,包括:
第四获取模块901,用于获取设备指令数据表中的指令信息元素;
控制样本生成模块902,用于生成用于查询所述指令信息元素的控制结构化查询语句样本和自然控制语句样本,所述自然控制语句样本中的词语与所述设备指令数据表中的指令信息元素之间具有映射关系;
控制训练模块903,用于基于所述指令信息元素、所述自然控制语句样本、所述控制结构化查询语句样本和所述映射关系,对初始指令语言转换模型进行训练,得到目标指令语言转换模型;
控制模块904,用于在获取到自然控制语句的情况下,将所述自然控制语句输入目标指令语言转换模型,得到控制结构化查询语句,根据所述控制结构化查询语句在所述物流数据表中获取对应的指令信息内容,并根据所述指令信息内容控制智能设备。
综上,本申请实施例中,可以根据从数据表中提取的数据元素,自动化的得到大量高质量的结构化查询语句样本和自然语句样本,从而构建训练数据,整个训练数据生成过程降低了人工参与度,提高了训练数据的生成效率和质量。另外,针对数据表的数据元素与自然语句中的词语之间具有强关联的特性,本申请实施例可以构建数据表的数据元素与自然语句中的词语之间的映射关系,并基于该显性的映射关系进行语言转换模型的训练,从而使得训练过程中可以有效挖掘数据表知识与自然语句之间潜在的关联,有效提升语言转换模型的性能。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。
本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中,所述电子设备包括终端设备、服务端(集群)等各类型的设备。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括终端设备、服务端(集群)等电子设备。图18示意性地示出了可被用于实现本申请实施例中所述的各个实施例的示例性装置1000 。
对于一个实施例,图18示出了示例性装置1000,该装置具有一个或多个处理器1002、被耦合到(一个或多个)处理器1002中的至少一个的控制模块(芯片组)1004、被耦合到控制模块1004的存储器1006、被耦合到控制模块1004的非易失性存储器(NVM)/存储设备1008、被耦合到控制模块1004的一个或多个输入/输出设备1010,以及被耦合到控制模块1004的网络接口1012。
处理器1002可包括一个或多个单核或多核处理器,处理器1002可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1000 能够作为本申请实施例中所述终端设备、服务端(集群)等设备。
在一些实施例中,装置1000 可包括具有指令1014的一个或多个计算机可读介质(例如,存储器1006或NVM/ 存储设备1008) 以及与该一个或多个计算机可读介质相合并被配置为执行指令1014以实现模块从而执行本公开中所述的动作的一个或多个处理器1002。
对于一个实施例,控制模块1004可包括任意适当的接口控制器,以向(一个或多个)处理器1002中的至少一个和/或与控制模块1004通信的任意适当的设备或组件提供任意适当的接口。
控制模块1004可包括存储器控制器模块,以向存储器1006提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器1006可被用于例如为装置1000加载和存储数据和/或指令1014。对于一个实施例,存储器1006可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器1006可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM) 。
对于一个实施例,控制模块1004可包括一个或多个输入/输出控制器,以向NVM/存储设备1008及(一个或多个)输入/输出设备1010 提供接口。
例如,NVM/存储设备1008可被用于存储数据和/或指令1014。NVM/存储设备1008可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD) 、一个或多个光盘(CD) 驱动器和/或一个或多个数字通用光盘(DVD) 驱动器)。
NVM/存储设备1008可包括在物理上作为装置1000 被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如, NVM/存储设备1008可通过网络经由(一个或多个)输入/输出设备1010 进行访问。
(一个或多个)输入/输出设备1010 可为装置1000 提供接口以与任意其他适当的设备通信,输入/输出设备1010可以包括通信组件、音频组件、传感器组件等。网络接口1012可为装置1000 提供接口以通过一个或多个网络通信,装置1000 可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器1002中的至少一个可与控制模块1004的一个或多个控制器(例如,存储器控制器模块) 的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1002中的至少一个可与控制模块1004的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP) 。对于一个实施例, (一个或多个)处理器1002中的至少一个可与控制模块1004的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例, (一个或多个)处理器1002中的至少一个可与控制模块1004的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC) 。
在各个实施例中,装置1000可以但不限于是:服务端、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1000 可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1000包括一个或多个摄像机、键盘、液晶显示器(LCD) 屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC) 和扬声器。
其中,检测装置中可采用主控芯片作为处理器或控制模块,传感器数据、位置信息等存储到存储器或NVM/存储设备中,传感器组可作为输入/输出设备,通信接口可包括网络接口。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种语言转换模型的训练方法及装置、数据查询方法及装置、物流数据查询方法及装置、智能语音设备控制方法及装置、电子设备、机器可读介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (15)

1.一种语言转换模型的训练方法,其特征在于,包括:
获取数据表中的数据元素;
生成用于查询所述数据元素的结构化查询语句样本和自然语句样本,所述自然语句样本中的词语与所述数据表中的数据元素之间具有映射关系;
基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,得到目标语言转换模型,所述目标语言转换模型用于将自然语句转换为针对所述数据表的结构化查询语句,所述基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,具体包括:
将所述自然语句样本中第三词语的词序由第一词序调整为第二词序,得到第二自然语句样本,所述第三词语为所述映射关系中的词语;将所述第二自然语句样本和所述数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的第三词语的第三词序,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一词序和所述第三词序之间的第四损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述目标语言转换模型;
或,将所述自然语句样本中的第一词语替换为其他文本,得到第一自然语句样本,所述第一词语为所述自然语句样本中的任一词语;将所述第一自然语句样本和所述数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的与所述第一词语对应的第二词语,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一词语和所述第二词语之间的第二损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述目标语言转换模型;
或,将多个所述数据元素中的第一数据元素替换为其他文本,所述第一数据元素为所述数据元素中的任一数据元素;将所述自然语句样本和执行了替换操作的多个数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的与所述第一数据元素对应的第二数据元素,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一数据元素和所述第二数据元素之间的第三损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述目标语言转换模型。
2.根据权利要求1所述的方法,其特征在于,所述生成用于查询所述数据元素的结构化查询语句样本和自然语句样本,包括:
根据所述数据元素和预设的结构化查询语句生成规则,生成结构化查询语句样本;
基于深度学习模型,将所述结构化查询语句样本转换为自然语句样本。
3.根据权利要求1所述的方法,其特征在于,所述基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,得到目标语言转换模型,包括:
基于所述映射关系,通过所述初始语言转换模型确定由所述数据元素、所述自然语句样本中的词语构成的组合与所述映射关系匹配的概率;
根据所述概率符合预设条件的目标组合和预设的结构化查询语句生成规则,通过所述初始语言转换模型构建目标结构化查询语句;
根据由所述目标结构化查询语句和所述结构化查询语句样本之间的损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述目标语言转换模型。
4.根据权利要求3所述的方法,其特征在于,所述结构化查询语句生成规则包括:结构化查询语句中与所述数据元素对应的关键词;
所述根据所述概率符合预设条件的目标组合和预设的结构化查询语句生成规则,通过所述初始语言转换模型构建目标结构化查询语句,包括:
根据所述结构化查询语句生成规则,确定所述目标组合在结构化查询语句中对应的关键词;
根据所述目标组合以及所述目标组合在结构化查询语句中对应的关键词,生成目标结构化查询语句。
5.根据权利要求1所述的方法,其特征在于,所述基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,包括:
获取由一条自然语句样本和一条结构化查询语句样本构成的训练数据所对应的数据难易度;
按照所述数据难易度由小到大的顺序将所述训练数据依次输入所述初始语言转换模型,并基于所述映射关系对所述初始语言转换模型进行训练。
6.根据权利要求5所述的方法,其特征在于,所述按照所述数据难易度由小到大的顺序将所述训练数据依次输入所述初始语言转换模型,并基于所述映射关系对所述初始语言转换模型进行训练,包括:
根据所述初始语言转换模型当前的训练步长,确定所述训练数据针对所述初始语言转换模型的模型接受度;
在所述训练数据的数据难易度小于或等于所述训练数据的模型接受度的情况下,根据所述训练数据和所述映射关系对所述初始语言转换模型进行训练;
在所述训练数据的数据难易度大于所述训练数据的模型接受度的情况下,根据其他训练数据和所述映射关系对所述初始语言转换模型进行训练,所述其他训练数据的数据难易度小于或等于所述其他训练数据的模型接受度。
7.根据权利要求5或6所述的方法,其特征在于,所述数据难易度与所述训练数据的文本总长度成正比例关系。
8.根据权利要求6所述的方法,其特征在于,所述模型接受度与所述初始语言转换模型当前的训练步长、所述初始语言转换模型的最大训练步长、所述训练数据的数据难易度成比例关系。
9.一种数据查询方法,其特征在于,包括:
获取自然查询语句;
将所述自然查询语句输入目标语言转换模型,得到针对数据表的结构化查询语句;
根据所述结构化查询语句,在所述数据表中获取对应的数据内容;
其中,所述目标语言转换模型是基于如权利要求1-8任一项所述的语言转换模型的训练方法所训练得到的。
10.一种物流数据查询方法,其特征在于,包括:
获取物流数据表中的物流信息元素;
生成用于查询所述物流信息元素的物流结构化查询语句样本和物流自然语句样本,所述物流自然语句样本中的词语与所述物流数据表中的物流信息元素之间具有映射关系;
基于所述物流信息元素、所述物流自然语句样本、所述物流结构化查询语句样本和所述映射关系,对初始物流语言转换模型进行训练,得到目标物流语言转换模型;
在获取到物流自然语句的情况下,将所述物流自然语句输入目标物流语言转换模型,得到针对物流数据表的物流结构化查询语句,并根据所述物流结构化查询语句,在所述物流数据表中获取对应的物流信息内容;
其中,所述基于所述物流信息元素、所述物流自然语句样本、所述物流结构化查询语句样本和所述映射关系,对初始物流语言转换模型进行训练,得到目标物流语言转换模型,具体包括:
将所述物流自然语句样本中第三词语的词序由第一词序调整为第二词序,得到第二自然语句样本,所述第三词语为所述映射关系中的词语;将所述第二自然语句样本和所述物流数据元素输入所述初始物流语言转换模型,得到所述物流初始语言转换模型基于所述映射关系输出的第三词语的第三词序,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述物流结构化查询语句样本之间的第一损失值,以及所述第一词序和所述第三词序之间的第四损失值确定的损失函数,对所述初始物流语言转换模型进行训练,得到所述目标物流语言转换模型;
或,将所述物流自然语句样本中的第一词语替换为其他文本,得到第一物流自然语句样本,所述第一词语为所述物流自然语句样本中的任一词语;将所述第一物流自然语句样本和所述物流数据元素输入所述初始物流语言转换模型,得到所述初始物流语言转换模型基于所述映射关系输出的与所述第一词语对应的第二词语,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述物流结构化查询语句样本之间的第一损失值,以及所述第一词语和所述第二词语之间的第二损失值确定的损失函数,对所述初始物流语言转换模型进行训练,得到所述目标物流语言转换模型;
或,将多个所述物流数据元素中的第一物流数据元素替换为其他文本,所述第一物流数据元素为所述物流数据元素中的任一物流数据元素;将所述物流自然语句样本和执行了替换操作的多个物流数据元素输入所述初始物流语言转换模型,得到所述初始物流语言转换模型基于所述映射关系输出的与所述第一物流数据元素对应的第二物流数据元素,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述物流结构化查询语句样本之间的第一损失值,以及所述第一物流数据元素和所述第二物流数据元素之间的第三损失值确定的损失函数,对所述初始物流语言转换模型进行训练,得到所述目标物流语言转换模型。
11.一种智能语音设备控制方法,其特征在于,包括:
获取设备指令数据表中的指令信息元素;
生成用于查询所述指令信息元素的控制结构化查询语句样本和自然控制语句样本,所述自然控制语句样本中的词语与所述设备指令数据表中的指令信息元素之间具有映射关系;
基于所述指令信息元素、所述自然控制语句样本、所述控制结构化查询语句样本和所述映射关系,对初始指令语言转换模型进行训练,得到目标指令语言转换模型;
在获取到自然控制语句的情况下,将所述自然控制语句输入目标指令语言转换模型,得到控制结构化查询语句,根据所述控制结构化查询语句在所述设备指令数据表中获取对应的指令信息内容,并根据所述指令信息内容控制智能设备;
其中,所述基于所述指令信息元素、所述自然控制语句样本、所述控制结构化查询语句样本和所述映射关系,对初始指令语言转换模型进行训练,得到目标指令语言转换模型,具体包括:
将所述自然控制语句样本中第三词语的词序由第一词序调整为第二词序,得到第二自然控制语句样本,所述第三词语为所述映射关系中的词语;将所述第二自然控制语句样本和所述指令信息元素输入所述初始指令语言转换模型,得到所述初始指令语言转换模型基于所述映射关系输出的第三词语的第三词序,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述控制结构化查询语句样本之间的第一损失值,以及所述第一词序和所述第三词序之间的第四损失值确定的损失函数,对所述初始指令语言转换模型进行训练,得到所述目标指令语言转换模型;
或,将所述自然控制语句样本中的第一词语替换为其他文本,得到第一自然控制语句样本,所述第一词语为所述自然控制语句样本中的任一词语;将所述第一自然控制语句样本和所述指令信息元素输入所述初始指令语言转换模型,得到所述初始指令语言转换模型基于所述映射关系输出的与所述第一词语对应的第二词语,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述控制结构化查询语句样本之间的第一损失值,以及所述第一词语和所述第二词语之间的第二损失值确定的损失函数,对所述初始指令语言转换模型进行训练,得到所述目标指令语言转换模型;
或,将多个所述指令信息元素中的第一指令信息元素替换为其他文本,所述第一指令信息元素为所述指令信息元素中的任一指令信息元素;将所述自然控制语句样本和执行了替换操作的多个指令信息元素输入所述初始指令语言转换模型,得到所述初始指令语言转换模型基于所述映射关系输出的与所述第一指令信息元素对应的第二指令信息元素,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述控制结构化查询语句样本之间的第一损失值,以及所述第一指令信息元素和所述第二指令信息元素之间的第三损失值确定的损失函数,对所述初始指令语言转换模型进行训练,得到所述目标指令语言转换模型。
12.一种语言转换模型的训练装置,其特征在于,包括:
第一获取模块,用于获取数据表中的数据元素;
生成模块,用于生成用于查询所述数据元素的结构化查询语句样本和自然语句样本,所述自然语句样本中的词语与所述数据表中的数据元素之间具有映射关系;
训练模块,用于基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,得到目标语言转换模型,所述目标语言转换模型用于将自然语句转换为针对所述数据表的结构化查询语句,所述基于所述数据元素、所述自然语句样本、所述结构化查询语句样本和所述映射关系,对初始语言转换模型进行训练,具体包括:
将所述自然语句样本中第三词语的词序由第一词序调整为第二词序,得到第二自然语句样本,所述第三词语为所述映射关系中的词语;将所述第二自然语句样本和所述数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的第三词语的第三词序,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一词序和所述第三词序之间的第四损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述目标语言转换模型;
或,将所述自然语句样本中的第一词语替换为其他文本,得到第一自然语句样本,所述第一词语为所述自然语句样本中的任一词语;将所述第一自然语句样本和所述数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的与所述第一词语对应的第二词语,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一词语和所述第二词语之间的第二损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述目标语言转换模型;
或,将多个所述数据元素中的第一数据元素替换为其他文本,所述第一数据元素为所述数据元素中的任一数据元素;将所述自然语句样本和执行了替换操作的多个数据元素输入所述初始语言转换模型,得到所述初始语言转换模型基于所述映射关系输出的与所述第一数据元素对应的第二数据元素,以及目标结构化查询语句;根据由所述目标结构化查询语句和所述结构化查询语句样本之间的第一损失值,以及所述第一数据元素和所述第二数据元素之间的第三损失值确定的损失函数,对所述初始语言转换模型进行训练,得到所述目标语言转换模型。
13.一种数据查询装置,其特征在于,包括:
第二获取模块,用于获取自然查询语句;
转换模块,用于将所述自然查询语句输入目标语言转换模型,得到针对数据表的结构化查询语句;
查询模块,用于根据所述结构化查询语句,在所述数据表中获取对应的数据内容;
其中,所述目标语言转换模型是基于如权利要求12所述的语言转换模型的训练装置所训练得到的。
14.一种电子设备,其特征在于,包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1至11任一所述的方法。
15.一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如权利要求1至11任一所述的方法。
CN202210120493.7A 2022-02-09 2022-02-09 语言转换模型的训练方法及装置 Active CN114168619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210120493.7A CN114168619B (zh) 2022-02-09 2022-02-09 语言转换模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210120493.7A CN114168619B (zh) 2022-02-09 2022-02-09 语言转换模型的训练方法及装置

Publications (2)

Publication Number Publication Date
CN114168619A CN114168619A (zh) 2022-03-11
CN114168619B true CN114168619B (zh) 2022-05-10

Family

ID=80489658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210120493.7A Active CN114168619B (zh) 2022-02-09 2022-02-09 语言转换模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN114168619B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547086B (zh) * 2022-04-22 2022-07-22 网易(杭州)网络有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN114661963B (zh) * 2022-05-25 2022-09-27 阿里巴巴达摩院(杭州)科技有限公司 模式链接处理方法、装置以及计算机可读存储介质
CN117453717B (zh) * 2023-11-06 2024-07-09 星环信息科技(上海)股份有限公司 一种数据查询语句生成方法、装置、设备及存储介质
CN118246408B (zh) * 2024-05-28 2024-08-27 珠海金山办公软件有限公司 数据生成方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451153A (zh) * 2016-05-31 2017-12-08 北京京东尚科信息技术有限公司 输出结构化查询语句的方法和装置
CN111460838A (zh) * 2020-04-23 2020-07-28 腾讯科技(深圳)有限公司 智能翻译模型的预训练方法、装置和存储介质
CN111813802A (zh) * 2020-09-11 2020-10-23 杭州量之智能科技有限公司 一种基于自然语言生成结构化查询语句的方法
CN112199479A (zh) * 2020-09-15 2021-01-08 北京捷通华声科技股份有限公司 优化语言语义理解模型方法、装置、设备及存储介质
CN112559550A (zh) * 2020-10-30 2021-03-26 北京智源人工智能研究院 基于语义规则和多维模型的多数据源nl2sql系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10430407B2 (en) * 2015-12-02 2019-10-01 International Business Machines Corporation Generating structured queries from natural language text
US10303683B2 (en) * 2016-10-05 2019-05-28 International Business Machines Corporation Translation of natural language questions and requests to a structured query format
CN111177184A (zh) * 2019-12-24 2020-05-19 深圳壹账通智能科技有限公司 基于自然语言的结构化查询语言转换方法、及其相关设备
CN111159220B (zh) * 2019-12-31 2023-06-23 北京百度网讯科技有限公司 用于输出结构化查询语句的方法和装置
CN111522839B (zh) * 2020-04-25 2023-09-01 华中科技大学 一种基于深度学习的自然语言查询方法
US11934403B2 (en) * 2020-05-18 2024-03-19 Salesforce, Inc. Generating training data for natural language search systems
CN112783921A (zh) * 2021-01-26 2021-05-11 中国银联股份有限公司 一种数据库操作方法及装置
CN114020774A (zh) * 2021-11-22 2022-02-08 国家电网有限公司大数据中心 多轮问答语句的处理方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451153A (zh) * 2016-05-31 2017-12-08 北京京东尚科信息技术有限公司 输出结构化查询语句的方法和装置
CN111460838A (zh) * 2020-04-23 2020-07-28 腾讯科技(深圳)有限公司 智能翻译模型的预训练方法、装置和存储介质
CN111813802A (zh) * 2020-09-11 2020-10-23 杭州量之智能科技有限公司 一种基于自然语言生成结构化查询语句的方法
CN112199479A (zh) * 2020-09-15 2021-01-08 北京捷通华声科技股份有限公司 优化语言语义理解模型方法、装置、设备及存储介质
CN112559550A (zh) * 2020-10-30 2021-03-26 北京智源人工智能研究院 基于语义规则和多维模型的多数据源nl2sql系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Weakly Supervised Mapping of Natural Language to SQL through Question Decomposition;Tomer Wolfson 等;《arXiv.org》;20211214;第1-11页 *
数据库汉语自然语言查询技术研究;王代星;《现代计算机》;20160916;第38-42页 *

Also Published As

Publication number Publication date
CN114168619A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
CN114168619B (zh) 语言转换模型的训练方法及装置
WO2021082786A1 (zh) 语义理解模型的训练方法、装置、电子设备及存储介质
US11640515B2 (en) Method and neural network system for human-computer interaction, and user equipment
US20210064821A1 (en) System and method to extract customized information in natural language text
CN111159385B (zh) 一种基于动态知识图谱的无模板通用智能问答方法
US20200327281A1 (en) Word classification based on phonetic features
CN110795945A (zh) 一种语义理解模型训练方法、语义理解方法、装置及存储介质
KR102100951B1 (ko) 기계 독해를 위한 질의응답 데이터 생성 시스템
CN117390497B (zh) 基于大语言模型的类目预测方法、装置和设备
CN112101042A (zh) 文本情绪识别方法、装置、终端设备和存储介质
CN116541493A (zh) 基于意图识别的交互应答方法、装置、设备、存储介质
CN116881470A (zh) 一种生成问答对的方法及装置
Su et al. Answer acquisition for knowledge base question answering systems based on dynamic memory network
CN117251455A (zh) 一种基于大模型的智能报表生成方法及其系统
CN104572632B (zh) 一种确定具有专名译文的词汇的翻译方向的方法
CN117932022A (zh) 一种智能问答方法、装置、电子设备及存储介质
CN110969005A (zh) 一种确定实体语料之间的相似性的方法及装置
CN113705207A (zh) 语法错误识别方法及装置
CN114625759B (zh) 模型训练方法、智能问答方法、设备、介质及程序产品
CN113609873A (zh) 翻译模型训练方法、装置及介质
CN116681088A (zh) 一种基于大模型的翻译系统、方法及储存介质
CN116932694A (zh) 一种针对知识库的智能化检索方法、设备及存储介质
CN117216184A (zh) 评论处理方法、装置、电子设备、存储介质以及程序产品
CN114330285B (zh) 语料处理方法、装置、电子设备及计算机可读存储介质
CN114817510A (zh) 问答方法、问答数据集生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant