CN111651998B - 虚拟现实与增强现实场景下弱监督深度学习语义解析方法 - Google Patents

虚拟现实与增强现实场景下弱监督深度学习语义解析方法 Download PDF

Info

Publication number
CN111651998B
CN111651998B CN202010375881.0A CN202010375881A CN111651998B CN 111651998 B CN111651998 B CN 111651998B CN 202010375881 A CN202010375881 A CN 202010375881A CN 111651998 B CN111651998 B CN 111651998B
Authority
CN
China
Prior art keywords
data
weak
execution result
generated
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010375881.0A
Other languages
English (en)
Other versions
CN111651998A (zh
Inventor
谢德峰
吉建民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202010375881.0A priority Critical patent/CN111651998B/zh
Publication of CN111651998A publication Critical patent/CN111651998A/zh
Application granted granted Critical
Publication of CN111651998B publication Critical patent/CN111651998B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

一种虚拟现实与增强现实场景下弱监督深度学习语义解析方法,包括如下步骤:步骤1:在已有训练数据集合中产生一个一部分数据具备强监督标注信息,另一部分数据只具备弱监督标注信息的数据集,用于接下来的训练;步骤2:采用“结合探索”策略方法,结合该预训练语言模型和人工写的语法规则约束指导神经网络的语义探索,让生成器能够探索生成可能命中目标逻辑语义表示语句;步骤3:用所述解释器解释并执行生成的逻辑语义表示语句,得到执行结果;再根据已有执行结果得到的弱标签,通过对比弱标签和执行结果,得到得分反馈;步骤4:将得分高于阈值的原语句‑生成语句的语句对存储在记忆缓存里,用强化学习方法对模型进行学习,提升模型策略的有效性。

Description

虚拟现实与增强现实场景下弱监督深度学习语义解析方法
技术领域
本发明属于自然语言处理技术领域,尤其是一种虚拟现实与增强现实场景下的用于自然语言语义解析的弱监督深度学习方法。
背景技术
已有谷歌于2018年发表的《Memory Augmented Policy Optimization forProgram Synthesis and Semantic Parsing》论文中发表了对SQL语句进行语义解析技术MAPO,该技术不适用于λ演算(Lambda Calculus)等逻辑语句的语义解析,而本发明则是为了解决在λ演算逻辑语义解析这个更大的搜索空间下的自然语言语义解析问题。
发明内容
本发明为了解决在自然语言转化为λ演算逻辑语句的问题,是用于解决自然语言处理中的语义解析问题的一种技术,适用于再标记样本较少的情况下利用off-pol icy探索来构建语义解析网络。本发明提出一种虚拟现实与增强现实场景下弱监督深度学习语义解析方法,包括如下步骤:
步骤1:在已有训练数据集合中抽出1/5的数据作为具备有强监督标注信息的数据;然后,用适用于该环境下的解释器解释,该解释器将逻辑序列解释并评价逻辑序列的执行结果解释,将训练数据集合中的另外4/5数据执行强监督标注序列,将执行结果作为弱标签,得到另一部分的具备弱监督标注信息的数据,产生一个一部分数据具备强监督标注信息,另一部分数据只具备弱监督标注信息的数据集,用于接下来的训练;
步骤2:将步骤1得到的那部分具备强监督标注信息的数据作为先验知识,用该先验知识构建预训练语言模型,采用“结合探索”策略方法,结合该预训练语言模型和人工写的语法规则约束指导神经网络的语义探索,让生成器能够探索生成可能命中目标逻辑语义表示语句;
步骤3:用所述解释器解释并执行步骤2生成的逻辑语义表示语句,得到执行结果;再根据步骤1中已有执行结果得到的弱标签,通过对比弱标签和执行结果,得到一个正向或者负向的结果得分反馈;
步骤4:根据步骤3得到的反馈得分,将得分高于阈值的原语句-生成语句的语句对存储在记忆缓存里,然后分别从该记忆缓存和步骤1的具备强监督标注信息的数据中采样,然后用采样到的数据用强化学习方法对模型进行学习,提升模型策略的有效性。
进一步的,所述步骤2中,通过“结合探索”使得生成器探索生成符合目标逻辑语句形式的表达语句,为生成语句打分的方法。打分过程为:用解释器对生成的语句进行解析,并执行,得到一个执行结果,然后再通过对比该执行结果与步骤一得到的弱标签,若二者相似度大于阈值,就给语句打一个正向的得分,否则,则打一个负向的得分。
进一步的,所述步骤4进行强化学习过程如下,其中强化学习方法的优化目标表示为:
Figure BDA0002480017800000021
其中,θ为生成器模型中的参数,at表示探索过程中每轮生成语句的过程中第t步选择的单词token,d(a0…t-1)表示a0…t-1出现的概率,
Figure BDA0002480017800000022
表示步骤三中该生成的语句的得分,若是一个生成语句的得分为正,,则
Figure BDA0002480017800000023
且对于k<t都有
Figure BDA0002480017800000024
强化学习过程采用梯度上升,Adam作为优化器来进行训练,πθ表示在a0…t-1已出现的情况下,下一个行动at的出现概率。
有益效果
与背景技术中存在的问题相比较,本发明可以在λ演算(Lambda Calculus)解析这种具有更大搜索空间的问题运行。且本发明可以在训练数据不都具备有强监督标注信息但有一部训练数据具备强监督标注信息和另一部分数据具备弱监督标注信息的样本数据集上训练。本发明的方法的特殊之处在于得到的语义解析器是通过部分带有强监督标注信息的数据和部分带有弱监督标注信息的数据所组成的数据集合训练得来,而不是全部通过带前监督标注信息的数据训练而来。在实际应用,相对于强监督标注信息,弱监督标注信息的获取更为容易。
附图说明
图1:本发明总体流程图;
图2:生成器模型示意图;
图3:“结合探索”方法生成下一单词的过程示意图;
图4:为生成语句打分的过程示意图;
图5:带记忆缓存的分布采样下的强化学习过程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅为本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域的普通技术人员在不付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
语义解析(semantic parsing)是将自然语言转化为逻辑语言的自然语言处理任务。本发明解决在比较少的标注数据下,将自然语言转化为λ演算逻辑语句,该λ演算逻辑语句可被机器理解,然后做出相应反应。要实现较少标记数据下使自然语言转化为λ演算逻辑语句,首先需要有一个解释器作为解析环境,该解释器的作用是在逻辑语义若是转化正确(可执行且执行结果正确)的情况下给模型一个正向反馈,在逻辑语义若是转化错误(不可执行或是执行结果正确)的情况下给模型一个负向反馈。在已有解释器的情况下,采用off-policy搜索方法,搜索过程在有手写的语义规则约束下进行,为了使模型避免强化学习的冷开始问题,可以先用少量的已标注数据来构建预训练语言模型,在该预训练语言模型的基础上,再进行搜索。采用带有attention机制的encoder-decoder神经网络模型对搜索出的正确的自然语句-逻辑语句进行学习,最后得到解析力更强的自然语言-逻辑语言解析模型。
本发明的虚拟现实与增强现实场景下弱监督深度学习语义解析方法总体流程图如图1所示。对于本方法实验,前提条件是有一个具备所有强监督标注信息的数据集合,但本发明的方法是要解决如果训练数据只有一部分有强监督标注信息,而另一部分只具备有弱监督标注信息,模型该如何训练的问题。
步骤一,如图1的上半部分所示,本发明保留原有数据的1/5的数据,作为具备强监督标签的那一部分训练数据,而对于另外4/5的数据,则是通过一个由人工手写规则组成的解释器,执行这部分数据的强监督标注序列,得到执行结果,将该执行结果作为弱监督标注信息来适用。这是第一步,得到了一个具有一部分数据具备强监督标注信息,而另一部分数据只具备弱监督标注信息的一个用于实验的数据集。这是本发明用于得到实验数据采用的一种方法。部分数据集的语句,强标签,弱标签的样例如表1所示。
表1自然语言语句,强标签和弱标签样例
Figure BDA0002480017800000041
步骤二,在自然语言生成任务里,一般采用一个带有注意力机制的编码器-解释器模型(encoder-decoder with attention)来作为目标语句的生成器,本发明也采用了相似结果的生成器,如图2所示,该生成器的编码器解码器都有长短期记忆单元(LSTM)构成,采用了注意力机制来分析输入序列各个词汇的重要性。而后,本发明采用的生成器,由于不具备大量的强监督信息来训练,所以该生成器需要探索出合适的可能命中目标逻辑形式的语句。于是,如图1的中间部分所示,本发明使用了步骤一产生的那一部分(少量)的带有强监督标注信息的数据,用这些数据训练出一个预训练语言模型(训练过程类似于一般的有监督学习过程)。然后,参考目标逻辑语句的形式,本发明手写了关于目标逻辑语句的语法规则。接下来,本发明采用了一种本发明称为“结合探索”的方法来让生成器能探索生成符合目标逻辑语句形式的句子。
“结合探索”的执行过程如图3所示,生成器每次根据上一个生成的单词来生成下一个单词时,预训练模型和语法规则约束会相应的各自给出一个下一生成单词的候选表,然后,以各自50%的概率选择其中一个候选表,然后生成器再在选中的候选表中随机选择一个单词,作为下一个生成的单词。该探索方法在强化学习方法中可类似于off-policy方法。
步骤三,在步骤二中本发明通过“结合探索”来让生成器尽量探索生成符合目标逻辑语句形式的表达语句,但即使探索生成的语句符合了逻辑形式的要求,但不一定是符合语义要求低的语句。所以这里需要一个为生成语句打分(识别好坏)的方法。正如图4所示打分过程,本发明采用了步骤一用到的那个特殊解释器,在结合了外部通用知识后,用该解释器对生成的语句进行解析,并执行,得到一个执行结果,然后再通过对比该执行结果与步骤一所提到的弱标签,若二者相近,就给语句打一个正向的得分,若二者不相似,则打一个负向的得分。
步骤四,根据步骤三得到的反馈(得分),可以先将得分高的原语句-生成语句对存储在记忆缓存里,丢弃掉得分较低的语句对。然后分别从该记忆缓存和步骤一的那1/5的具备强监督标注信息的数据进行分布式采样,然后以采样到的数据为输入数据,进行强化学习方法,提升生成器模型的策略,该过程如图5所示。
其中强化学习方法的优化目标可以表示为:
Figure BDA0002480017800000051
其中,θ为生成器模型中的参数,at表示探索过程中每轮生成语句的过程中第t步选择的单词token,d(a0…t-1)表示a0…t-1出现的概率,
Figure BDA0002480017800000052
表示步骤三中该生成的语句的得分,若是一个生成语句的得分为正,如1,则
Figure BDA0002480017800000053
且对于k<t都有
Figure BDA0002480017800000054
强化学习过程采用梯度上升,Adam作为优化器来进行训练,k为整数。其中πθ表示在a0…t-1已出现的情况下,下一个行动at出现的概率。
经过前面四个步骤,本发明就训练得到了一个有一点效果的语义解析器。本发明的方法的特殊之处在于得到的语义解析器是通过部分带有强监督标注信息的数据和部分带有弱监督标注信息的数据所组成的数据集合训练得来,而不是全部通过带前监督标注信息的数据训练而来。相对于强监督标注信息,弱监督标注信息的获取更为容易。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,且应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (3)

1.一种虚拟现实与增强现实场景下弱监督深度学习语义解析方法,其特征在于,包括如下步骤:
步骤1:在已有训练数据集合中抽出1/5的数据作为具备有强监督标注信息的数据;然后,用解释器解释,该解释器将逻辑序列解释并评价逻辑序列的执行结果解释,将训练数据集合中的另外4/5数据执行强监督标注序列,将执行结果作为弱标签,得到另一部分的具备弱监督标注信息的数据,产生一个一部分数据具备强监督标注信息,另一部分数据只具备弱监督标注信息的数据集,用于接下来的训练;
步骤2:将步骤1得到的那部分具备强监督标注信息的数据作为先验知识,用该先验知识构建预训练语言模型,采用“结合探索”策略方法,结合该预训练语言模型和人工写的语法规则约束指导神经网络的语义探索,让生成器能够探索生成可能命中目标逻辑语义表示语句;“结合探索”的执行过程为:生成器每次根据上一个生成的单词来生成下一个单词时,预训练模型和语法规则约束会相应的各自给出一个下一生成单词的候选表,然后,以各自50%的概率选择其中一个候选表,然后生成器再在选中的候选表中随机选择一个单词,作为下一个生成的单词;
步骤3:用所述解释器解释并执行步骤2生成的逻辑语义表示语句,得到执行结果;再根据步骤1中已有执行结果得到的弱标签,通过对比弱标签和执行结果,得到一个正向或者负向的结果得分反馈;
步骤4:根据步骤3得到的反馈得分,将得分高于阈值的原语句-生成语句的语句对存储在记忆缓存里,然后分别从该记忆缓存和步骤1的具备强监督标注信息的数据中采样,然后用采样到的数据用强化学习方法对模型进行学习,提升模型策略的有效性。
2.根据权利要求1所述的一种虚拟现实与增强现实场景下弱监督深度学习语义解析方法,其特征在于:
所述步骤2中,通过“结合探索”使得生成器探索生成符合目标逻辑语句形式的表达语句,为生成语句打分的方法,打分过程为:用解释器对生成的语句进行解析,并执行,得到一个执行结果,然后再通过对比该执行结果与步骤1得到的弱标签,若二者相似度大于阈值,就给语句打一个正向的得分,否则,则打一个负向的得分。
3.根据权利要求1所述的一种虚拟现实与增强现实场景下弱监督深度学习语义解析方法,其特征在于:
所述步骤4进行强化学习过程如下,其中强化学习方法的优化目标表示为:
Figure FDA0003678334240000021
其中,θ为生成器模型中的参数,at表示探索过程中每轮生成语句的过程中第t步选择的单词token,d(a0…t-1)表示a0…t-1出现的概率,
Figure FDA0003678334240000022
表示步骤三中该生成的语句的得分,若是一个生成语句的得分为正,则
Figure FDA0003678334240000023
且对于k<t都有
Figure FDA0003678334240000024
强化学习过程采用梯度上升,Adam作为优化器来进行训练,πθ表示在a0…t-1已出现的情况下,下一个行动at的出现概率。
CN202010375881.0A 2020-05-07 2020-05-07 虚拟现实与增强现实场景下弱监督深度学习语义解析方法 Active CN111651998B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010375881.0A CN111651998B (zh) 2020-05-07 2020-05-07 虚拟现实与增强现实场景下弱监督深度学习语义解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010375881.0A CN111651998B (zh) 2020-05-07 2020-05-07 虚拟现实与增强现实场景下弱监督深度学习语义解析方法

Publications (2)

Publication Number Publication Date
CN111651998A CN111651998A (zh) 2020-09-11
CN111651998B true CN111651998B (zh) 2022-09-06

Family

ID=72342964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010375881.0A Active CN111651998B (zh) 2020-05-07 2020-05-07 虚拟现实与增强现实场景下弱监督深度学习语义解析方法

Country Status (1)

Country Link
CN (1) CN111651998B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364980B (zh) * 2020-11-09 2024-04-30 北京计算机技术及应用研究所 一种弱监督场景下基于强化学习的深度神经网络训练方法
CN113642395B (zh) * 2021-07-07 2023-05-23 中国人民解放军战略支援部队信息工程大学 面向城市增强现实信息标注的建筑物场景结构提取方法
CN114925185B (zh) * 2022-05-13 2023-02-07 北京百度网讯科技有限公司 交互方法、模型的训练方法、装置、设备及介质
CN115018472B (zh) * 2022-08-03 2022-11-11 中国电子科技集团公司第五十四研究所 一种基于可解释机制的交互式增量化情报分析系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8539061B2 (en) * 2008-09-19 2013-09-17 Georgia Tech Research Corporation Systems and methods for web service architectures
CN103336969B (zh) * 2013-05-31 2016-08-24 中国科学院自动化研究所 一种基于弱监督学习的图像语义解析方法
US11238350B2 (en) * 2016-09-21 2022-02-01 Scianta Analytics Llc Cognitive modeling system
US10402690B2 (en) * 2016-11-07 2019-09-03 Nec Corporation System and method for learning random-walk label propagation for weakly-supervised semantic segmentation
CN107015963A (zh) * 2017-03-22 2017-08-04 重庆邮电大学 基于深度神经网络的自然语言语义分析系统及方法
CN109635108B (zh) * 2018-11-22 2020-02-18 华东师范大学 一种基于人机交互的远程监督实体关系抽取方法
CN110837836B (zh) * 2019-11-05 2022-09-02 中国科学技术大学 基于最大化置信度的半监督语义分割方法
CN111079406B (zh) * 2019-12-13 2022-01-11 华中科技大学 自然语言处理模型训练方法、任务执行方法、设备及系统

Also Published As

Publication number Publication date
CN111651998A (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
CN111651998B (zh) 虚拟现实与增强现实场景下弱监督深度学习语义解析方法
CN109472024B (zh) 一种基于双向循环注意力神经网络的文本分类方法
Chang et al. Chinese named entity recognition method based on BERT
CN112541356B (zh) 一种生物医学命名实体识别的方法和系统
Fonseca et al. A two-step convolutional neural network approach for semantic role labeling
CN112765956B (zh) 基于多任务学习的依存句法分析方法及应用
WO2008107305A2 (en) Search-based word segmentation method and device for language without word boundary tag
Li et al. Text-to-text generative adversarial networks
Gao et al. Named entity recognition method of Chinese EMR based on BERT-BiLSTM-CRF
CN110427619B (zh) 一种基于多通道融合与重排序的中文文本自动校对方法
CN113657123A (zh) 基于目标模板指导和关系头编码的蒙语方面级情感分析方法
CN112507337A (zh) 基于语义分析的恶意JavaScript代码检测模型的实现方法
US20230103728A1 (en) Method for sample augmentation
CN109948144A (zh) 一种基于课堂教学情境的教师话语智能处理的方法
CN114742069A (zh) 一种代码相似度检测方法及装置
CN115510863A (zh) 一种面向问句匹配任务的数据增强方法
CN114743143A (zh) 一种基于多概念知识挖掘的视频描述生成方法及存储介质
CN113221542A (zh) 一种基于多粒度融合与Bert筛选的中文文本自动校对方法
CN112507124A (zh) 一种基于图模型的篇章级别事件因果关系抽取方法
CN104317882A (zh) 一种决策级中文分词融合方法
CN114969269A (zh) 基于实体识别和关系抽取的虚假新闻检测方法及系统
CN114970536A (zh) 一种分词、词性标注和命名实体识别的联合词法分析方法
CN111444720A (zh) 一种英文文本的命名实体识别方法
CN116306653A (zh) 一种正则化领域知识辅助的命名实体识别方法
CN109960782A (zh) 一种基于深度神经网络的藏文分词方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant