CN116628210A - 基于对比学习对智慧楼宇故障事件抽取的故障确定方法 - Google Patents

基于对比学习对智慧楼宇故障事件抽取的故障确定方法 Download PDF

Info

Publication number
CN116628210A
CN116628210A CN202310906670.9A CN202310906670A CN116628210A CN 116628210 A CN116628210 A CN 116628210A CN 202310906670 A CN202310906670 A CN 202310906670A CN 116628210 A CN116628210 A CN 116628210A
Authority
CN
China
Prior art keywords
fault
sample
trigger word
trigger
argument
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310906670.9A
Other languages
English (en)
Other versions
CN116628210B (zh
Inventor
程俊
朱芩叶
孟涛
吴晓华
赵翊含
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
GD Midea Heating and Ventilating Equipment Co Ltd
Original Assignee
University of Electronic Science and Technology of China
GD Midea Heating and Ventilating Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China, GD Midea Heating and Ventilating Equipment Co Ltd filed Critical University of Electronic Science and Technology of China
Priority to CN202310906670.9A priority Critical patent/CN116628210B/zh
Publication of CN116628210A publication Critical patent/CN116628210A/zh
Application granted granted Critical
Publication of CN116628210B publication Critical patent/CN116628210B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种基于对比学习对智慧楼宇故障事件抽取的故障确定方法,属于楼宇故障识别领域。所述基于对比学习对智慧楼宇故障事件抽取的故障确定方法,包括:将待识别文本输入至目标故障识别模型的触发词提取模块,获取所述触发词提取模块输出的至少一个黄金触发词;将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息。本申请的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,能够对复杂或模糊文本进行有效的故障识别,提高楼宇环境下预测所得到的目标故障信息的准确度和精确度,具有较高的通用性和应用广泛性。

Description

基于对比学习对智慧楼宇故障事件抽取的故障确定方法
技术领域
本申请属于楼宇故障识别领域,尤其涉及一种基于对比学习对智慧楼宇故障事件抽取的故障确定方法。
背景技术
随着智慧化楼宇的发展,对楼宇的运维必不可少,针对楼宇故障领域的事件抽取的需求日益增加。相关技术中,主要采用通用领域的事件抽取模型进行楼宇故障检测,然而,不同于其他领域,楼宇环境较为复杂,其所涉及的数据量大且复杂多变,常规的故障检测结果方法往往无法准确检测出楼宇故障,且检测范围有限,无法较好地应用于楼宇领域。
发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种基于对比学习对智慧楼宇故障事件抽取的故障确定方法,能够对复杂或模糊文本进行有效的故障识别,提高楼宇环境下预测所得到的目标故障信息的准确度和精确度,具有较高的通用性和普适性。
第一方面,本申请提供了一种基于对比学习对智慧楼宇故障事件抽取的故障确定方法,该方法包括:
将待识别文本输入至目标故障识别模型的触发词提取模块,获取所述触发词提取模块输出的至少一个黄金触发词;
将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息;
其中,所述触发词提取模块为基于第一训练样本训练得到,所述第一训练样本包括样本文本和所述样本文本对应的样本黄金触发词和样本候选触发词;
所述触发词分类模块为基于第二训练样本训练得到,所述第二训练样本包括所述样本黄金触发词和与所述样本黄金触发词对应的样本故障定义文本;所述样本故障定义文本包括故障类型和所述故障类型对应的描述。
根据本申请的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过精细样本标注以及训练的方式进行触发词分类,能够对复杂或模糊文本进行有效的故障识别,从而准确识别得到复杂多变的楼宇环境下的各类故障,且检测范围广,显著提高了楼宇环境下预测所得到的目标故障信息的准确度和精确度,具有较高的通用性和应用广泛性。
根据本申请的一个实施例,所述触发词提取模块为基于第一训练样本训练得到,包括:
采用对比学习的方法,基于所述第一训练样本训练所述触发词提取模块。
根据本申请的一个实施例,所述基于所述第一训练样本训练所述触发词提取模块,包括:
基于线性函数构建所述触发词提取模块对应的损失函数;
以所述损失函数最小化为目标训练所述触发词提取模块;
所述损失函数为:
其中,Lt为所述损失函数;k为所述样本候选触发词的数量,为所述样本黄金触发词对应的权重值;/>为所述样本候选触发词对应的权重值。
根据本申请的一个实施例,所述线性函数基于如下步骤确定:
基于所述样本文本对应的token表示,获取所述样本文本的语义表示;
将所述样本文本的语义表示分别与所述样本黄金触发词和所述样本候选触发词的token表示拼接,获取所述样本黄金触发词的语义表示和所述样本候选触发词的语义表示;
以所述样本黄金触发词作为正锚点,以所述样本候选触发词作为负样本,基于所述样本黄金触发词的语义表示和所述样本候选触发词的语义表示构建所述线性函数。
根据本申请的一个实施例,所述触发词分类模块为基于第二训练样本训练得到,包括:
基于所述故障类型和所述故障类型对应的描述,构建初始故障类型表示矩阵;
随机初始化所述初始故障类型表示矩阵,获取第一故障类型表示矩阵;
以所述样本黄金触发词与所述第一故障类型表示矩阵点乘后对应的第一类型得分最大值对应到正确的故障类型为目标,训练所述第一故障类型表示矩阵,获取所述触发词分类模块。
根据本申请的一个实施例,所述基于所述故障类型和所述故障类型对应的描述,构建初始故障类型表示矩阵,包括:
对所述故障类型和所述故障类型对应的描述进行Bert编码,获取故障类型语义表示;
基于各故障类型对应的故障类型语义表示,构建所述初始故障类型表示矩阵;所述初始故障类型表示矩阵的大小为N×H,其中,N为故障类型的个数,H为Bert模型[CLS]向量的大小。
根据本申请的一个实施例,所述将待识别文本输入至目标故障识别模型的触发词提取模块,获取所述触发词提取模块输出的至少一个黄金触发词,包括:
对所述待识别文本进行关键词提取,获取多个触发词以及各所述触发词对应的权重值;
将最大的第一目标数量的权重值对应的触发词确定为所述至少一个黄金触发词。
根据本申请的一个实施例,所述将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息,包括:
将所述黄金触发词与训练好的第一故障类型表示矩阵进行点乘,获取各黄金触发词对应的第一类型得分;所述触发词分类模块根据所述训练好的第一故障类型表示矩阵获得;
将大于第一目标阈值的第一类型得分对应的黄金触发词确定为最终触发词,并基于所述最终触发词对应的故障类型确定所述目标故障信息。
根据本申请的一个实施例,在所述将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息之后,所述方法还包括:
基于所述黄金触发词与所述待识别文本中各对象之间的依存关系,从所述待识别文本所包括的至少一个对象中确定目标候选论元。
根据本申请的一个实施例,所述基于所述黄金触发词与所述待识别文本中各对象之间的依存关系,从所述待识别文本所包括的至少一个对象中确定目标候选论元,包括:
对所述待识别文本进行分词及重组,获取多个词汇单元;
以所述多个词汇单元中所述黄金触发词为根节点构建所述黄金触发词对应的依存分析树,所述依存分析树包括至少一个子节点,各所述子节点对应有一个词汇单元;
将所述依存分析树中除所述根节点之外的所述子节点对应的词汇单元确定为目标候选论元。
根据本申请的一个实施例,在所述从所述待识别文本所包括的至少一个对象中确定目标候选论元之后,所述方法还包括:
将所述目标候选论元输入至目标故障识别模型的论元分类模块,获取所述论元分类模块输出的所述目标候选论元对应的目标属性类型;
所述论元分类模块为基于第三训练样本训练得到,所述第三训练样本包括样本黄金论元和所述样本论元对应的样本属性定义文本;所述样本属性定义文本包括属性类型和所述属性类型对应的描述。
根据本申请的一个实施例,所述将所述目标候选论元输入至目标故障识别模型的论元分类模块,获取所述论元分类模块输出的所述目标候选论元对应的目标属性类型,包括:
将所述目标候选论元与训练好的第一论元角色表示矩阵进行点乘,获取各目标候选论元对应的第二类型得分;所述论元分类模块根据所述训练好的第一论元角色表示矩阵获得;
将大于第二目标阈值的第二类型得分对应的目标候选论元确定为最终论元,并将所述最终论元对应的属性类型确定所述目标属性类型。
根据本申请的一个实施例,所述论元分类模块为基于第三训练样本训练得到,包括:
基于所述属性类型和所述属性类型对应的描述,构建初始论元角色表示矩阵;
随机初始化所述初始论元角色表示矩阵,获取第一论元角色表示矩阵;
以所述样本黄金论元与所述第一论元角色表示矩阵点乘后对应的第二类型得分最大值对应到正确的属性类型为目标,训练所述第一论元角色表示矩阵,获取所述论元分类模块。
第二方面,本申请提供了一种基于对比学习对智慧楼宇故障事件抽取的故障确定装置,该装置包括:
第一处理模块,用于将待识别文本输入至目标故障识别模型的触发词提取模块,获取所述触发词提取模块输出的至少一个黄金触发词;
第二处理模块,用于将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息;
其中,所述触发词提取模块为基于第一训练样本训练得到,所述第一训练样本包括样本文本和所述样本文本对应的样本黄金触发词和样本候选触发词;
所述触发词分类模块为基于第二训练样本训练得到,所述第二训练样本包括所述样本黄金触发词和与所述样本黄金触发词对应的样本故障定义文本;所述样本故障定义文本包括故障类型和所述故障类型对应的描述。
根据本申请的基于对比学习对智慧楼宇故障事件抽取的故障确定装置,通过精细样本标注以及训练的方式进行触发词分类,能够对复杂或模糊文本进行有效的故障识别,从而准确识别得到复杂多变的楼宇环境下的各类故障,且检测范围广,显著提高了楼宇环境下预测所得到的目标故障信息的准确度和精确度,具有较高的通用性和应用广泛性。
第三方面,本申请提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法。
第四方面,本申请提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法。
第五方面,本申请提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法。
本申请实施例中的上述一个或多个技术方案,至少具有如下技术效果之一:
通过对比学习的方式进行触发词提取,通过精细样本标注以及训练的方式进行触发词分类,能够对复杂或模糊文本进行有效的故障识别,从而准确识别得到复杂多变的楼宇环境下的各类故障,且检测范围广,显著提高了楼宇环境下预测所得到的目标故障信息的准确度和精确度,具有较高的通用性和应用广泛性。
进一步地,通过对比学习的方法,以损失函数最小化为目标训练正负样本,以得到用于衡量词汇作为触发词的权重值的线性函数,从而得到训练好的触发词提取模块,训练过程简单便捷,训练效率高,且训练精度和准确度较高。
更进一步地,通过将“故障类型名称”及其“对应描述”作为故障类型表示以构建第一故障类型表示矩阵,能够实现精细化标注,以提高模块的训练精度;在此基础上,基于点乘和取最大值的算法训练触发词分类模块,操作简单快捷,适用于对于复杂或模糊文本下的故障类别的识别,具有较高的分类效率以及分类精准度。
再进一步地,通过在对故障进行分类的基础上,进一步基于待识别文本识别得到重要论元对应的角色类型,以将该角色类型作为对故障类型的补充描述,进一步提高所得到的目标故障信息的全面性和准确性,方便用户及时快速地了解各类故障情况。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法的流程示意图之一;
图2是本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法的流程示意图之二;
图3是本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法的流程示意图之三;
图4是本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法的流程示意图之四;
图5是本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法的流程示意图之五;
图6是本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法的流程示意图之六;
图7是本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定装置的结构示意图;
图8是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法、基于对比学习对智慧楼宇故障事件抽取的故障确定装置、电子设备和可读存储介质进行详细地说明。
其中,基于对比学习对智慧楼宇故障事件抽取的故障确定方法可应用于终端,具体可由,终端中的硬件或软件执行。
该终端包括但不限于具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话或平板电脑等便携式通信设备。还应当理解的是,在某些实施例中,该终端可以不是便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
以下各个实施例中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和控制杆的一个或多个其它物理用户接口设备。
本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,该基于对比学习对智慧楼宇故障事件抽取的故障确定方法的执行主体可以为电子设备或者电子设备中能够实现该基于对比学习对智慧楼宇故障事件抽取的故障确定方法的功能模块或功能实体,本申请实施例提及的电子设备包括但不限于手机、平板电脑、电脑、相机和可穿戴设备等,下面以电子设备作为执行主体为例对本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法进行说明。
如图1所示,该基于对比学习对智慧楼宇故障事件抽取的故障确定方法包括:步骤110和步骤120。
步骤110、将待识别文本输入至目标故障识别模型的触发词提取模块,获取触发词提取模块输出的至少一个黄金触发词;其中,触发词提取模块为基于第一训练样本训练得到,第一训练样本包括样本文本和样本文本对应的样本黄金触发词和样本候选触发词;
在该步骤中,目标故障识别模型包括触发词提取模块和触发词分类模块,触发词提取模块的输出与触发词分类模块的输入连接,在应用过程中,触发词提取模块用于对输入的待识别文本进行触发词提取。
黄金触发词为待识别文本中能够有效识别出故障类别的字词或短语。
候选触发词为待识别文本中容易混淆故障识别结果的字词或短语。
例如,对于待识别文本“在A区2号车辆门禁入口,车辆识别摄像机在接收信号后能及时开始捕捉画面,画面清楚但无法捕捉车牌,车辆不能正常识别”,黄金触发词可以包括:“无法捕捉车牌”等;而候选触发词可以包括:“接收信号”、“及时开始捕捉”以及“画面清楚”等。
第一训练样本为用于训练触发词提取模块的样本。
第一训练样本包括:样本文本和样本文本对应的样本黄金触发词和样本候选触发词,其中,样本文本对应的样本黄金触发词和样本候选触发词可以通过用户自定义。
其中,样本黄金触发词为正向样本,样本候选触发词为负向样本。
以样本文本为“在A区2号车辆门禁入口,车辆识别摄像机在接收信号后能及时开始捕捉画面,画面清楚但无法捕捉车牌,车辆不能正常识别”为例,可对该样本文本中的正向样本进行标记,得到样本黄金触发词“无法捕捉车牌”;对该样本文本中的负向样本进行标记,得到样本候选触发词:“接收信号”、“及时开始捕捉”以及“画面清楚”等。
在一些实施例中,触发词提取模块可以为Bert模型。
在实际训练过程中,可以采用基于对比学习的训练方法进行训练,仅需进行是和否两类判断,无需分别标记,准确度高,且训练过程简单,训练效率高。
下面对触发词提取模块的具体训练过程进行说明。
在一些实施例中,触发词提取模块为基于第一训练样本训练得到,可以包括:采用对比学习的方法,基于第一训练样本训练触发词提取模块。
在该实施例中,通过对比学习的方式训练触发词提取模块,无需对每一个第一训练样本分别进行标注,只需进行是或否的训练,在有效保证训练准确度的同时,还能降低用于训练的数据量,以提高训练速率,适用于任意场景,尤其适用于复杂或涉及大量训练样本的特征提取情景。
在一些实施例中,采用对比学习的方法,基于第一训练样本训练触发词提取模块,可以包括:
基于线性函数构建触发词提取模块对应的损失函数;
以损失函数最小化为目标训练触发词提取模块;
损失函数为:
其中,Lt为损失函数;k为样本候选触发词的数量,为样本黄金触发词对应的权重值;/>为样本候选触发词对应的权重值。
在该实施例中,线性函数用于表征各触发词对应的权重值。
如图2所示,在触发词提取模块训练阶段,可以在Bert模型基础上,创新性地采用对比学习的方式,以最小化hinge loss损失函数为目标,学习线性函数的参数,从而得到触发词提取模块,以准确地区分正向样本和负向样本。在后续应用过程中,可以输入待识别文本,基于训练好的线性函数,根据各候选词对应的权重值来选取黄金触发词,如检测得到最高的top-m个黄金触发词,其中,m>0且m为正整数。
如图3所示,在一些实施例中,线性函数可以基于如下步骤确定:
基于样本文本对应的token表示,获取样本文本的语义表示;
将语义表示分别与样本黄金触发词和样本候选触发词的token表示拼接,获取样本黄金触发词的语义表示和样本候选触发词的语义表示;
以样本黄金触发词作为正锚点,以样本候选触发词作为负样本,基于样本黄金触发词的语义表示和样本候选触发词的语义表示构建线性函数。
在该实施例中,token表示可以基于Bert模型获取。
线性函数的取值用于表示触发词对应的权重值。
例如,线性函数可以表示为:f(Xt)=W·Xt+b或f(Xt´)=W·Xt´+b;
其中,为样本黄金触发词对应的权重值;/>为样本候选触发词对应的权重值;Xt为样本黄金触发词与样本文本的BERT[CLS]向量拼接而成的向量(即样本黄金触发词的语义表示);Xt´为样本候选触发词与样本文本的BERT[CLS]向量拼接而成的向量(即样本候选触发词的语义表示);W和b均为可学习参数。
例如,在实际执行过程中,训练样本包括:5000条样本文本,其中前4000条为训练文本,后1000条为测试文本。
设参与训练的文本总条数为N=4000,设置训练的总迭代次数为n=120,设置初始值为0的迭代计数器i,设置初始值为0的文本条数计数器j;从训练文本中读取一行文本T并更新文本条数计数器为j++。
继续参考图3,以处理样本文本“在A区2号车辆门禁入口,车辆识别摄像机在接收信号后能及时开始捕捉画面,画面清楚但无法捕捉车牌,车辆不能正常识别”为例:
将样本文本输入至基于Bert模型的触发词提取模块,生成样本文本s的token表示S=s1,s2,…,sn,取句子的BERT[CLS]向量作为整个句子的语义表示,将其与样本黄金触发词st拼接得到Xt=[S[CLS];st];将整个句子的语义表示与样本候选触发词st´的token拼接得到Xt´=[S[CLS];st´],其中,Xt、Xt´∈ℝ1×2H,H为Bert模型一个token向量的大小;
在本实施例中,st为“无法捕捉车牌”,st´为“接收信号”、“及时开始捕捉”以及“画面清楚”。
采用对比学习,利用样本黄金触发词st作为正锚点,其他不正确的k个样本候选触发词st´作为负样本,设计专门的线性函数f(Xt)=W·Xt+b或f(Xt´)=W·Xt´+b,得到样本黄金触发词的权重值f(Xt)和每个样本候选触发词的权重值f(Xt´)。
使用损失函数:
最小化来学习可学习参数W和b,得到训练好的触发词提取模块,其中k为负样本的个数,其中为样本黄金触发词对应的线性函数;/>为样本候选触发词对应的线性函数。
例如,在训练的迭代次数n较小时,st(无法捕捉车牌)的权重值f(Xt)为2.1,st´(接收信号)的权重值f(Xt´)为0.8,st´(及时开始捕捉)的权重值f(Xt´)为3.8,st´(画面清楚)的权重值f(Xt´)为2.5,那么Lt=max{0,1+0.8-2.1}+max{0,1+3.8-2.1}+max{0,1+2.5-2.1}=0+2.7+1.4=4.1,正负样本对应的权重值的差别较小,可以认为此时还无法准确区分正负样本。
重复上述训练过程继续迭代,如在n=120迭代结束时,st(无法捕捉车牌)的权重值为一个较大值,如5.7;而st1´(接收信号)、st2´(及时开始捕捉)、st3´(画面清楚)的权重值f(Xt1´)、f(Xt2´)、f(Xt3´)分别为较小值,如依次为1.3,1.8,1.6,此时Lt= max{0,1+1.3-5.7}+ max{0,1+1.8-5.7}+ max{0,1+1.6-5.7}=0+0+0=0;正负样本对应的权重值的差别较大,此时即可近似认为可学习参数W和b已经充分完成了学习,触发词提取模块的训练完成,可用于测试文本计算触发词的权重值。
训练好的线性函数f(Xt)和f(Xt´)即可用于衡量词汇作为触发词的权重值。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过对比学习的方法,以损失函数最小化为目标训练正负样本,以得到用于衡量词汇作为触发词的权重值的线性函数,从而得到训练好的触发词提取模块,训练过程简单便捷,训练效率高,且训练精度和准确度较高。
下面对触发词提取模块的实际应用过程进行说明。
继续参考图3,在一些实施例中,步骤110可以包括:
对待识别文本进行关键词提取,获取多个触发词以及各触发词对应的权重值;
将最大的第一目标数量的权重值对应的触发词确定为至少一个黄金触发词。
在该实施例中,第一目标数量可以基于用户自定义,如设置为1,2,3或其他任意正整数值等,本申请不作限定。
可以理解的是,在实际应用过程中,触发词提取模块为预先训练好的模块,只需输入待识别文本,即可输出从待识别文本中提取得到的多个触发词,以及各触发词对应的权重值。
在另一些实施例中,将最大的第一目标数量的权重值对应的触发词确定为至少一个黄金触发词,还可以包括:将最大的第一目标数量的权重值中权重值大于第三目标阈值的权重值对应的触发词确定为至少一个黄金触发词。
在该实施例中,第三目标阈值为一个较大的值。
第三目标阈值可以基于用户自定义,本申请不作限定。
例如,继续参考图3,以待识别文本为“2023年5月13日在B区6号车辆门禁入口,车辆识别摄像机能够接收信号,但无法捕捉图像,且经过观察发现镜头破损”为例,将该待识别文本输入至触发词提取模块,得到长度为n的待识别文本的token表示S和Xi=[S[CLS];si],其中,si为待识别文本S中单词(例如:“观察”)或者短语(例如:“接收信号”、“镜头破损”)的token,Xi为触发词,每一个触发词,均对应有一个权重值。
利用线性函数f(Xi)的得分(即权重值)进行排序选出最有可能的top-m个触发词作为黄金触发词,其中,m为正整数。
例如在本实施例中,触发词si=“镜头破损”的权重值f(Xi)为5.5,触发词si=“无法捕捉图像”的权重值f(Xi)为4.4,触发词si=“接收信号”的权重值f(Xi)为1.9,触发词si=“观察”的权重值f(Xi)为0.6,则可以选取top3且f(Xi)>3.5的触发词si作为黄金触发词,如得到黄金触发词:“镜头破损”和“无法捕捉图像”。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过将待识别文本输入至基于对比学习训练得到的触发词提取模块,由触发词提取模块输出权重值靠前或者权重值较大的一个或多个触发词作为黄金触发词,提取准确率较高且提取速率快。
步骤120、将至少一个黄金触发词输入至目标故障识别模型的触发词分类模块,获取触发词分类模块输出的目标故障信息;
其中,触发词分类模块为基于第二训练样本训练得到,第二训练样本包括样本黄金触发词和与样本黄金触发词对应的样本故障定义文本;样本故障定义文本包括故障类型和故障类型对应的描述。
在该步骤中,触发词分类模块用于基于输出的触发词,识别得到与输出的触发词对应的故障类别。
目标故障信息为用于表述故障情况的信息,包括但不限于故障类别以及故障描述等。
例如,故障类型可以包括但不限于:摄像机错位、镜头损坏以及补光灯损坏等。
第二训练样本为用于训练触发词分类模块的样本。
第二训练样本包括:样本黄金触发词和与样本黄金触发词对应的样本故障定义文本,其中,样本黄金触发词可以为用户自定义的触发词,或者也可以为由触发词提取模块输出的触发词。
样本黄金触发词对应的样本故障定义文本为用户标记的与样本黄金触发词对应的真实故障文本。
在本申请中,样本故障定义文本为用户人为定义的定义文本,包括:故障类型和故障类型对应的描述。
其中,故障类型对应的描述用于描述造成该类故障可能的原因,或者该类故障可能造成的实际影响。
例如,一种样本故障定义文本可以表现为:[故障类型]摄像机错位[描述]监控摄像机的安装位置或方向出现偏差,导致监控画面与实际监控区域不相符,从而无法准确监控。
通过对故障类型进行描述,可以更加准确地表征故障类型,以便于故障类型与触发词能够实现精准匹配,从而提高故障识别结果的精确度和准确性,降低漏检误检等风险。
在训练过程中,可以采用任意可实现的神经网络的训练方式进行训练,本申请在此不作限定。
在一些实施例中,触发词分类模块可以为Bert模型。
发明人在研发过程中发现,相关技术中,常规的对于训练样本的处理方式主要为对故障类型名称进行简单标注,该标注方式使得基于该标注训练得到的模型也仅能识别特定关键词所对应的类别,而无法识别较为复杂或模糊的关键词对应的类别,从而无法适用于复杂的楼宇情景下的故障识别。
而在本申请中,通过结合楼宇具体应用场景获取导致每一个故障类别的可能原因以及该类故障可能导致的结果,并基于该原因或结果对故障类别进行进一步地描述,然后建立该描述与故障类型的关联关系得到样本故障定义文本,利用样本故障定义文本以对第二训练样本进行精细标注,能够实现训练触发词分类模块的深度训练,从而使得最终训练得到的训练触发词分类模块能够识别复杂或模糊文本下的故障类别,有效提高故障识别精度与准确度。
下面从一种实现角度,对触发词分类模块的训练过程进行说明。
在一些实施例中,触发词分类模块为基于第二训练样本训练得到,可以包括:
基于故障类型和故障类型对应的描述,构建初始故障类型表示矩阵;
随机初始化初始故障类型表示矩阵,获取第一故障类型表示矩阵;
以样本黄金触发词与第一故障类型表示矩阵点乘后对应的第一类型得分最大值对应到正确的故障类型为目标,训练第一故障类型表示矩阵,获取触发词分类模块。
在该实施例中,第一类型用于表示故障类型。
第一类型得分越大,表征可信度越高。
继续参考图4,在一些实施例中,基于故障类型和故障类型对应的描述,构建初始故障类型表示矩阵,可以包括:
对故障类型和故障类型对应的描述进行Bert编码,获取故障类型语义表示;
基于各故障类型对应的故障类型语义表示,构建初始故障类型表示矩阵。
在该实施例中,故障类型表示矩阵大小为N×H,其中,N为故障类型的个数,H为Bert模型[CLS]向量的大小。
例如,可以将“故障类型”及其“对应描述”作为故障类型表示,送入基于BERT模型的编码器,取其[CLS]向量作为故障类型语义表示,构建初始故障类型表示矩阵,并随机初始化该矩阵,得到第一故障类型表示矩阵WF,其中,WF∈ℝN×H,N为故障类型的个数,H为Bert模型[CLS]向量的大小。
然后利用样本黄金触发词的token st来学习第一故障类型表示矩阵WF,使用Ft=softargmax(WF·st)进行训练,目标是使样本黄金触发词根据第一类型得分的最大值能分类到正确的故障类型,从而得到训练好的第一故障类型表示矩阵WF。
继续参考图2,以独特的“故障名称”(即故障类型)加“对应描述”作为故障类型表示,再随机初始化故障类型表示矩阵得到第一故障类型表示矩阵WF,并以样本黄金触发词与WF点乘后能根据故障类型得分最大值正确分类为目标,训练第一故障类型表示矩阵WF,获取触发词分类模块。
在本申请中,通过随机初始化矩阵,可以使得在后续使用样本黄金触发词进行训练时,能够灵活对矩阵的参数进行调整,从而得到较大的得分,提高训练精度和准确度。
如图4所示,继续以样本故障定义文本为:“[故障类型]摄像机错位[描述]监控摄像机的安装位置或方向出现偏差,导致监控画面与实际监控区域不相符,从而无法准确监控”为例,进行说明。
将以上样本故障定义文本送入基于Bert模型的编码器,取其[CLS]向量作为故障类型语义表示,得到第一故障类型表示矩阵WF,WF∈ℝN×H,N为故障类型的个数,H为BERT模型[CLS]向量的大小;
利用样本黄金触发词的token st来学习WF,如利用样本文本“在A区2号车辆门禁入口,车辆识别摄像机在接收信号后能及时开始捕捉画面,画面清楚但无法捕捉车牌,车辆不能正常识别”所对应的样本黄金触发词st“无法捕捉车牌”,使用Ft=softargmax(WF·st)来训练第一故障类型表示矩阵,目标是使样本黄金触发词st“无法捕捉车牌”的第一类型得分最大值对应到正确的故障类型“摄像机错位”,从而得到训练好的触发词分类模块。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过将“故障类型名称”及其“对应描述”作为故障类型表示以构建第一故障类型表示矩阵,能够实现精细化标注,以提高模块的训练精度;在此基础上,基于点乘和取最大值的算法训练触发词分类模块,操作简单快捷,适用于对于复杂或模糊文本下的故障类别的识别,具有较高的分类效率以及分类精准度。
下面对触发词分类模块的实际应用过程进行说明。
在一些实施例中,步骤120可以包括:
将黄金触发词与训练好的第一故障类型表示矩阵进行点乘,获取各黄金触发词对应的第一类型得分;触发词分类模块根据训练好的第一故障类型表示矩阵获得;
将大于第一目标阈值的第一类型得分对应的黄金触发词确定为最终触发词,并基于最终触发词对应的故障类型确定目标故障信息。
在该实施例中,第一类型得分即为将黄金触发词与故障类型表示矩阵进行点乘后得到的值。
需要说明的是,故障类型表示矩阵大小为N*H,其中,N为故障类型的数量,H为BERT模型[CLS]向量的大小,黄金触发词向量的大小为h*1,h>0;通过将各黄金触发词与故障类型表示矩阵进行点乘,可以得到每一个黄金触发词对应的至少一个点乘得分(即第一类型得分)。
该第一类型得分用于表征该黄金触发词为该第一类型得分所对应的故障类型的可信度。
第一目标阈值为一个较大的数值,可以基于用户自定义,如将第一目标阈值设置为0.5或0.6等,本申请不作限定。
继续参考图2,可以将获取的待识别文本的黄金触发词与WF矩阵点乘,取概率(即第一类型得分)大于第一目标阈值0.5的黄金触发词作为最终触发词,并取最终触发词对应故障类型。
当然,在其他实施例中,将大于第一目标阈值的第一类型得分对应的黄金触发词确定为最终触发词,可以包括:将大于第一目标阈值的第一类型得分对应的黄金触发词中前第二目标数量的黄金触发词确定为最终触发词。
在该实施例中,第二目标数量可以基于用户自定义。
在获取大于第一目标阈值的第一类型得分对应的黄金触发词后,还可以从该大于第一目标阈值的第一类型得分对应的黄金触发词中进一步获取第二目标数量的黄金触发词作为最终触发词,以进一步降低最终触发词的数量,提高准确度。
继续参考图4,在实际执行过程中,可以分别计算步骤110中得到的m个黄金触发词T1,T2,...,Tm的Fti=softargmax(WF·sti),i=1,2,...,m,取Fti>0.5的黄金触发词作为最终触发词并取其对应故障类型,并舍弃Fti≤0.5的触发词。
例如,以待识别文本“2023年5月13日在B区6号车辆门禁入口,车辆识别摄像机能够接收信号,但无法捕捉图像,且经过观察发现镜头破损”为例,基于步骤110,可以得到多个黄金触发词:st1=“镜头破损”,st2=“无法捕捉图像”;
分别计算各黄金触发词对应的可能故障的第一类型得分Fti =softargmax(WF·sti),得到多个第一类型得分;
取Fti>0.5的黄金触发词及其对应故障类型,作为最终触发词以及目标故障信息;舍去Fti≤0.5的触发词。
例如黄金触发词st1=“镜头破损”在对应故障类型“镜头损坏”时取得最大值Ft1=0.95,黄金触发词st2=“无法捕捉图像”在对应故障类型“镜头损坏”以及“补光灯损坏”时取得最大值Ft2=0.62;综合判断可知此描述文本最大可能发生的故障类型是“镜头损坏”,有较小可能是“补光灯损坏”,即可将“镜头损坏”确定为目标故障信息。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过获取黄金触发词与训练好的第一故障类型表示矩阵的点乘得分,并取得分较高的值对应的黄金触发词作为最终触发词,计算速率高且分类准确性高。
在本申请中,通过结合楼宇具体应用场景获取导致每一个故障类别的可能原因以及该类故障可能导致的结果,并基于该原因或结果对故障类别进行进一步地描述,然后建立该描述与故障类型的关联关系得到样本故障定义文本,利用样本故障定义文本以对第二训练样本进行精细标注,能够实现训练触发词分类模块的深度训练,从而使得最终训练得到的训练触发词分类模块能够识别复杂或模糊文本下的故障类别,有效提高故障识别精度与准确度。
除此之外,通过对比学习的方式训练触发词提取模块,无需对每一个第一训练样本分别进行标注,只需进行是或否的训练,在有效保证训练准确度的同时,还能降低用于训练的数据量,以提高训练速率,适用于任意场景,尤其适用于复杂或涉及大量训练样本的特征提取情景。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过精细样本标注以及训练的方式进行触发词分类,能够对复杂或模糊文本进行有效的故障识别,从而准确识别得到复杂多变的楼宇环境下的各类故障,且检测范围广,显著提高了楼宇环境下预测所得到的目标故障信息的准确度和精确度,具有较高的通用性和应用广泛性。
如图5所示,在一些实施例中,在步骤120之后,该方法还可以包括:基于黄金触发词与待识别文本中各对象之间的依存关系,从待识别文本所包括的至少一个对象中确定目标候选论元。
在该实施例中,对象可以为待识别文本中的任意单词或词组等。
论元为句子中带有名词性的词。
依存关系用于表征黄金触发词与其他对象之间的关联关系,如用于表征黄金触发词对应事件的发生时间以及地点等。
在一些实施例中,基于黄金触发词与待识别文本中各对象之间的依存关系,从待识别文本所包括的至少一个对象中确定目标候选论元,可以包括:
对待识别文本进行分词及重组,获取多个词汇单元;
以多个词汇单元中黄金触发词为根节点构建黄金触发词对应的依存分析树,依存分析树包括至少一个子节点,各子节点对应有一个词汇单元;
将依存分析树中除根节点之外的子节点对应的词汇单元确定为获取目标候选论元。
在该实施例中,论元为句子中带有名词性的词。
词汇单元包括重组后的分词和部分未重组的分词。
在实际执行过程中,可以利用依存分析工具对待识别文本进行分词和子词合并,将待识别文本分解成一系列词汇单元,并合并一些子词,得到多个词汇单元;在此基础上,以基于步骤110确定的黄金触发词作为根节点,建立关于触发词的依存分析树;然后将依存分析树中除去根节点的其他节点的词汇单元作为初步候选论元Aj(即目标候选论元)。
以待识别文本为“2023年5月13日在B区6号车辆门禁入口,车辆识别摄像机能够接收信号,但无法捕捉图像,且经过观察发现镜头破损”为例,进行说明。
对于以上待识别文本,可以得到分词结果为:[('2023年', 'DATE'), ('5月', 'DATE'), ('13日', 'DATE'), ('在', 'O'), ('B', 'ORDINAL'), ('区', 'O'), ('6', 'NUMBER'), ('号', 'O'), ('车辆', 'O'), ('门禁', 'O'), ('入口', 'O'), (',', 'O'), ('车辆', 'O'), ('识别', 'O'), ('摄像机', 'O'), ('能够', 'O'), ('接收', 'O'), ('信号', 'O'), (',', 'O'), ('但', 'O'), ('无法', 'O'), ('捕捉', 'O'), ('图像', 'O'), (',', 'O'), ('且', 'O'), ('经过', 'O'), ('观察', 'O'), ('发现','O'), ('镜头', 'O'), ('破损', 'O'), ('。', 'O')]。
在得到上述多个分词后,将一些分词子词进行合并,如将触发词分词子词('无法', 'O'), ('捕捉', 'O'), ('图像', 'O')合并为('无法捕捉图像', 'T'),将('镜头','O'), ('破损', 'O')合并为('镜头破损', 'T'),其中,'T'表示属于触发词;除此之外,日期子词也可以进行合并,如将('2023年', 'DATE'), ('5月', 'DATE'), ('13日', 'DATE')合并为('2023年5月13日', 'DATE');从而得到多个词汇单元。
然后以黄金触发词“镜头破损”为根节点,建立关于触发词的依存分析树,得到其对应的子节点为:'2023年5月13日'、'B区'、'6号'、'车辆识别摄像机',各子节点分别对应一个词汇单元。
最后,将依存分析树中除去根节点的其他节点的词汇单元作为目标候选论元Aj,得到多个目标候选论元:'2023年5月13日'、'B区'、'6号'以及'车辆识别摄像机'。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过以触发词作为根节点构建依存分析树抽取候选论元,在已知触发词的情况下能够对相关论元进行快速抽取,简单有效,可以将与触发词相关的论元尽可能地抽取,减少遗漏。
在一些实施例中,在从待识别文本所包括的至少一个对象中确定目标候选论元之后,该方法还可以包括:
将目标候选论元输入至目标故障识别模型的论元分类模块,获取论元分类模块输出的目标候选论元对应的目标属性类型;
论元分类模块为基于第三训练样本训练得到,第三训练样本包括样本黄金论元和样本论元对应的样本属性定义文本;样本属性定义文本包括属性类型和属性类型对应的描述。
在该实施例中,目标属性类型为目标候选论元对应的最有可能的属性类别。
其中,属性类型表征论元的角色类型。
属性类型可以包括但不限于:日期、位置、门牌号和设施等。
在实际执行过程中,还可以将目标属性类型添加至目标故障信息中,作为对故障类别的补充描述。
目标故障识别模型还可以包括论元提取模块和论元分类模块。
其中,论元提取模块用于从待识别文本中提取得到目标候选论元,具体实现方式已在上文实施例中进行说明,在此不作赘述。
论元提取模块的输出端与论元分类模块的输入端连接,论元分类模块用于对输入的目标候选论元进行分类,确定各目标候选论元对应的属性类型。
例如,对于待识别文本“2023年5月13日在B区6号车辆门禁入口,车辆识别摄像机能够接收信号,但无法捕捉图像,且经过观察发现镜头破损”,其对应的目标候选论元可以包括:sA1='2023年5月13日',sA2='B区',sA3='6号',sA4='车辆识别摄像机;sA1='2023年5月13日'对应的属性类型为“日期”,sA2='B区'对应的属性类型为“位置”。
第三训练样本为用于训练论元分类模块的样本。
第三训练样本可以包括:样本黄金论元和样本论元对应的样本属性定义文本。
其中,样本属性定义文本为用户自定义的文本,可以包括:属性类型和属性类型对应的描述。
在实际执行过程中,论元分类模块可以为任意可实现的神经网络模型,本申请在此不作限定。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过在对故障进行分类的基础上,进一步基于待识别文本识别得到重要论元对应的角色类型,以将该角色类型作为对故障类型的补充描述,进一步提高所得到的目标故障信息的全面性和准确性,方便用户及时快速地了解各类故障情况。
下面对论元分类模块的训练方法进行说明。
如图6所示,在一些实施例中,论元分类模块为基于第三训练样本训练得到,可以包括:
基于属性类型和属性类型对应的描述,构建初始论元角色表示矩阵;
随机初始化初始论元角色表示矩阵,获取第一论元角色表示矩阵;
以样本黄金论元与第一论元角色表示矩阵点乘后对应的第二类型得分最大值对应到正确的属性类型为目标,训练第一论元角色表示矩阵,获取论元分类模块。
在该实施例中,论元分类模块的训练方法与触发词分类模块的训练方式类似。
在一些实施例中,基于属性类型和属性类型对应的描述,构建初始论元角色表示矩阵,可以包括:
对属性类型和属性类型对应的描述进行Bert编码,获取属性类型语义表示;
基于各属性类型对应的属性类型语义表示,构建初始论元角色表示矩阵。
在该实施例中,初始论元角色表示矩阵的大小为N×H,其中,N为属性类型的个数,H为Bert模型[CLS]向量的大小。
例如,将“论元角色名称”及其“对应描述”作为样本属性定义文本送入基于Bert模型的编码器,得到随机初始化的第一论元角色表示矩阵WE;
采用与训练第一故障类型表示矩阵WF相同的方法,利用样本黄金论元的token sA来学习第一论元角色表示矩阵WE,使用EA= softargmax(WE·sA)目标是使样本黄金论元根据第二类型得分的最大值能分类到正确的角色类型。
其中,第二类型为用于表征角色类型。
第二类型得分越高,表示可信度越高。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过第一论元角色表示矩阵的可学习表示并利用该矩阵对论元进行分类,基于点乘和取最大值的算法进行训练,训练方法简单便捷,训练精度高。
继续参考图6,在一些实施例中,将目标候选论元输入至目标故障识别模型的论元分类模块,获取论元分类模块输出的目标候选论元对应的目标属性类型,可以包括:
将目标候选论元与训练好的第一论元角色表示矩阵进行点乘,获取各目标候选论元对应的第二类型得分;论元分类模块根据训练好的第一论元角色表示矩阵获得;
将大于第二目标阈值的第二类型得分对应的目标候选论元确定为最终论元,并将最终论元对应的属性类型确定目标属性类型。
在该实施例中,第二目标阈值为一个较大的数值,第二目标阈值可以基于用户自定义,如设置为0.5或0.8等,本申请不作限定。
当然,在其他实施例中,也可以将大于第二目标阈值的第二类型得分对应的目标候选论元中前第三目标数量的目标候选论元确定为最终论元。
可以基于与步骤120类似的方式获取目标属性类型。
继续以待识别文本“2023年5月13日在B区6号车辆门禁入口,车辆识别摄像机能够接收信号,但无法捕捉图像,且经过观察发现镜头破损”为例,进行说明。
首先基于论元提取模块得到k个目标候选论元:
sA1='2023年5月13日',sA2='B区',sA3='6号',sA4='车辆识别摄像机';
将以上k个目标候选论元分别输入至论元分类模块,将k个目标候选论元各自的token与训练好的第一论元角色表示矩阵点乘,以计算得到各目标候选论元对应的第二类型得分EAj=softargmax(WE·sAj),j=1,2,...,k。
然后取第二类型得分EAj>0.5的目标候选论元作为最终论元,并获取最终论元对应的角色类型;且舍去EAj≤0.5的目标候选论元。
例如sA1='2023年5月13日'在对应的角色类型为“日期”时取得最大值EA1=0.99;sA2='B区'在对应的角色类型为“位置”时取得最大值EA2=0.92;sA3='6号'在对应的角色类型为“门牌号”时取得最大值EA3=0.70;sA4='车辆识别摄像机'在对应的角色类型“设施”时取得最大值EA4=0.83。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,通过在得到目标候选论元后,经过矩阵点乘后能根据预测阈值对候选论元进行进一步淘汰筛选和分类,简单有效,可以将与触发词相关的论元尽可能的抽取,减少遗漏。
本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,执行主体可以为基于对比学习对智慧楼宇故障事件抽取的故障确定装置。本申请实施例中以基于对比学习对智慧楼宇故障事件抽取的故障确定装置执行基于对比学习对智慧楼宇故障事件抽取的故障确定方法为例,说明本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定装置。
本申请实施例还提供一种基于对比学习对智慧楼宇故障事件抽取的故障确定装置。
如图7所示,该基于对比学习对智慧楼宇故障事件抽取的故障确定装置包括:第一处理模块710和第二处理模块720。
第一处理模块710,用于将待识别文本输入至目标故障识别模型的触发词提取模块,获取触发词提取模块输出的至少一个黄金触发词;
第二处理模块720,用于将至少一个黄金触发词输入至目标故障识别模型的触发词分类模块,获取触发词分类模块输出的目标故障信息;
其中,触发词提取模块为基于第一训练样本训练得到,第一训练样本包括样本文本和样本文本对应的样本黄金触发词和样本候选触发词;
触发词分类模块为基于第二训练样本训练得到,第二训练样本包括样本黄金触发词和与样本黄金触发词对应的样本故障定义文本;样本故障定义文本包括故障类型和故障类型对应的描述。
根据本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定装置,通过精细样本标注以及训练的方式进行触发词分类,能够对复杂或模糊文本进行有效的故障识别,从而准确识别得到复杂多变的楼宇环境下的各类故障,且检测范围广,显著提高了楼宇环境下预测所得到的目标故障信息的准确度和精确度,具有较高的通用性和应用广泛性。
在一些实施例中,该装置还可以包括第三处理模块,用于:采用对比学习的方法,基于第一训练样本训练触发词提取模块。
在一些实施例中,第三处理模块,还可以用于:基于线性函数构建触发词提取模块对应的损失函数;
以损失函数最小化为目标训练触发词提取模块;
损失函数为:
其中,Lt为损失函数;k为样本候选触发词的数量,为样本黄金触发词对应的权重值;/>为样本候选触发词对应的权重值。
在一些实施例中,第三处理模块,还可以用于:
基于样本文本对应的token表示,获取样本文本的语义表示;
将样本文本的语义表示分别与样本黄金触发词和样本候选触发词的token表示拼接,获取样本黄金触发词的语义表示和样本候选触发词的语义表示;
以样本黄金触发词作为正锚点,以样本候选触发词作为负样本,基于样本黄金触发词的语义表示和样本候选触发词的语义表示构建线性函数。
在一些实施例中,该装置还可以包括第四处理模块,用于:
基于故障类型和故障类型对应的描述,构建初始故障类型表示矩阵;
随机初始化初始故障类型表示矩阵,获取第一故障类型表示矩阵;
以样本黄金触发词与第一故障类型表示矩阵点乘后对应的第一类型得分最大值对应到正确的故障类型为目标,训练第一故障类型表示矩阵,获取触发词分类模块。
在一些实施例中,第四处理模块,还可以用于:
对故障类型和故障类型对应的描述进行Bert编码,获取故障类型语义表示;
基于各故障类型对应的故障类型语义表示,构建初始故障类型表示矩阵;初始故障类型表示矩阵的大小为N×H,其中,N为故障类型的个数,H为Bert模型[CLS]向量的大小。
在一些实施例中,第一处理模块710,还可以用于:
对待识别文本进行关键词提取,获取多个触发词以及各触发词对应的权重值;
将最大的第一目标数量的权重值对应的触发词确定为至少一个黄金触发词。
在一些实施例中,第二处理模块720,还可以用于:
将黄金触发词与训练好的第一故障类型表示矩阵进行点乘,获取各黄金触发词对应的第一类型得分;触发词分类模块根据训练好的第一故障类型表示矩阵获得;
将大于第一目标阈值的第一类型得分对应的黄金触发词确定为最终触发词,并基于最终触发词对应的故障类型确定目标故障信息。
在一些实施例中,该装置还可以包括第五处理模块,用于:
在将至少一个黄金触发词输入至目标故障识别模型的触发词分类模块,获取触发词分类模块输出的目标故障信息之后,基于黄金触发词与待识别文本中各对象之间的依存关系,从待识别文本所包括的至少一个对象中确定目标候选论元。
在一些实施例中,第五处理模块,还可以用于:
对待识别文本进行分词及重组,获取多个词汇单元;
以多个词汇单元中黄金触发词为根节点构建黄金触发词对应的依存分析树,依存分析树包括至少一个子节点,各子节点对应有一个词汇单元;
将依存分析树中除根节点之外的子节点对应的词汇单元确定为目标候选论元。
在一些实施例中,该装置还可以包括第六处理模块,用于:
在从待识别文本所包括的至少一个对象中确定目标候选论元之后,将目标候选论元输入至目标故障识别模型的论元分类模块,获取论元分类模块输出的目标候选论元对应的目标属性类型;论元分类模块为基于第三训练样本训练得到,第三训练样本包括样本黄金论元和样本论元对应的样本属性定义文本;样本属性定义文本包括属性类型和属性类型对应的描述。
在一些实施例中,第六处理模块还可以用于:
将目标候选论元与训练好的第一论元角色表示矩阵进行点乘,获取各目标候选论元对应的第二类型得分;论元分类模块根据训练好的第一论元角色表示矩阵获得;
将大于第二目标阈值的第二类型得分对应的目标候选论元确定为最终论元,并将最终论元对应的属性类型确定目标属性类型。
在一些实施例中,该装置还可以包括第七处理模块,用于:
基于属性类型和属性类型对应的描述,构建初始论元角色表示矩阵;
随机初始化初始论元角色表示矩阵,获取第一论元角色表示矩阵;
以样本黄金论元与第一论元角色表示矩阵点乘后对应的第二类型得分最大值对应到正确的属性类型为目标,训练第一论元角色表示矩阵,获取论元分类模块。
本申请实施例中的基于对比学习对智慧楼宇故障事件抽取的故障确定装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,还可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的基于对比学习对智慧楼宇故障事件抽取的故障确定装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为IOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的基于对比学习对智慧楼宇故障事件抽取的故障确定装置能够实现图1至图6的方法实施例实现的各个过程,为避免重复,这里不再赘述。
在一些实施例中,如图8所示,本申请实施例还提供一种电子设备800,包括处理器801、存储器802及存储在存储器802上并可在处理器801上运行的计算机程序,该程序被处理器801执行时实现上述基于对比学习对智慧楼宇故障事件抽取的故障确定方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
本申请实施例还提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于对比学习对智慧楼宇故障事件抽取的故障确定方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述基于对比学习对智慧楼宇故障事件抽取的故障确定方法。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述基于对比学习对智慧楼宇故障事件抽取的故障确定方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本申请的实施例,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本申请的范围由权利要求及其等同物限定。

Claims (17)

1.一种基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,包括:
将待识别文本输入至目标故障识别模型的触发词提取模块,获取所述触发词提取模块输出的至少一个黄金触发词;
将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息;
其中,所述触发词提取模块为基于第一训练样本训练得到,所述第一训练样本包括样本文本和所述样本文本对应的样本黄金触发词和样本候选触发词;
所述触发词分类模块为基于第二训练样本训练得到,所述第二训练样本包括所述样本黄金触发词和与所述样本黄金触发词对应的样本故障定义文本;所述样本故障定义文本包括故障类型和所述故障类型对应的描述。
2.根据权利要求1所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述触发词提取模块为基于第一训练样本训练得到,包括:
采用对比学习的方法,基于所述第一训练样本训练所述触发词提取模块。
3.根据权利要求2所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述采用对比学习的方法,基于所述第一训练样本训练所述触发词提取模块,包括:
基于线性函数构建所述触发词提取模块对应的损失函数;所述线性函数用于表征各触发词对应的权重值;
以所述损失函数最小化为目标训练所述触发词提取模块;
所述损失函数为:
其中,Lt为所述损失函数;k为所述样本候选触发词的数量,为所述样本黄金触发词对应的权重值;/>为所述样本候选触发词对应的权重值。
4.根据权利要求3所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述线性函数基于如下步骤确定:
基于所述样本文本对应的token表示,获取所述样本文本的语义表示;
将所述样本文本的语义表示分别与所述样本黄金触发词和所述样本候选触发词的token表示拼接,获取所述样本黄金触发词的语义表示和所述样本候选触发词的语义表示;
以所述样本黄金触发词作为正锚点,以所述样本候选触发词作为负样本,基于所述样本黄金触发词的语义表示和所述样本候选触发词的语义表示构建所述线性函数。
5.根据权利要求1-4任一项所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述触发词分类模块为基于第二训练样本训练得到,包括:
基于所述故障类型和所述故障类型对应的描述,构建初始故障类型表示矩阵;
随机初始化所述初始故障类型表示矩阵,获取第一故障类型表示矩阵;
以所述样本黄金触发词与所述第一故障类型表示矩阵点乘后对应的第一类型得分最大值对应到正确的故障类型为目标,训练所述第一故障类型表示矩阵,获取所述触发词分类模块。
6.根据权利要求5所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述基于所述故障类型和所述故障类型对应的描述,构建初始故障类型表示矩阵,包括:
对所述故障类型和所述故障类型对应的描述进行Bert编码,获取故障类型语义表示;
基于各故障类型对应的故障类型语义表示,构建所述初始故障类型表示矩阵;所述初始故障类型表示矩阵的大小为N×H,其中,N为故障类型的个数,H为Bert模型[CLS]向量的大小。
7.根据权利要求1-4任一项所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述将待识别文本输入至目标故障识别模型的触发词提取模块,获取所述触发词提取模块输出的至少一个黄金触发词,包括:
对所述待识别文本进行关键词提取,获取多个触发词以及各所述触发词对应的权重值;
将最大的第一目标数量的权重值对应的触发词确定为所述至少一个黄金触发词。
8.根据权利要求1-4任一项所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息,包括:
将所述黄金触发词与训练好的第一故障类型表示矩阵进行点乘,获取各黄金触发词对应的第一类型得分;所述触发词分类模块根据所述训练好的第一故障类型表示矩阵获得;
将大于第一目标阈值的第一类型得分对应的黄金触发词确定为最终触发词,并基于所述最终触发词对应的故障类型确定所述目标故障信息。
9.根据权利要求1-4任一项所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,在所述将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息之后,所述方法还包括:
基于所述黄金触发词与所述待识别文本中各对象之间的依存关系,从所述待识别文本所包括的至少一个对象中确定目标候选论元。
10.根据权利要求9所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述基于所述黄金触发词与所述待识别文本中各对象之间的依存关系,从所述待识别文本所包括的至少一个对象中确定目标候选论元,包括:
对所述待识别文本进行分词及重组,获取多个词汇单元;
以所述多个词汇单元中所述黄金触发词为根节点构建所述黄金触发词对应的依存分析树,所述依存分析树包括至少一个子节点,各所述子节点对应有一个词汇单元;
将所述依存分析树中除所述根节点之外的所述子节点对应的词汇单元确定为目标候选论元。
11.根据权利要求9所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,在所述从所述待识别文本所包括的至少一个对象中确定目标候选论元之后,所述方法还包括:
将所述目标候选论元输入至目标故障识别模型的论元分类模块,获取所述论元分类模块输出的所述目标候选论元对应的目标属性类型;
所述论元分类模块为基于第三训练样本训练得到,所述第三训练样本包括样本黄金论元和所述样本论元对应的样本属性定义文本;所述样本属性定义文本包括属性类型和所述属性类型对应的描述。
12.根据权利要求11所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述将所述目标候选论元输入至目标故障识别模型的论元分类模块,获取所述论元分类模块输出的所述目标候选论元对应的目标属性类型,包括:
将所述目标候选论元与训练好的第一论元角色表示矩阵进行点乘,获取各目标候选论元对应的第二类型得分;所述论元分类模块根据所述训练好的第一论元角色表示矩阵获得;
将大于第二目标阈值的第二类型得分对应的目标候选论元确定为最终论元,并将所述最终论元对应的属性类型确定所述目标属性类型。
13.根据权利要求11所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法,其特征在于,所述论元分类模块为基于第三训练样本训练得到,包括:
基于所述属性类型和所述属性类型对应的描述,构建初始论元角色表示矩阵;
随机初始化所述初始论元角色表示矩阵,获取第一论元角色表示矩阵;
以所述样本黄金论元与所述第一论元角色表示矩阵点乘后对应的第二类型得分最大值对应到正确的属性类型为目标,训练所述第一论元角色表示矩阵,获取所述论元分类模块。
14.一种基于对比学习对智慧楼宇故障事件抽取的故障确定装置,其特征在于,包括:
第一处理模块,用于将待识别文本输入至目标故障识别模型的触发词提取模块,获取所述触发词提取模块输出的至少一个黄金触发词;
第二处理模块,用于将所述至少一个黄金触发词输入至所述目标故障识别模型的触发词分类模块,获取所述触发词分类模块输出的目标故障信息;
其中,所述触发词提取模块为基于第一训练样本训练得到,所述第一训练样本包括样本文本和所述样本文本对应的样本黄金触发词和样本候选触发词;
所述触发词分类模块为基于第二训练样本训练得到,所述第二训练样本包括所述样本黄金触发词和与所述样本黄金触发词对应的样本故障定义文本;所述样本故障定义文本包括故障类型和所述故障类型对应的描述。
15.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-13任一项所述基于对比学习对智慧楼宇故障事件抽取的故障确定方法。
16.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-13任一项所述的基于对比学习对智慧楼宇故障事件抽取的故障确定方法。
17.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-13任一项所述基于对比学习对智慧楼宇故障事件抽取的故障确定方法。
CN202310906670.9A 2023-07-24 2023-07-24 基于对比学习对智慧楼宇故障事件抽取的故障确定方法 Active CN116628210B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310906670.9A CN116628210B (zh) 2023-07-24 2023-07-24 基于对比学习对智慧楼宇故障事件抽取的故障确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310906670.9A CN116628210B (zh) 2023-07-24 2023-07-24 基于对比学习对智慧楼宇故障事件抽取的故障确定方法

Publications (2)

Publication Number Publication Date
CN116628210A true CN116628210A (zh) 2023-08-22
CN116628210B CN116628210B (zh) 2024-03-19

Family

ID=87636941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310906670.9A Active CN116628210B (zh) 2023-07-24 2023-07-24 基于对比学习对智慧楼宇故障事件抽取的故障确定方法

Country Status (1)

Country Link
CN (1) CN116628210B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032641A (zh) * 2019-02-14 2019-07-19 阿里巴巴集团控股有限公司 计算机执行的、利用神经网络进行事件抽取的方法及装置
CN110704598A (zh) * 2019-09-29 2020-01-17 北京明略软件系统有限公司 一种语句信息的抽取方法、抽取装置及可读存储介质
KR20210124938A (ko) * 2020-11-26 2021-10-15 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 이벤트 추출 방법, 장치, 전자 기기 및 저장 매체
US20210365306A1 (en) * 2020-05-21 2021-11-25 International Business Machines Corporation Unsupervised event extraction
CN113704476A (zh) * 2021-09-02 2021-11-26 中科雨辰科技有限公司 目标事件抽取数据处理系统
CN113761122A (zh) * 2021-05-19 2021-12-07 清华大学 一种事件抽取方法、相关装置、设备及存储介质
CN114841140A (zh) * 2022-04-27 2022-08-02 迈容智能科技(上海)有限公司 依存分析模型及基于依存分析的中文联合事件抽取方法
CN115455493A (zh) * 2022-08-02 2022-12-09 浙江工业大学 基于对比学习的图网络后门攻击防御方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032641A (zh) * 2019-02-14 2019-07-19 阿里巴巴集团控股有限公司 计算机执行的、利用神经网络进行事件抽取的方法及装置
CN110704598A (zh) * 2019-09-29 2020-01-17 北京明略软件系统有限公司 一种语句信息的抽取方法、抽取装置及可读存储介质
US20210365306A1 (en) * 2020-05-21 2021-11-25 International Business Machines Corporation Unsupervised event extraction
KR20210124938A (ko) * 2020-11-26 2021-10-15 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 이벤트 추출 방법, 장치, 전자 기기 및 저장 매체
CN113761122A (zh) * 2021-05-19 2021-12-07 清华大学 一种事件抽取方法、相关装置、设备及存储介质
CN113704476A (zh) * 2021-09-02 2021-11-26 中科雨辰科技有限公司 目标事件抽取数据处理系统
CN114841140A (zh) * 2022-04-27 2022-08-02 迈容智能科技(上海)有限公司 依存分析模型及基于依存分析的中文联合事件抽取方法
CN115455493A (zh) * 2022-08-02 2022-12-09 浙江工业大学 基于对比学习的图网络后门攻击防御方法

Also Published As

Publication number Publication date
CN116628210B (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
CN109697162B (zh) 一种基于开源代码库的软件缺陷自动检测方法
CN109117777B (zh) 生成信息的方法和装置
CN106095928B (zh) 一种事件类型识别方法及装置
US11847418B2 (en) Few-shot language model training and implementation
CN112634329B (zh) 一种基于时空与或图的场景目标活动预测方法及装置
CN110851641A (zh) 跨模态检索方法、装置和可读存储介质
CN113672931B (zh) 一种基于预训练的软件漏洞自动检测方法及装置
CN107526721B (zh) 一种对电商产品评论词汇的歧义消除方法及装置
CN112818888B (zh) 视频审核模型训练方法、视频审核方法及相关装置
CN111666766A (zh) 数据处理方法、装置和设备
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN113535949B (zh) 基于图片和句子的多模态联合事件检测方法
CN111931859A (zh) 一种多标签图像识别方法和装置
CN107291774B (zh) 错误样本识别方法和装置
CN112465144A (zh) 基于有限知识的多模态示范意图生成方法及装置
CN114328816A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN115168590A (zh) 文本特征提取方法、模型训练方法、装置、设备及介质
CN113836929A (zh) 命名实体识别方法、装置、设备及存储介质
CN116628210B (zh) 基于对比学习对智慧楼宇故障事件抽取的故障确定方法
CN112380861A (zh) 模型训练方法、装置及意图识别方法、装置
CN111460206A (zh) 图像处理方法、装置、电子设备和计算机可读存储介质
Duan et al. Attention enhanced ConvNet-RNN for Chinese vehicle license plate recognition
CN116433899A (zh) 图像分割方法、训练图像分割模型的方法及装置
CN116705034A (zh) 声纹特征提取方法、说话人识别方法、模型训练方法及装置
WO2023137903A1 (zh) 基于粗糙语义的回复语句确定方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant