CN116681074B - 数控系统误操作检测方法、装置、设备及存储介质 - Google Patents
数控系统误操作检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116681074B CN116681074B CN202310976707.5A CN202310976707A CN116681074B CN 116681074 B CN116681074 B CN 116681074B CN 202310976707 A CN202310976707 A CN 202310976707A CN 116681074 B CN116681074 B CN 116681074B
- Authority
- CN
- China
- Prior art keywords
- named entity
- text
- target
- result
- numerical control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 claims abstract description 132
- 238000001514 detection method Methods 0.000 claims abstract description 31
- 238000007689 inspection Methods 0.000 claims description 52
- 238000004590 computer program Methods 0.000 claims description 7
- 230000007257 malfunction Effects 0.000 claims description 3
- 238000003754 machining Methods 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 41
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种数控系统误操作检测方法、装置、设备及存储介质,涉及数控加工技术领域。方法包括:将待检测操作对应的操作日志文本输入至大语言模型中,进行命名实体提取,得到第一命名实体提取结果;基于大语言模型和预设本体结构对第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,基于检查结果得到第二命名实体提取结果,其中,本体结构中包括数控系统中各个操作概念的描述文本;获取数控操作手册中的各个候选文本,将第二命名实体提取结果和各个候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映待检测操作是否为误操作的误操作检测结果。本发明可以降低数控系统操作领域专门的语料收集成本。
Description
技术领域
本发明涉及数控加工技术领域,尤其涉及一种数控系统误操作检测方法、装置、设备及存储介质。
背景技术
数控系统的使用包括多种操作,而数控系统的操作日志中会记录操作人员对数控系统的操作,在现有技术中,可以通过对数控系统操作日志采用命名实体提取模型进行命名实体提取,根据命名实体提取结果和操作手册进行比对来检测是否产生了误操作。显然地,这种方法的误操作准确性与实体提取结果的准确性高度相关。但是,数控系统操作的名词具有很强的专业性,如果想要命名实体提取模型具备很高的准确度,那就需要大量的数控系统操作领域的语料训练出专门针对数控系统操作的命名实体提取模型,这需要很高的语料收集成本。
发明内容
本发明提供一种数控系统误操作检测方法、装置、设备及存储介质,用以解决现有技术中需要大量的数控操作领域的语料训练专门的命名实体提取模型,语料收集成本高的缺陷,实现无需训练专门针对数控操作领域的命名实体提取模型,无需语料收集成本的效果。
本发明提供一种数控系统误操作检测方法,包括:
读取数控系统中待检测操作对应的操作日志文本;
将所述操作日志文本输入至大语言模型中,通过所述大语言模型对所述操作日志文本进行命名实体提取,得到第一命名实体提取结果;
基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,所述目标检查结果反映所述第一命名实体提取结果中的各个命名实体是否为针对数控系统的操作的命名实体,基于所述目标检查结果得到第二命名实体提取结果,其中,所述本体结构中包括数控系统中各个操作概念的描述文本;
获取数控操作手册中的各个候选文本,将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,其中,所述候选文本对应的所述参考实体提取结果是基于所述大语言模型进行命名实体提取和检查后得到的。
根据本发明提供的一种数控系统误操作检测方法,所述读取数控系统中待检测操作对应的操作日志文本,包括:
读取所述数控系统的操作日志中待检测操作以及待检测操作前N个操作对应的文本作为待检测操作对应的所述操作日志文本;
所述获取数控操作手册中的各个候选文本,包括:
将所述数控操作手册中N+1个连续操作对应的文本作为所述候选文本。
根据本发明提供的一种数控系统误操作检测方法,所述本体结构包括多个层,所述本体结构的最顶层中包括各个所述操作概念的描述文本,所述本体结构的其他层中包括上一层的描述文本中包括的专业概念的描述文本,所述专业概念为数控系统领域的概念。
根据本发明提供的一种数控系统误操作检测方法,所述基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,包括:
将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本,所述目标文本为目标层以及所述目标层之前的文本,将所述检查文本输入至所述大语言模型中,获取所述大语言模型输出的中间检查结果,所述中间检查结果反映所述第一命名实体提取结果中目标命名实体的情况,所述目标命名实体不是针对数控系统的操作的命名实体,所述目标层的初始值为所述本体结构的最顶层;
更新所述目标层,更新后的所述目标层为更新前的所述目标层的下一层;
当所述中间检查结果中存在所述目标命名实体时,从所述第一命名实体提取结果中删除所述目标命名实体,并重复执行所述将所述第一命名实体提取结果与所述目标层中的文本填入至预设的检查模板中,得到检查文本的步骤,直至所述目标层不存在下一层;
当所述中间检查结果中不存在目标命名实体时,重复执行所述将所述第一命名实体提取结果与所述目标层中的文本填入至预设的检查模板中,得到检查文本的步骤,直至所述目标层不存在下一层。
根据本发明提供的一种数控系统误操作检测方法,所述将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本,包括:
当所述目标层的层数大于预设层数阈值时,将所述目标层以及所述目标层之前的文本中属于同一操作概念的文本作为一条所述目标文本;
将所述第一命名实体提取结果与一条所述目标文本填入至所述检查模板中,得到一条所述检查文本;
当所述目标层的层数小于所述预设层数阈值时,将所述目标层以及所述目标层之前的所有文本作为所述目标文本。
根据本发明提供的一种数控系统误操作检测方法,所述将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,包括:
获取所述第二命名实体提取结果分别与各个所述参考实体提取结果之间的相似度;
将对应的所述相似度最高的所述参考实体提取结果作为所述匹配结果;
当所述匹配结果对应的所述相似度低于预设阈值时,确定所述待检测操作为误操作。
根据本发明提供的一种数控系统误操作检测方法,所述基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果之后,所述方法还包括:
当所述待检测操作为误操作时,输出所述匹配结果对应的所述候选文本。
本发明还提供一种数控系统误操作检测装置,包括:
日志读取模块,用于读取数控系统中待检测操作对应的操作日志文本;
命名实体提取模块,用于将所述操作日志文本输入至大语言模型中,通过所述大语言模型对所述操作日志文本进行命名实体提取,得到第一命名实体提取结果;
命名实体检查模块,用于基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,所述目标检查结果反映所述第一命名实体提取结果中的各个命名实体是否为针对数控系统的操作的命名实体,基于所述目标检查结果得到第二命名实体提取结果,其中,所述本体结构中包括数控系统中各个操作概念的描述文本;
匹配模块,用于获取数控操作手册中的各个候选文本,将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,其中,所述候选文本对应的所述参考实体提取结果是基于所述大语言模型进行命名实体提取和检查后得到的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述数控系统误操作检测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述数控系统误操作检测方法。
本发明提供的数控系统误操作检测方法、装置、设备及存储介质,通过大语言模型先进行命名实体提取,再通过大语言模型以及数控系统操作领域的各个操作概念的描述文本,通过描述文本提供的信息弥补大语言模型中缺失的数控操作领域的专门知识,大语言模型可以通过提供的数控操作领域的专门知识来进一步判断提取出的命名实体是否为数控操作领域的实体,经过大语言模型命名实体提取、检查两轮操作来实现数控操作领域的命名实体识别,不需要训练专门的数控操作领域命名实体提取识别模型,降低了数控操作领域语料收集和标注成本。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的数控系统误操作检测方法的流程示意图;
图2是本发明提供的数控系统误操作检测装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图3描述本发明的数控系统误操作检测方法、装置、设备及存储介质。
本发明提供的数控系统误操作检测方法,可以是由电子设备执行,该电子设备可以是独立的设备,例如是各种计算机、移动终端、可穿戴式智能设备等,该电子设备也可以是嵌入式设备,设置在数控机床中。
如图1所示,本发明提供的数控系统误操作检测方法,包括步骤:
S100、读取数控系统中待检测操作对应的操作日志文本;
S200、将所述操作日志文本输入至大语言模型中,通过所述大语言模型对所述操作日志文本进行命名实体提取,得到第一命名实体提取结果;
S300、基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,所述目标检查结果反映所述第一命名实体提取结果中的各个命名实体是否为针对数控系统的操作的命名实体,基于所述目标检查结果得到第二命名实体提取结果,其中,所述本体结构中包括数控系统中各个操作概念的描述文本;
S400、获取数控手册中的各个候选文本,将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,其中,所述候选文本对应的所述参考实体提取结果是基于所述大语言模型进行命名实体提取和检查后得到的。
本发明通过大语言模型先进行命名实体提取,再通过大语言模型以及数控系统操作领域的各个操作概念的描述文本,通过描述文本提供的信息弥补大语言模型中缺失的数控操作领域的专门知识,大语言模型可以通过提供的数控操作领域的专门知识来进一步判断提取出的命名实体是否为数控操作领域的实体,经过大语言模型命名实体提取、检查两轮操作来实现数控操作领域的命名实体识别,不需要训练专门的数控操作领域命名实体提取识别模型,降低了数控操作领域语料收集和标注成本。
数控操作具有连续性,为了提升误操作检测的准确性,本发明提供的方法中,将待检测操作的前序多个操作一同作为检测基础。具体地说,所述读取数控系统中待检测操作对应的操作日志文本,包括:
读取所述数控系统的操作日志中待检测操作以及待检测操作前N个操作对应的文本作为待检测操作对应的所述操作日志文本;
所述获取数控操作手册中的各个候选文本,包括:
将所述数控操作手册中N+1个连续操作对应的文本作为所述候选文本。
大语言模型(Large Language Model,LLM),是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义,大语言模型可用于处理多种自然语言任务。但是由于训练大语言模型的文本数据并不是针对某一专门领域的文本数据,因此,大语言模型在针对专门领域的语料的处理能力上存在不足。本发明提供的方法中,为了降低对数控操作领域的语料的收集、标注和训练成本,采用大语言模型的自然语言任务处理能力对数控系统的操作日志文本和操作手册文本进行命名实体提取,基于命名实体提取的结果来实现误操作的检测,而发明人经过实验发现,大语言模型在对于专利领域文本的命名实体提取任务中产生的错误主要是假阳性错误(false positives),即会把非关键的文字识别为实体。为了应对大语言模型在处理专门领域文本方面不足,提升误操作检测的准确性,本发明提供的方法,还预先构建数控操作领域的本体结构,所述本体结构中包括数控系统中各个操作概念的描述文本,利用本体结构给大语言模型提供数控操作领域的专业知识。在大语言模型第一轮提取出命名实体后,再将所述本体结构中的描述文本和第一轮提取出的命名实体提供给大语言模型,让大语言模型基于提供的信息执行检查任务,判断提取出的命名实体是否与描述文本相符合。
具体来说,所述本体结构包括多个层,所述本体结构的最顶层中包括各个所述操作概念的描述文本,所述本体结构的其他层中包括上一层的描述文本中包括的专业概念的描述文本,所述专业概念为数控系统领域的概念。所述本体结构中的描述文本采用逻辑语言,无歧义性,可以有效提升大语言模型的检查准确性。
所述基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,包括:
将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本,所述目标文本为目标层以及所述目标层之前的文本,将所述检查文本输入至所述大语言模型中,获取所述大语言模型输出的中间检查结果,所述中间检查结果反映所述第一命名实体提取结果中目标命名实体的情况,所述目标命名实体不是针对数控系统的操作的命名实体,所述目标层的初始值为所述本体结构的最顶层;
更新所述目标层,更新后的所述目标层为更新前的所述目标层的下一层;
当所述中间检查结果中存在所述目标命名实体时,从所述第一命名实体提取结果中删除所述目标命名实体,并重复执行所述将所述第一命名实体提取结果与所述目标层中的文本填入至预设的检查模板中,得到检查文本的步骤,直至所述目标层不存在下一层;
当所述中间检查结果中不存在目标命名实体时,重复执行所述将所述第一命名实体提取结果与所述目标层中的文本填入至预设的检查模板中,得到检查文本的步骤,直至所述目标层不存在下一层。
将所述第一命名实体和所述本体结构中的文本填入至预设的模板中,例如“已知数控系统领域的概念有xxx,那么xxx是否为该领域的关键实体”,得到检查文本,将检查文本输入至所述大语言模型中,以使得所述大语言模型能够基于输入的专业知识来进行专业命名实体的检查。
所述将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本,包括:
当所述目标层的层数大于预设层数阈值时,将所述目标层以及所述目标层之前的文本中属于同一操作概念的文本作为一条所述目标文本;
将所述第一命名实体提取结果与一条所述目标文本填入至所述检查模板中,得到一条所述检查文本;
当所述目标层的层数小于所述预设层数阈值时,将所述目标层以及所述目标层之前的所有文本作为所述目标文本。
对数控系统中的操作相关的各个概念都进行描述的文本可能会很多,而大语言模型中可以处理的文本字数有限,为了克服这个困难,本发明提供的方法,对本体结构进行分层,逐层进行检查,在粗概念的描述文本中已经可以判断出不是数控系统操作的命名实体时,就将其删除,降低模型计算量。所述本体结构的层数越多,对应的概念越细,描述的文本越多,因此,本发明提供的方法中,在层数达到预设层数阈值时,将同属于一个粗概念下的细分概念的描述文本提取出来,单独与所述第一命名实体提取结果组合得到所述检查文本,降低每次输入至所述大语言模型中的文本的字数。
在遍历完所述本体结构中的每一层之后,将最新的所述第一命名实体提取结果作为所述第二命名实体提取结果。
对于数控系统操作手册中的各个候选文本,也可以采用前文的方法,利用大语言模型先进行命名实体提取,再结合所述本体结构进行检查,得到每个所述候选文本对应的所述参考实体提取结果。
所述将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,包括:
获取所述第二命名实体提取结果分别与各个所述参考实体提取结果之间的相似度;
将对应的所述相似度最高的所述参考实体提取结果作为所述匹配结果;
当所述匹配结果对应的所述相似度低于预设阈值时,确定所述待检测操作为误操作。
分别计算所述第二命名实体提取结果与各个所述参考实体提取结果之间的相似度,将相似度最高的所述参考实体提取结果对应的所述候选文本是所述待检测操作对应的正确操作,如果所述匹配结果对应的所述相似度低于预设阈值,那么说明所述待检测操作与对应的正确操作差异过大,此时可以确定所述待检测操作为误操作。
所述基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果之后,所述方法还包括:
当所述待检测操作为误操作时,输出所述匹配结果对应的所述候选文本。
当确定所述待检测操作为误操作时,将操作手册中对应的正确操作的文本输出,可以输出至显示设备,以使得操作人员确认正确操作应该是什么样的,及时予以更正。
下面对本发明提供的数控系统误操作检测装置进行描述,下文描述的数控系统误操作检测装置与上文描述的数控系统误操作检测方法可相互对应参照。
如图2所示,本发明提供的数控系统误操作检测装置包括:
日志读取模块210,用于读取数控系统中待检测操作对应的操作日志文本;
命名实体提取模块220,用于将所述操作日志文本输入至大语言模型中,通过所述大语言模型对所述操作日志文本进行命名实体提取,得到第一命名实体提取结果;
命名实体检查模块230,用于基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,所述目标检查结果反映所述第一命名实体提取结果中的各个命名实体是否为针对数控系统的操作的命名实体,基于所述目标检查结果得到第二命名实体提取结果,其中,所述本体结构中包括数控系统中各个操作概念的描述文本;
匹配模块240,用于获取数控操作手册中的各个候选文本,将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,其中,所述候选文本对应的所述参考实体提取结果是基于所述大语言模型进行命名实体提取和检查后得到的。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行数控系统误操作检测方法,该方法包括:读取数控系统中待检测操作对应的操作日志文本;
将所述操作日志文本输入至大语言模型中,通过所述大语言模型对所述操作日志文本进行命名实体提取,得到第一命名实体提取结果;
基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,所述目标检查结果反映所述第一命名实体提取结果中的各个命名实体是否为针对数控系统的操作的命名实体,基于所述目标检查结果得到第二命名实体提取结果,其中,所述本体结构中包括数控系统中各个操作概念的描述文本;
获取数控操作手册中的各个候选文本,将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,其中,所述候选文本对应的所述参考实体提取结果是基于所述大语言模型进行命名实体提取和检查后得到的。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的数控系统误操作检测方法,该方法包括:读取数控系统中待检测操作对应的操作日志文本;
将所述操作日志文本输入至大语言模型中,通过所述大语言模型对所述操作日志文本进行命名实体提取,得到第一命名实体提取结果;
基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,所述目标检查结果反映所述第一命名实体提取结果中的各个命名实体是否为针对数控系统的操作的命名实体,基于所述目标检查结果得到第二命名实体提取结果,其中,所述本体结构中包括数控系统中各个操作概念的描述文本;
获取数控操作手册中的各个候选文本,将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,其中,所述候选文本对应的所述参考实体提取结果是基于所述大语言模型进行命名实体提取和检查后得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种数控系统误操作检测方法,其特征在于,包括:
读取数控系统中待检测操作对应的操作日志文本;
将所述操作日志文本输入至大语言模型中,通过所述大语言模型对所述操作日志文本进行命名实体提取,得到第一命名实体提取结果;
基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,所述目标检查结果反映所述第一命名实体提取结果中的各个命名实体是否为针对数控系统的操作的命名实体,基于所述目标检查结果得到第二命名实体提取结果,其中,所述本体结构中包括数控系统中各个操作概念的描述文本;
获取数控操作手册中的各个候选文本,将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,其中,所述候选文本对应的所述参考实体提取结果是基于所述大语言模型进行命名实体提取和检查后得到的;
所述本体结构包括多个层,所述本体结构的最顶层中包括各个所述操作概念的描述文本,所述本体结构的其他层中包括上一层的描述文本中包括的专业概念的描述文本,所述专业概念为数控系统领域的概念;
所述基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,包括:
将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本,所述目标文本为目标层以及所述目标层之前的文本,将所述检查文本输入至所述大语言模型中,获取所述大语言模型输出的中间检查结果,所述中间检查结果反映所述第一命名实体提取结果中目标命名实体的情况,所述目标命名实体不是针对数控系统的操作的命名实体,所述目标层的初始值为所述本体结构的最顶层;
更新所述目标层,更新后的所述目标层为更新前的所述目标层的下一层;
当所述中间检查结果中存在所述目标命名实体时,从所述第一命名实体提取结果中删除所述目标命名实体,并重复执行所述将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本的步骤,直至所述目标层不存在下一层;
当所述中间检查结果中不存在目标命名实体时,重复执行所述将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本的步骤,直至所述目标层不存在下一层。
2.根据权利要求1所述的数控系统误操作检测方法,其特征在于,所述读取数控系统中待检测操作对应的操作日志文本,包括:
读取所述数控系统的操作日志中待检测操作以及待检测操作前N个操作对应的文本作为待检测操作对应的所述操作日志文本;
所述获取数控操作手册中的各个候选文本,包括:
将所述数控操作手册中N+1个连续操作对应的文本作为所述候选文本。
3.根据权利要求1所述的数控系统误操作检测方法,其特征在于,所述将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本,包括:
当所述目标层的层数大于预设层数阈值时,将所述目标层以及所述目标层之前的文本中属于同一操作概念的文本作为一条所述目标文本;
将所述第一命名实体提取结果与一条所述目标文本填入至所述检查模板中,得到一条所述检查文本;
当所述目标层的层数小于所述预设层数阈值时,将所述目标层以及所述目标层之前的所有文本作为所述目标文本。
4.根据权利要求1所述的数控系统误操作检测方法,其特征在于,所述将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,包括:
获取所述第二命名实体提取结果分别与各个所述参考实体提取结果之间的相似度;
将对应的所述相似度最高的所述参考实体提取结果作为所述匹配结果;
当所述匹配结果对应的所述相似度低于预设阈值时,确定所述待检测操作为误操作。
5.根据权利要求4所述的数控系统误操作检测方法,其特征在于,所述基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果之后,所述方法还包括:
当所述待检测操作为误操作时,输出所述匹配结果对应的所述候选文本。
6.一种数控系统误操作检测装置,其特征在于,包括:
日志读取模块,用于读取数控系统中待检测操作对应的操作日志文本;
命名实体提取模块,用于将所述操作日志文本输入至大语言模型中,通过所述大语言模型对所述操作日志文本进行命名实体提取,得到第一命名实体提取结果;
命名实体检查模块,用于基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,所述目标检查结果反映所述第一命名实体提取结果中的各个命名实体是否为针对数控系统的操作的命名实体,基于所述目标检查结果得到第二命名实体提取结果,其中,所述本体结构中包括数控系统中各个操作概念的描述文本;
匹配模块,用于获取数控操作手册中的各个候选文本,将所述第二命名实体提取结果和各个所述候选文本分别对应的参考实体提取结果进行匹配,基于匹配结果得到反映所述待检测操作是否为误操作的误操作检测结果,其中,所述候选文本对应的所述参考实体提取结果是基于所述大语言模型进行命名实体提取和检查后得到的;
所述本体结构包括多个层,所述本体结构的最顶层中包括各个所述操作概念的描述文本,所述本体结构的其他层中包括上一层的描述文本中包括的专业概念的描述文本,所述专业概念为数控系统领域的概念;
所述基于所述大语言模型和预设本体结构对所述第一命名实体提取结果中的命名实体进行检查,获取目标检查结果,包括:
将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本,所述目标文本为目标层以及所述目标层之前的文本,将所述检查文本输入至所述大语言模型中,获取所述大语言模型输出的中间检查结果,所述中间检查结果反映所述第一命名实体提取结果中目标命名实体的情况,所述目标命名实体不是针对数控系统的操作的命名实体,所述目标层的初始值为所述本体结构的最顶层;
更新所述目标层,更新后的所述目标层为更新前的所述目标层的下一层;
当所述中间检查结果中存在所述目标命名实体时,从所述第一命名实体提取结果中删除所述目标命名实体,并重复执行所述将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本的步骤,直至所述目标层不存在下一层;
当所述中间检查结果中不存在目标命名实体时,重复执行所述将所述第一命名实体提取结果与所述本体结构中的目标文本填入至预设的检查模板中,得到检查文本的步骤,直至所述目标层不存在下一层。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述数控系统误操作检测方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述数控系统误操作检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310976707.5A CN116681074B (zh) | 2023-08-04 | 2023-08-04 | 数控系统误操作检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310976707.5A CN116681074B (zh) | 2023-08-04 | 2023-08-04 | 数控系统误操作检测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116681074A CN116681074A (zh) | 2023-09-01 |
CN116681074B true CN116681074B (zh) | 2024-04-05 |
Family
ID=87784126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310976707.5A Active CN116681074B (zh) | 2023-08-04 | 2023-08-04 | 数控系统误操作检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116681074B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008462A (zh) * | 2018-01-05 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种命令序列检测方法及命令序列处理方法 |
CN112101032A (zh) * | 2020-08-31 | 2020-12-18 | 广州探迹科技有限公司 | 一种基于自蒸馏的命名实体识别与纠错方法 |
CN112633001A (zh) * | 2020-12-28 | 2021-04-09 | 咪咕文化科技有限公司 | 文本命名实体识别方法、装置、电子设备及存储介质 |
CN114781384A (zh) * | 2022-05-10 | 2022-07-22 | 深圳壹账通智能科技有限公司 | 命名实体智能标注方法、装置、设备及存储介质 |
-
2023
- 2023-08-04 CN CN202310976707.5A patent/CN116681074B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008462A (zh) * | 2018-01-05 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种命令序列检测方法及命令序列处理方法 |
CN112101032A (zh) * | 2020-08-31 | 2020-12-18 | 广州探迹科技有限公司 | 一种基于自蒸馏的命名实体识别与纠错方法 |
CN112633001A (zh) * | 2020-12-28 | 2021-04-09 | 咪咕文化科技有限公司 | 文本命名实体识别方法、装置、电子设备及存储介质 |
CN114781384A (zh) * | 2022-05-10 | 2022-07-22 | 深圳壹账通智能科技有限公司 | 命名实体智能标注方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于本体的汉语领域命名实体识别;史树敏 等;情报学报;第28卷(第6期);第857-863页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116681074A (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112016304A (zh) | 文本纠错方法、装置、电子设备及存储介质 | |
CN110457302B (zh) | 一种结构化数据智能清洗方法 | |
CN111144548B (zh) | 抽油机井工况的识别方法及装置 | |
CN110674396B (zh) | 文本信息处理方法、装置、电子设备及可读存储介质 | |
CN110555206A (zh) | 一种命名实体识别方法、装置、设备及存储介质 | |
CN110825827B (zh) | 一种实体关系识别模型训练、实体关系识别方法及装置 | |
CN110489423B (zh) | 一种信息抽取的方法、装置、存储介质及电子设备 | |
CN112101032A (zh) | 一种基于自蒸馏的命名实体识别与纠错方法 | |
CN113343677A (zh) | 一种意图识别方法、装置、电子设备及存储介质 | |
CN116681074B (zh) | 数控系统误操作检测方法、装置、设备及存储介质 | |
CN113705164A (zh) | 一种文本处理方法、装置、计算机设备以及可读存储介质 | |
CN116775639A (zh) | 数据处理方法、存储介质及电子设备 | |
CN114970490A (zh) | 一种文本标注数据的质检方法、装置、电子设备以及存储介质 | |
CA3156204A1 (en) | Domain based text extraction | |
US20110172991A1 (en) | Sentence extracting method, sentence extracting apparatus, and non-transitory computer readable record medium storing sentence extracting program | |
CN113609279A (zh) | 一种物料型号提取方法、装置及计算机设备 | |
CN111428005A (zh) | 标准问答对确定方法、装置及电子设备 | |
CN111782601A (zh) | 电子文件的处理方法、装置、电子设备及机器可读介质 | |
CN110781072A (zh) | 基于机器学习的代码审核方法、装置、设备及存储介质 | |
CN116187313B (zh) | 基于自然语言处理技术的电力操作票设备识别与勘误方法 | |
CN111476037B (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
CN112395865B (zh) | 报关单校验方法及装置 | |
CN115758135B (zh) | 轨道交通信号系统功能需求追溯方法、装置及电子设备 | |
CN114357996B (zh) | 时序文本特征提取方法、装置、电子设备及存储介质 | |
CN111737988B (zh) | 一种复述句识别的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |