CN116910175B - 自动化移动设备故障层级树构建方法、装置及储存介质 - Google Patents

自动化移动设备故障层级树构建方法、装置及储存介质 Download PDF

Info

Publication number
CN116910175B
CN116910175B CN202311174976.6A CN202311174976A CN116910175B CN 116910175 B CN116910175 B CN 116910175B CN 202311174976 A CN202311174976 A CN 202311174976A CN 116910175 B CN116910175 B CN 116910175B
Authority
CN
China
Prior art keywords
fault
information
cluster
phenomenon
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311174976.6A
Other languages
English (en)
Other versions
CN116910175A (zh
Inventor
钟昊阳
陆璐
汪烜烨
万童
邹全义
冼允廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Provincial Laboratory Of Artificial Intelligence And Digital Economy Guangzhou
South China University of Technology SCUT
Original Assignee
Guangdong Provincial Laboratory Of Artificial Intelligence And Digital Economy Guangzhou
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Provincial Laboratory Of Artificial Intelligence And Digital Economy Guangzhou, South China University of Technology SCUT filed Critical Guangdong Provincial Laboratory Of Artificial Intelligence And Digital Economy Guangzhou
Priority to CN202311174976.6A priority Critical patent/CN116910175B/zh
Publication of CN116910175A publication Critical patent/CN116910175A/zh
Application granted granted Critical
Publication of CN116910175B publication Critical patent/CN116910175B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

针对故障报告无任何标注,同时因为涉及到的故障种类繁多,难以找到合适的规则进行处理的问题,本发明提供公开了自动化移动设备故障层级树构建方法、装置及储存介质,该方法首先汇总多渠道反馈的故障报告,提取报告中不同的故障现象;其次利用新词发现和中文词性对故障现象进行切割操作得到故障节点列表,使用SimCSE预训练模型对故障节点列表完成句子嵌入处理;最后使用社区检测算法并对故障句子完成聚类操作并构建对应的层级故障树。本发明基于中文词性和新词发现算法切割故障现象可以得到较清晰的故障层级关系,通过社区检测算法聚集故障簇并将每个故障簇内信息可视化至Excel表格方便后续测试人员分析故障信息。

Description

自动化移动设备故障层级树构建方法、装置及储存介质
技术领域
本发明涉及一种实体抽取技术领域,具体涉及一种基于无监督聚类的自动化移动设备故障层级树构建方法、装置及存储介质。
背景技术
实体抽取的方法分为3类:基于规则的方法、基于统计机器学习的方法、基于深度学习的方法。
早期的实体抽取是在限定文本领域、限定语义单元类型的条件下进行的,主要采用的是基于规则与词典的方法,例如使用已定义的规则,抽取出文本中的人名、地名、组织机构名、特定时间等实体。选用的特征包括统计信息、标点符号、关键字、指示词和方向词、中心词等方法,以模式和字符串相匹配为主要手段。
基于统计机器学习的方法主要包括隐马尔可夫模型(HiddenMarkovMode,HMM)、最大熵(MaxmiumEntropy,ME)、支持向量机(Support VectorMachine,SVM)、条件随机场(ConditionalRandom Fields,CRF)等。在基于统计的这四种学习方法中,最大熵模型结构紧凑,具有较好的通用性,主要缺点是训练时间长复杂性高,有时甚至导致训练代价难以承受,另外由于需要明确的归一化计算,导致开销比较大。而条件随机场为命名实体识别提供了一个特征灵活、全局最优的标注框架,但同时存在收敛速度慢、训练时间长的问题。一般说来,最大熵和支持向量机在正确率上要比隐马尔可夫模型高一些,但隐马尔可夫模型在训练和识别时的速度要快一些,主要是由于在利用 Viterbi 算法求解命名实体类别序列时的效率较高。隐马尔可夫模型更适用于一些对实时性有要求以及像信息检索这样需要处理大量文本的应用,如短文本命名实别。
基于深度学习的方法利用深度学习非线性的特点,从输入到输出建立非线性的映射。相比于线性模型(如线性链式CRF、隐马尔可夫模型),深度学习模型可以利用巨量数据通过非线性激活函数学习得到更加复杂精致的特征。传统的基于特征的方法需要大量的工程技巧与领域知识;而深度学习方法可以从输入中自动发掘信息以及学习信息的表示,而且通常这种自动学习并不意味着更差的结果。深度NER模型是端到端的;端到端模型的一个好处在于可以避免流水线(pipeline)类模型中模块之间的误差传播;另一点是端到端的模型可以承载更加复杂的内部设计,最终产出更好的结果。目前常用的方法为BiLSTM+CRF组合的结构进行标签预测。BiLSTM+CRF 是目前比较流行的序列标注算法,其将 BiLSTM 和CRF 结合在一起,使模型即可以像 CRF 一样考虑序列前后之间的关联性,又可以拥有LSTM 的特征抽取及拟合能力。
现有基于规则的方法需要大量的人工工作来创建所有可能的规则,必须为每个关系类型创建规则。基于机器学习和深度学习的方法大多对数据有较高要求,需要标注大量的数据。
发明内容
针对故障报告无任何标注,同时因为涉及到的故障种类繁多,难以找到合适的规则进行处理的问题,本发明提供一种基于无监督聚类的自动化移动设备故障层级树构建方法、装置及存储介质。
为实现上述目的,本发明的技术方案是:
第一方面,本发明提供一种自动化移动设备故障层级树构建方法,所述方法包括如下步骤:
步骤101、分析故障信息报告,提取出不同的故障现象内容,得到故障现象列表;
步骤102、遍历所有的故障现象列表,对每个故障现象内容按中文词性进行分割,去除冗余的噪声信息,得到对应的故障节点列表;同时,利用信息熵和互信息进行新词发现生成移动设备故障领域的专业新词库,在切割故障现象内容时保持专业新词完整;
步骤103、使用SimCSE预训练模型对故障节点列表进行句子嵌入处理,得到句子向量;
步骤104、使用社区检测算法对句子向量进行聚类处理,得到故障簇;
步骤105、根据每个故障簇内信息构建故障树,并导出生成的故障树可视化展示。
进一步地,在步骤102和103之间还包括步骤:
步骤102’、对故障节点列表中的单个动词节点以及与单个动词节点相邻的名词节点合并,并去除列表中的特殊符号,所述特殊符号包括标点符号、空字符。
进一步地,所述分析故障信息报告,提取出不同的故障现象内容包括:
根据从用户、开发人员、供应商反馈得到的故障信息汇总故障报告;
利用正则表达式提取故障报告中和故障现象有关的信息,初步过滤部分无关的故障噪声数据。
进一步地,所述使用SimCSE预训练模型对故障节点列表进行句子嵌入处理,得到句子向量,包括:
对于给定一个故障节点列表,SimCSE模型使用独立的dropout作为掩码来获得增强的正样本对;
样本的嵌入向量生成表示为,其中/>是随机的dropout掩码;
SimCSE模型通过将相同的样本输入编码器,并应用不同的dropout掩码,获得相同样本的不同增强样本。
进一步地,最终的对比损失函数为:
进一步地,所述使用社区检测算法对句子向量进行聚类处理,得到故障簇,包括:
通过社区检测算法结合余弦相似度匹配方法对故障节点列表完成聚类操作,将具有相同故障特征的故障节点列表聚集在一个故障簇中;
引入余弦相似度将社区检测算法产生的散乱句子和大簇的平均向量比较相似度,根据相似度的大小将散乱的句子归类到合适的簇中。
进一步地,所述余弦相似度表达式为:
A代表散乱句子的特征向量,B代表故障大簇的代表特征向量。
进一步地,所述根据每个故障簇内信息构建故障树,并导出生成的故障树可视化展示,包括:
根据故障簇内的节点列表内容构建成一颗包含所有故障节点的故障等级树,从故障树根节点到某个子节点的路径即为单条故障现象内容;
依次将不同故障簇对应的故障树导出至Excel可视化展示。
第二方面,本发明提供一种自动化移动设备故障层级树构建装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上任一所述方法的步骤。
第三方面发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上任一所述方法的步骤。
本发明与现有技术相比,其有益效果在于:
本发明基于中文词性和新词发现切割故障现象可以得到较清晰的故障层级关系,通过社区检测算法聚集故障簇并将每个故障簇内信息可视化展示,方便后续测试人员分析故障信息。
附图说明
图1为本发明实施例1提供的自动化移动设备故障层级树构建方法流程图;
图2为本发明实施例1提供的自动化移动设备故障层级树构建方法流程图;
图3为本发明实施例2提供的自动化移动设备故障层级树构建装置组成示意图。
具体实施方式
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1:
参阅图1所示,本实施例提供的自动化移动设备故障层级树构建方法主要包括如下步骤:
步骤101、分析故障信息报告,提取出不同的故障现象内容,得到故障现象列表。
步骤102、遍历所有的故障现象列表,对每个故障现象内容按中文词性进行分割,去除冗余的噪声信息,得到对应的故障节点列表;同时,利用信息熵和互信息进行新词发现生成移动设备故障领域的专业新词库,在切割故障现象内容时保持专业新词完整。
也就是说,在此步骤中,按照中文词性和新词发现对节点列表进行层级切割,最终按照故障层次等级逐层递进故障信息。
步骤103、使用SimCSE预训练模型对故障节点列表进行句子嵌入处理,得到句子向量。
步骤104、使用社区检测算法对句子向量进行聚类处理,得到故障簇。
在此步骤中,通过使用社区检测算法对经过句子嵌入的故障信息进行聚类操作,整个过程基于无监督技术,不需要任何人工标签。
步骤105、根据每个故障簇内信息构建故障树,并导出生成的故障树可视化展示。
也就是说,在此步骤中,完成故障聚类之后,将得到的单个故障簇内的信息构建为一颗故障多叉树,给予测试人员清晰的故障可视化展示。
由此可见,本方法基于中文词性和新词发现切割故障现象可以得到较清晰的故障层级关系,通过社区检测算法聚集故障簇并将每个故障簇内信息可视化展示,方便后续测试人员分析故障信息。
由于分割后的故障列表中包含大量的单个动词节点,单个的动词节点无法准确表示故障信息,为此在一优选实施例中,如图2所示,在步骤102和103之间还包括步骤:
步骤102’、对故障节点列表中的单个动词节点以及与单个动词节点相邻的名词节点合并,以获得更丰富的故障节点表示;
另外,由于切割操作不可避免的会产生大量单个的特殊符号:标点符号、空字符等,为此在此步骤中,还利用正则表达式清理故障节点列表中的这些特殊符号。
在一具体实施例中,上述步骤101包括:
(1)根据从用户、开发人员、供应商等反馈得到的故障信息汇总故障报告。
(2)利用正则表达式提取故障报告中和故障现象有关的信息,初步过滤到一些其他无关的故障噪声数据。
在一具体实施例中,上述步骤103包括:
使用SimCSE预训练模型对收集到的节点列表进行句子嵌入处理得到句子向量的过程如下:对于给定一个故障节点列表,另/>,SimCSE模型使用独立的dropout作为掩码来进一步获得增强的正样本对。在标准的Transformer训练过程中会有多个dropout掩码,因此样本的嵌入向量生成表示为/>,其中/>是随机的dropout掩码。SimCSE通过将相同的样本输入编码器,并应用不同的dropout掩码/>,从而获得相同样本的不同增强样本,样本与不同增强样本最终的对比损失函数如下所示,
其中,表示初始样本,/>表示增强样本,/>表示对数,/>表示自然常数,/>表示样本数量,表示余弦相似度函数。
在一具体实施例中,上述步骤104包括:
使用社区检测算法对故障句子进行聚类操作,在实际使用中根据故障报告信息调整相似度阈值以及单个故障簇内的最少故障信息数量以达到更好的效果。
尽管设置了单个故障簇内最少故障信息数量,但社区检测算法仍会产生很多零碎句子,引入余弦相似度将产生的散乱句子和大簇的代表向量比较相似度,根据相似度的大小将散乱的句子归类到合适的簇中,其中故障大簇的代表向量通过取簇内所有向量平均值得到。其中,余弦相似度表达式为:
A代表散乱句子的特征向量,B代表故障大簇的代表特征向量。
在一具体实施例中,上述步骤105包括:
根据故障簇内的节点列表内容构建成一颗包含所有故障节点的故障等级树,从故障树根节点到某个子节点的路径即为单条故障现象内容。
依次将不同故障簇对应的故障树导出至Excel可视化展示。
综上,本发明与现有技术相比,具有如下优点和有益效果:
1、本发明使用社区检测算法对经过句子嵌入的故障信息进行聚类操作,整个过程基于无监督技术,不需要任何人工标签。
2、本发明按照中文词性和新词发现算法对节点列表进行层级切割,最终按照故障层次等级逐层递进故障信息。
3、完成故障聚类之后,将得到的单个故障簇内的信息构建为一颗故障多叉树,最终导出成Excel表格,给予测试人员清晰的故障可视化展示。
实施例2:
参阅图3所示,本实施例提供的自动化移动设备故障层级树构建装置包括处理器31、存储器32以及存储在该存储器32中并可在所述处理器31上运行的计算机程序33,例如自动化移动设备故障层级树构建程序。该处理器31执行所述计算机程序33时实现上述实施例1步骤,例如图1所示的步骤。
示例性的,所述计算机程序33可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器32中,并由所述处理器31执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序33在所述自动化移动设备故障层级树构建装置中的执行过程。
所述自动化移动设备故障层级树构建装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述自动化移动设备故障层级树构建装置可包括,但不仅限于,处理器31、存储器32。本领域技术人员可以理解,图3仅仅是自动化移动设备故障层级树构建装置的示例,并不构成自动化移动设备故障层级树构建装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述自动化移动设备故障层级树构建装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器31可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC) 、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器32可以是所述自动化移动设备故障层级树构建装置的内部存储元,例如自动化移动设备故障层级树构建装置的硬盘或内存。所述存储器32也可以是所述自动化移动设备故障层级树构建装置的外部存储设备,例如所述自动化移动设备故障层级树构建装置上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器32还可以既包括所述自动化移动设备故障层级树构建装置的内部存储单元也包括外部存储设备。所述存储器32用于存储所述计算机程序以及所述自动化移动设备故障层级树构建装置所需的其他程序和数据。所述存储器32还可以用于暂时地存储已经输出或者将要输出的数据。
实施例3:
本实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现实施例1所述方法的步骤。
所示计算机可读介质可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理再以电子方式获得所述程序,然后将其存储在计算机存储器中。
上述实施例只是为了说明本发明的技术构思及特点,其目的是在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡是根据本发明内容的实质所做出的等效的变化或修饰,都应涵盖在本发明的保护范围内。

Claims (4)

1.一种自动化移动设备故障层级树构建方法,其特征在于,所述方法包括如下步骤:
步骤101、分析故障信息报告,提取出不同的故障现象内容,得到故障现象列表;
步骤102、遍历所有的故障现象列表,对每个故障现象内容按中文词性进行分割,去除冗余的噪声信息,得到对应的故障节点列表;同时,利用信息熵和互信息进行新词发现生成移动设备故障领域的专业新词库,在切割故障现象内容时保持专业新词完整;
步骤103、使用SimCSE预训练模型对故障节点列表进行句子嵌入处理,得到句子向量;
步骤104、使用社区检测算法对句子向量进行聚类处理,得到故障簇;
步骤105、根据每个故障簇内信息构建故障树,并导出生成的故障树可视化展示;
所述分析故障信息报告,提取出不同的故障现象内容包括:
根据从用户、开发人员、供应商反馈得到的故障信息汇总故障报告;
利用正则表达式提取故障报告中和故障现象有关的信息,初步过滤部分无关的故障噪声数据;
所述使用SimCSE预训练模型对故障节点列表进行句子嵌入处理,得到句子向量,包括:
对于给定一个故障节点列表{X i } m X + i =X i ,SimCSE模型使用独立的dropout作为掩码来获得增强的正样本对;
样本的嵌入向量生成表示为h z i =f θ (x i ,z),其中z是随机的dropout掩码;
SimCSE模型通过将相同的样本输入编码器,并应用不同的dropout掩码z、z’,获得相同样本的不同增强样本;
样本与不同增强样本最终的对比损失函数如下所示,
其中,hi表示初始样本,hj表示增强样本,log表示对数,e表示自然常数,N表示样本数量,sim表示余弦相似度函数;
所述使用社区检测算法对句子向量进行聚类处理,得到故障簇,包括:
通过社区检测算法结合余弦相似度匹配方法对故障节点列表完成聚类操作,将具有相同故障特征的故障节点列表聚集在一个故障簇中;
引入余弦相似度将社区检测算法产生的散乱句子和大簇的平均向量比较相似度,根据相似度的大小将散乱的句子归类到合适的簇中;
所述余弦相似度表达式为:
(2);
A代表散乱句子的特征向量,B代表故障大簇的代表特征向量;
所述根据每个故障簇内信息构建故障树,并导出生成的故障树可视化展示,包括:
根据故障簇内的节点列表内容构建成一颗包含所有故障节点的故障等级树,从故障树根节点到某个子节点的路径即为单条故障现象内容;
依次将不同故障簇对应的故障树导出至Excel可视化展示。
2.如权利要求1所述的自动化移动设备故障层级树构建方法,其特征在于,在步骤102和103之间还包括步骤:
步骤102’、对故障节点列表中的单个动词节点以及与单个动词节点相邻的名词节点合并,并去除列表中的特殊符号,所述特殊符号包括标点符号、空字符。
3.一种自动化移动设备故障层级树构建装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至2中任一所述方法的步骤。
4.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至2中任一所述方法的步骤。
CN202311174976.6A 2023-09-13 2023-09-13 自动化移动设备故障层级树构建方法、装置及储存介质 Active CN116910175B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311174976.6A CN116910175B (zh) 2023-09-13 2023-09-13 自动化移动设备故障层级树构建方法、装置及储存介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311174976.6A CN116910175B (zh) 2023-09-13 2023-09-13 自动化移动设备故障层级树构建方法、装置及储存介质

Publications (2)

Publication Number Publication Date
CN116910175A CN116910175A (zh) 2023-10-20
CN116910175B true CN116910175B (zh) 2023-12-01

Family

ID=88351502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311174976.6A Active CN116910175B (zh) 2023-09-13 2023-09-13 自动化移动设备故障层级树构建方法、装置及储存介质

Country Status (1)

Country Link
CN (1) CN116910175B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102123522B1 (ko) * 2019-12-16 2020-06-16 주식회사 한국가스기술공사 고장 데이터의 군집에 기반한 고장 진단 방법
CN114880584A (zh) * 2022-05-16 2022-08-09 华能澜沧江水电股份有限公司 一种基于社区发现的发电机组故障分析方法
CN115345158A (zh) * 2022-08-29 2022-11-15 华润数字科技有限公司 基于无监督学习的新词发现方法、装置、设备及存储介质
CN115687925A (zh) * 2022-10-31 2023-02-03 中国船舶重工集团公司第七一九研究所 针对不平衡样本的故障类型识别方法及装置
CN116541510A (zh) * 2023-05-09 2023-08-04 西安电子科技大学 一种基于知识图谱的故障案例推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102123522B1 (ko) * 2019-12-16 2020-06-16 주식회사 한국가스기술공사 고장 데이터의 군집에 기반한 고장 진단 방법
CN114880584A (zh) * 2022-05-16 2022-08-09 华能澜沧江水电股份有限公司 一种基于社区发现的发电机组故障分析方法
CN115345158A (zh) * 2022-08-29 2022-11-15 华润数字科技有限公司 基于无监督学习的新词发现方法、装置、设备及存储介质
CN115687925A (zh) * 2022-10-31 2023-02-03 中国船舶重工集团公司第七一九研究所 针对不平衡样本的故障类型识别方法及装置
CN116541510A (zh) * 2023-05-09 2023-08-04 西安电子科技大学 一种基于知识图谱的故障案例推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SimCSE:Simple Contrastive Learning of Sentence Embeddings;Tianyu Gao等;《arXiv:2104.08821v4》;第1-17页 *

Also Published As

Publication number Publication date
CN116910175A (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
Arora et al. Character level embedding with deep convolutional neural network for text normalization of unstructured data for Twitter sentiment analysis
CN110442718B (zh) 语句处理方法、装置及服务器和存储介质
US8452772B1 (en) Methods, systems, and articles of manufacture for addressing popular topics in a socials sphere
CN110276023B (zh) Poi变迁事件发现方法、装置、计算设备和介质
CN110321563B (zh) 基于混合监督模型的文本情感分析方法
CN110334209B (zh) 文本分类方法、装置、介质及电子设备
KR20210023452A (ko) 속성 단위 리뷰 분석 장치 및 방법
CN108959559A (zh) 问答对生成方法和装置
US20190155904A1 (en) Generating ground truth for questions based on data found in structured resources
CN115759119B (zh) 一种金融文本情感分析方法、系统、介质和设备
CN114548321A (zh) 基于对比学习的自监督舆情评论观点对象分类方法
CN115600605A (zh) 一种中文实体关系联合抽取方法、系统、设备及存储介质
CN115146062A (zh) 融合专家推荐与文本聚类的智能事件分析方法和系统
US20150370887A1 (en) Semantic merge of arguments
CN113704393A (zh) 关键词提取方法、装置、设备及介质
CN110705285B (zh) 一种政务文本主题词库构建方法、装置、服务器及可读存储介质
CN110263345B (zh) 关键词提取方法、装置及存储介质
CN114969334B (zh) 异常日志检测方法、装置、电子设备及可读存储介质
CN111178080A (zh) 一种基于结构化信息的命名实体识别方法及系统
CN116910175B (zh) 自动化移动设备故障层级树构建方法、装置及储存介质
WO2019043380A1 (en) SEMANTIC ANALYSIS
CN114842982A (zh) 一种面向医疗信息系统的知识表达方法、装置及系统
CN115374258A (zh) 语义理解和问句模板相结合的知识库查询方法与系统
CN109933788B (zh) 类型确定方法、装置、设备和介质
Li et al. A method of large-scale log pattern mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant