CN110956031A - 文本相似度匹配的方法、装置及系统 - Google Patents

文本相似度匹配的方法、装置及系统 Download PDF

Info

Publication number
CN110956031A
CN110956031A CN201911106810.4A CN201911106810A CN110956031A CN 110956031 A CN110956031 A CN 110956031A CN 201911106810 A CN201911106810 A CN 201911106810A CN 110956031 A CN110956031 A CN 110956031A
Authority
CN
China
Prior art keywords
work
content
historical
matching
work ticket
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911106810.4A
Other languages
English (en)
Inventor
刘晶
黄宇
黄薇蓉
易满成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangzhou Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Power Supply Bureau Co Ltd filed Critical Guangzhou Power Supply Bureau Co Ltd
Priority to CN201911106810.4A priority Critical patent/CN110956031A/zh
Publication of CN110956031A publication Critical patent/CN110956031A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种文本相似度匹配的方法、装置及系统,其中,所述方法包括以下步骤:获取电力系统工作票的工作任务内容;将工作任务内容与工作票数据库中的历史工作内容进行匹配;根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。从而实现工作票的快速填写。本申请能够通过识别工作票的工作任务内容,并将工作任务内容与工作票数据库中的历史工作票进行相似度对比,最终选择满足相似度匹配要求的工作内容所对应的安全措施,实现快速匹配填写,提高了工作票的填写效率。

Description

文本相似度匹配的方法、装置及系统
技术领域
本申请涉及文本信息匹配技术领域,特别是涉及一种文本相似度匹配的方法、装置及系统。
背景技术
工作票是准许在电气设备或线路上工作的书面记录;是明确安全职责、向作业人员进行安全交底、履行工作许可手续、以及实施安全技术措施的书面依据;是工作间断、转移和终结的手续。因此,在电气设备或线路上工作时,应按要求正确使用工作票或按命令执行。在实际中,检修人员在电力生产现场、设备或系统上进行检修、维护、安装、改造、调试和试验等工作时需要根据工作票进行现场工作,确保安全生产工作票的填写仍需要人工逐字输入工作任务及对应的安全措施,安全措施的正确与严重依赖于填写人的个人经验与能力水平。
在实现过程中,发明人发现传统技术中至少存在如下问题:传统的对工作票的填写过程中,用户需要对所有内容进行逐一填写,使得用户在填写时需要花费较多的时间进行内容的填写,工作票填写效率低。
发明内容
基于此,有必要针对传统的对工作票的填写过程中,用户需要对所有内容进行逐一填写,使得用户在填写时需要花费较多的时间进行内容的填写,工作票填写效率低的问题,提供一种文本相似度匹配的方法、装置及系统。
为了实现上述目的,本发明实施例提供了一种文本相似度匹配的方法,包括以下步骤:
获取电力系统工作票的工作任务内容;
将工作任务内容与工作票数据库中的历史工作内容进行匹配;
根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;
将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
在其中一个实施例中,将工作任务内容与工作票数据库中的历史工作内容进行匹配的步骤包括:
基于隐马尔可夫模型对工作任务内容进行分词,得到各分词词语信息;
将各分词词语信息依次与工作票数据库中的历史工作内容进行匹配。
在其中一个实施例中,将各分词词语信息依次与工作票数据库中的历史工作内容进行匹配的步骤之后包括:
基于TF-IDF算法处理各分词词语信息和历史工作内容,得到匹配度。
在其中一个实施例中,基于TF-IDF算法处理各分词词语信息和历史工作内容,得到匹配度的步骤包括:
依次将各分词词语信息输入TF-IDF模型进行处理,得到对应各分词词语信息的次数;
基于TF-IDF算法处理各分词词语信息的次数,得到匹配度。
在其中一个实施例中,获取电力系统工作票的工作任务内容的步骤之前还包括:
将电力系统工作票与工作票数据库的历史工作票进行匹配;
获取电力系统工作票的工作任务内容的步骤包括:
在电力系统工作票与历史工作票之间的相似度小于相似工作票阈值时,获取工作任务内容。
在其中一个实施例中,将电力系统工作票与工作票数据库的历史工作票进行匹配的步骤之后还包括:
在电力系统工作票与历史工作票之间的相似度大于或等于相似工作票阈值时,将电力系统工作票更新为历史工作票。
在其中一个实施例中,将工作任务内容与工作票数据库中的历史工作内容进行匹配的步骤之后包括:
在工作任务内容与历史工作内容的匹配度小于相似内容阈值时,生成工作票填写模板。
另一方面,本发明实施例还提供了一种文本相似度匹配的装置,包括:
内容获取单元,用于获取电力系统工作票的工作任务内容;
内容匹配单元,用于将工作任务内容与工作票数据库中的历史工作内容进行匹配;
安全措施获取单元,用于根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;
安全措施填写单元,用于将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
另一方面,本发明实施例还提供了一种文本相似度匹配的系统,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任一项文本相似度匹配的方法的步骤。
另一方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项的文本相似度匹配的方法的步骤。
上述技术方案中的一个技术方案具有如下优点和有益效果:
上述的文本相似度匹配的方法的各实施例中,通过获取电力系统工作票的工作任务内容;将工作任务内容与工作票数据库中的历史工作内容进行匹配;根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置,进而实现工作票的快速填写。本申请能够通过识别工作票的工作任务内容,并将工作任务内容与工作票数据库中的历史工作票进行相似度对比,最终选择满足相似度匹配要求的工作内容所对应的安全措施,实现快速匹配填写,提高了工作票的填写效率。
附图说明
图1为一个实施例中文本相似度匹配的方法的应用环境示意图;
图2为一个实施例中文本相似度匹配的方法的第一流程示意图;
图3为一个实施例中文本相似度匹配的方法的第二流程示意图;
图4为一个实施例中文本相似度匹配的方法的第三流程示意图;
图5为一个实施例中文本相似度匹配的方法的第四流程示意图;
图6为一个实施例中工作票相似度匹配的工作流程示意图;
图7为一个实施例中HMM模型分词处理过程示意图;
图8为一个实施例中TF-IDF模型计算相似度的处理过程示意图;
图9为一个实施例中文本相似度匹配的装置的结构示意图;
图10为一个实施例中文本相似度匹配的系统的结构示意图。
具体实施方式
为了便于理解本申请,下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的首选实施例。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本申请的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本申请提供的文本相似度匹配的方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种文本相似度匹配的方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤S210,获取电力系统工作票的工作任务内容。
其中,电力系统工作票指的是准许在电气设备及系统软件上工作的书面命令,也是执行保证安全技术措施的书面依据。工作任务内容指的是电力系统工作票中的一项内容。
需要说明的是,工作票的内容可以但不限于是工作票编号、工作负责人、工作班成员、工作地点和工作任务内容,计划工作时间、工作终结时间,停电范围、安全措施,工作许可人、工作票签发人、工作票审批人、送电后评语等。
步骤S220,将工作任务内容与工作票数据库中的历史工作内容进行匹配。
其中,工作票数据库可用来存储电力系统工作票。历史工作内容指的是历史的电力系统工作票的工作内容。
具体地,可根据获取到的工作任务内容,查询工作票数据库,进而对工作任务内容与工作票数据库中的历史工作内容进行匹配。
步骤S230,根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容。
其中,匹配度指的是工作任务内容与历史工作内容中所含关键词的相同程度。相似内容阈值指的是预先设置的阈值。历史安全措施内容是电力系统工作票的核心内容,需要根据工作任务内容进行个性化的填写。
需要说明的是,在电力行业的工作票填写过程中,工作任务和安全措施之间是存在一定的关联。
具体地,根据工作任务内容与工作票数据库中的历史工作内容进行匹配的结果,得到工作任务内容与历史工作内容之间的匹配度,在该匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容。
步骤S240,将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
获取到历史安全措施内容后,进而可将历史安全措施内容填写到电力系统工作票中对应工作任务内容的相应位置,实现对电力系统工作票的快速填写。
上述的文本相似度匹配的方法的实施例中,通过获取电力系统工作票的工作任务内容;将工作任务内容与工作票数据库中的历史工作内容进行匹配;根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置,进而实现工作票的快速填写。通过识别工作票的工作任务内容,并将工作任务内容与工作票数据库中的历史工作票进行相似度对比,最终选择满足相似度匹配要求的工作内容所对应的安全措施,实现快速匹配填写,提高了工作票的填写效率。
在一个实施例中,如图3所示,提供了一种文本相似度匹配的方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤S310,获取电力系统工作票的工作任务内容。
步骤S320,基于隐马尔可夫模型对工作任务内容进行分词,得到各分词词语信息。
其中,隐马尔可夫模型(Hidden Markov Model,HMM)指的是一种统计模型,可用来描述一个含有隐含未知参数的马尔可夫过程。
具体地,基于隐马尔可夫模型对获取到的工作任务内容进行分词处理,进而可得到各分词词语信息。
步骤S330,将各分词词语信息依次与工作票数据库中的历史工作内容进行匹配。
具体地,可根据处理得到的各分词词语信息,查询工作票数据库中历史电力系统工作票与分词词语信息相同的词语次数,进而可对分词词语信息与工作票数据库中的历史工作内容进行匹配。
步骤S340,根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容。
步骤S350,将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
其中,上述步骤S310、步骤S340和步骤S350的具体内容过程可参考上文内容,此处不再赘述。
具体而言,基于隐马尔可夫模型对获取到的工作任务内容进行分词处理,得到各分词词语信息;将各分词词语信息依次与工作票数据库中的历史工作内容进行匹配;根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置,进而实现工作票的快速填写。本申请能够通过识别工作票的工作任务内容,并将工作任务内容与工作票数据库中的历史工作票进行相似度对比,最终选择满足相似度匹配要求的工作内容所对应的安全措施,实现快速匹配填写,提高了工作票的填写效率。
进一步的,在一个具体的实施例中,将各分词词语信息依次与工作票数据库中的历史工作内容进行匹配的步骤之后包括:
基于TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆文本频率指数)算法处理各分词词语信息和历史工作内容,得到匹配度。
其中,TF-IDF算法指的是一种用于信息检索与数据挖掘的常用加权算法;TF-IDF算法可用来通过某个单词在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为该词或者短语具有很好的类别区分能力。
具体而言,可通过TF-IDF算法处理计算处理各分词词语信息和对应历史电力系统工作票的历史工作内容,进而得到相应的匹配度。若匹配度大于或等于相似内容阈值(例如90%的匹配度)时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;并将历史安全措施内容自动填写到电力系统工作票。
进一步的,在一个具体的实施例中,基于TF-IDF算法处理各分词词语信息和历史工作内容,得到匹配度的步骤包括:
依次将各分词词语信息输入TF-IDF模型进行处理,得到对应各分词词语信息的次数;
基于TF-IDF算法处理各分词词语信息的次数,得到匹配度。
具体而言,可依次将各分词词语信息输入TF-IDF模型进行处理,通过TF-IDF模型处理统计分词词语信息出现的次数,进而可得到对应各分词词语信息的次数;基于TF-IDF算法处理对应各分词词语信息的次数,进而得到工作任务内容与历史工作内容的匹配度之间的匹配度。
进一步的,可根据分词处理得到的分词词语信息,建立语料库,并把该语料库作为参数传递给TF-IDF模型,通过TF-IDF模型统计相应分词词语信息出现的次数,进而可计算得到TF-IDF的值,从而获得相应的匹配度。
在一个实施例中,如图4所示,提供了一种文本相似度匹配的方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤S410,将电力系统工作票与工作票数据库的历史工作票进行匹配。
其中,历史工作票可以是系统默认为用户常用的工作票。历史工作票可以但不限于是电力线路工作票、电力线路带电作业工作票和电力电缆工作票。
步骤S420,在电力系统工作票与历史工作票之间的相似度小于相似工作票阈值时,获取工作任务内容。
具体地,可基于TF-IDF模型计算得到力系统工作票与历史工作票之间之间的相似度。
步骤S430,将工作任务内容与工作票数据库中的历史工作内容进行匹配。
步骤S440,根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容。
步骤S450,将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
其中,上述步骤S430、步骤S440和步骤S450的具体内容过程可参考上文内容,此处不再赘述。
具体而言,通过将电力系统工作票与工作票数据库的历史工作票进行匹配,在电力系统工作票与历史工作票之间的相似度小于相似工作票阈值时,获取工作任务内容进行相似度匹配处理,进而实现最终选择满足相似度匹配要求的工作内容所对应的安全措施,实现快速匹配填写,提高了工作票的填写效率。
在一个具体的实施例中,将电力系统工作票与工作票数据库的历史工作票进行匹配的步骤之后还包括:
在电力系统工作票与历史工作票之间的相似度大于或等于相似工作票阈值时,将电力系统工作票更新为历史工作票。
其中,相似工作票阈值指的是系统预设的阈值,例如相似工作票阈值可以设置为90%相似度。
具体而言,基于TF-IDF模型计算得到电力系统工作票与历史工作票之间的相似度大于或等于相似工作票阈值时,将电力系统工作票更新为历史工作票,进而可根据历史工作票实现对电力系统工作票的开始填写。通过设置相似工作票阈值,使得生成的安全措施内容精准度高,减少用户对安全措施内容的调整。
在一个实施例中,如图5所示,提供了一种文本相似度匹配的方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤S510,获取电力系统工作票的工作任务内容。
步骤S520,将工作任务内容与工作票数据库中的历史工作内容进行匹配。
步骤S530,在工作任务内容与历史工作内容的匹配度小于相似内容阈值时,生成工作票填写模板。
具体地,根据工作任务内容与工作票数据库中的历史工作内容进行匹配的结果,得到工作任务内容与历史工作内容之间的匹配度,在该匹配度小于相似内容阈值时,生成工作票填写模板,使得用户可惨遭工作票填写模板对电力系统工作票进行填写。
步骤S540,根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容。
步骤S550,将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
具体而言,通过将对应电力系统工作票的工作任务内容与工作票数据库中的历史工作内容进行匹配,根据工作任务内容与工作票数据库中的历史工作内容进行匹配的结果,得到工作任务内容与历史工作内容之间的匹配度,在该匹配度小于相似内容阈值时,生成工作票填写模板,使得用户可惨遭工作票填写模板对电力系统工作票进行填写;在该匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容,并将将历史安全措施内容加快速填写到相应的电力系统工作票,从而最终选择满足相似度匹配要求的工作内容所对应的安全措施,实现快速匹配填写,能够有效减少用户所需填写的文本内容,明显提高用户填写工作票的效率。
在一个示例中,如图6所示,具体说明对工作票相似度匹配的工作流程。当输入对应电力系统工作票的工作任务内容后,用户可通过点击“智能开票”功能时,智能开票系统通过识别用户填写工作任务内容,调用工作票数据库,对工作任务的字符、字符所属关键词、字符所属关键词包括的字符数目、以及所述字符在所属关键词中的索引位等进行匹配,计算用户填写的工作任务内容与工作票知识库的历史工作任务内容之间的相似度,若该值高于相似内容阈值(例如90%),则可认为该工作任务与历史工作任务内容的安全措施内容是可通用的,将该历史工作票的安全措施进行调出生成。通过进行文本匹配的方式进行内容的匹配与生成,减少用户所需要填写的文本内容;通过设置90%相似度的阈值,使得生成的安全措施内容精准度高,减少用户对安全措施内容的调整。
进一步的,如图7所示,具体说明HMM模型分词处理过程。通过采用隐马尔可夫模型(HMM)模型实现分词,基于汉字成词的HMM,对工作任务内容进行分词,并将分词得到分词词语缓存在分词列表。需要说明的是,分词列表包括至少一个分词词语。
进一步的,如图8所示,具体说明TF-IDF模型计算相似度的处理过程。计算相似度是当用户在点击智能开票时,通过计算用户填写的工作任务与工作票知识库的工作任务之间的相似度,若该相似度高于一定阈值,如90%,则可认为这两个工作任务的安全措施内容是可通用的,将该历史工作票的安全措施返回。通过识别用户填写的工作任务,生成对应的安全措施内容,能够有效减少用户所需填写的文本内容,明显提高用户填写工作票的效率。
需要说的是,本申请各实施例可将文本相似度匹配功能运用在电力行业,适用于电力行业工作用户在进行工作票的安全措施填写过程。
应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种文本相似度匹配的装置,包括:
内容获取单元910,用于获取电力系统工作票的工作任务内容。
内容匹配单元920,用于将工作任务内容与工作票数据库中的历史工作内容进行匹配。
安全措施获取单元930,用于根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容。
安全措施填写单元940,用于将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
关于文本相似度匹配的装置的具体限定可以参见上文中对于文本相似度匹配的方法的限定,在此不再赘述。上述文本相似度匹配的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于文本相似度匹配的系统中的处理器中,也可以以软件形式存储于文本相似度匹配的系统中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,如图10所示,提供了一种文本相似度匹配的系统,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任一项文本相似度匹配的方法的步骤。
处理器可用于执行以下步骤:
获取电力系统工作票的工作任务内容;
将工作任务内容与工作票数据库中的历史工作内容进行匹配;
根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;
将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
在一个实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项的文本相似度匹配的方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各除法运算方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种文本相似度匹配的方法,其特征在于,包括以下步骤:
获取电力系统工作票的工作任务内容;
将所述工作任务内容与工作票数据库中的历史工作内容进行匹配;
根据匹配的结果,在所述工作任务内容与所述历史工作内容的匹配度大于或等于相似内容阈值时,获取所述工作票数据库中的对应所述历史安全内容的历史安全措施内容;
将所述历史安全措施内容加载到所述电力系统工作票中对应所述工作任务内容的相应位置。
2.根据权利要求1所述的文本相似度匹配的方法,其特征在于,所述将所述工作任务内容与工作票数据库中的历史工作内容进行匹配的步骤包括:
基于隐马尔可夫模型对所述工作任务内容进行分词,得到各分词词语信息;
将各所述分词词语信息依次与工作票数据库中的历史工作内容进行匹配。
3.根据权利要求2所述的文本相似度匹配的方法,其特征在于,所述将各所述分词词语信息依次与工作票数据库中的历史工作内容进行匹配的步骤之后包括:
基于TF-IDF算法处理各所述分词词语信息和所述历史工作内容,得到所述匹配度。
4.根据权利要求3所述的文本相似度匹配的方法,其特征在于,所述基于TF-IDF算法处理各所述分词词语信息和所述历史工作内容,得到所述匹配度的步骤包括:
依次将各所述分词词语信息输入TF-IDF模型进行处理,得到对应各所述分词词语信息的次数;
基于TF-IDF算法处理各所述分词词语信息的次数,得到所述匹配度。
5.根据权利要求1所述的文本相似度匹配的方法,其特征在于,获取电力系统工作票的工作任务内容的步骤之前还包括:
将所述电力系统工作票与所述工作票数据库的历史工作票进行匹配;
所述获取电力系统工作票的工作任务内容的步骤包括:
在所述电力系统工作票与所述历史工作票之间的相似度小于相似工作票阈值时,获取所述工作任务内容。
6.根据权利要求5所述的文本相似度匹配的方法,其特征在于,所述将所述电力系统工作票与所述工作票数据库的历史工作票进行匹配的步骤之后还包括:
在所述电力系统工作票与所述历史工作票之间的相似度大于或等于相似工作票阈值时,将所述电力系统工作票更新为所述历史工作票。
7.根据权利要求1所述的文本相似度匹配的方法,其特征在于,所述将所述工作任务内容与工作票数据库中的历史工作内容进行匹配的步骤之后包括:
在所述工作任务内容与所述历史工作内容的匹配度小于相似内容阈值时,生成工作票填写模板。
8.一种文本相似度匹配的装置,其特征在于,包括:
内容获取单元,用于获取电力系统工作票的工作任务内容;
内容匹配单元,用于将所述工作任务内容与工作票数据库中的历史工作内容进行匹配;
安全措施获取单元,用于根据匹配的结果,在所述工作任务内容与所述历史工作内容的匹配度大于或等于相似内容阈值时,获取所述工作票数据库中的对应所述历史安全内容的历史安全措施内容;
安全措施填写单元,用于将所述历史安全措施内容加载到所述电力系统工作票中对应所述工作任务内容的相应位置。
9.一种文本相似度匹配的系统,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述文本相似度匹配的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的文本相似度匹配的方法的步骤。
CN201911106810.4A 2019-11-13 2019-11-13 文本相似度匹配的方法、装置及系统 Pending CN110956031A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911106810.4A CN110956031A (zh) 2019-11-13 2019-11-13 文本相似度匹配的方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911106810.4A CN110956031A (zh) 2019-11-13 2019-11-13 文本相似度匹配的方法、装置及系统

Publications (1)

Publication Number Publication Date
CN110956031A true CN110956031A (zh) 2020-04-03

Family

ID=69977403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911106810.4A Pending CN110956031A (zh) 2019-11-13 2019-11-13 文本相似度匹配的方法、装置及系统

Country Status (1)

Country Link
CN (1) CN110956031A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860420A (zh) * 2020-07-30 2020-10-30 广东电网有限责任公司 变电站安全标示牌处理方法、系统、存储介质及计算机设备
CN112017411A (zh) * 2020-08-21 2020-12-01 广东电网有限责任公司清远供电局 一种变电站作业防误预警系统
CN113642835A (zh) * 2021-07-01 2021-11-12 国网福建省电力有限公司 一种基于数据相似度的工作票生成方法及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844350A (zh) * 2017-02-15 2017-06-13 广州索答信息科技有限公司 一种短文本语义相似度的计算方法
CN108628825A (zh) * 2018-04-10 2018-10-09 平安科技(深圳)有限公司 文本信息相似度匹配方法、装置、计算机设备及存储介质
CN109948121A (zh) * 2017-12-20 2019-06-28 北京京东尚科信息技术有限公司 文章相似度挖掘方法、系统、设备及存储介质
CN110399463A (zh) * 2019-07-29 2019-11-01 国网河北省电力有限公司 工作票的相似度匹配方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844350A (zh) * 2017-02-15 2017-06-13 广州索答信息科技有限公司 一种短文本语义相似度的计算方法
CN109948121A (zh) * 2017-12-20 2019-06-28 北京京东尚科信息技术有限公司 文章相似度挖掘方法、系统、设备及存储介质
CN108628825A (zh) * 2018-04-10 2018-10-09 平安科技(深圳)有限公司 文本信息相似度匹配方法、装置、计算机设备及存储介质
CN110399463A (zh) * 2019-07-29 2019-11-01 国网河北省电力有限公司 工作票的相似度匹配方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860420A (zh) * 2020-07-30 2020-10-30 广东电网有限责任公司 变电站安全标示牌处理方法、系统、存储介质及计算机设备
CN112017411A (zh) * 2020-08-21 2020-12-01 广东电网有限责任公司清远供电局 一种变电站作业防误预警系统
CN113642835A (zh) * 2021-07-01 2021-11-12 国网福建省电力有限公司 一种基于数据相似度的工作票生成方法及终端
CN113642835B (zh) * 2021-07-01 2022-09-27 国网福建省电力有限公司 一种基于数据相似度的工作票生成方法及终端

Similar Documents

Publication Publication Date Title
CN109614238B (zh) 一种目标对象识别方法、装置、系统及可读存储介质
CN109063217B (zh) 电力营销系统中的工单分类方法、装置及其相关设备
CN110956031A (zh) 文本相似度匹配的方法、装置及系统
CN108491406B (zh) 信息分类方法、装置、计算机设备和存储介质
CN110659298B (zh) 财务数据处理方法、装置、计算机设备和存储介质
CN108803996B (zh) 图形文件处理方法、装置、计算机设备和存储介质
CN113704436A (zh) 基于会话场景的用户画像标签挖掘方法及装置
CN111984792A (zh) 网站分类方法、装置、计算机设备及存储介质
CN112651236B (zh) 提取文本信息的方法、装置、计算机设备和存储介质
CN109800333B (zh) 基于机器学习的报表生成方法、装置和计算机设备
CN110457361B (zh) 特征数据获取方法、装置、计算机设备和存储介质
CN112766319A (zh) 对话意图识别模型训练方法、装置、计算机设备及介质
CN109460541B (zh) 词汇关系标注方法、装置、计算机设备和存储介质
CN112286934A (zh) 数据库表导入方法、装置、设备及介质
CN111651666A (zh) 用户主题推荐方法、装置、计算机设备及存储介质
CN112181835A (zh) 自动化测试方法、装置、计算机设备及存储介质
CN112559526A (zh) 数据表导出方法、装置、计算机设备及存储介质
CN110969261B (zh) 基于加密算法的模型构建方法及相关设备
CN115936895A (zh) 基于人工智能的风险评估方法、装置、设备及存储介质
CN110659347B (zh) 关联文书确定方法、装置、计算机设备及存储介质
CN111651264A (zh) 物理机资源分配模型的获取方法、装置和计算机设备
CN111325023A (zh) 一种风险项目信息数据搜索方法
CN115374849A (zh) 企业相关专利检索方法、装置、设备及介质
CN113469237B (zh) 用户意图识别方法、装置、电子设备及存储介质
CN115618054A (zh) 视频推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201019

Address after: 510620 Tianhe District, Guangzhou, Tianhe South Road, No. two, No. 2, No.

Applicant after: Guangzhou Power Supply Bureau of Guangdong Power Grid Co.,Ltd.

Address before: 510620 Tianhe District, Guangzhou, Tianhe South Road, No. two, No. 2, No.

Applicant before: GUANGZHOU POWER SUPPLY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20200403