CN110796565A - 监理日志的分析方法及分析系统 - Google Patents

监理日志的分析方法及分析系统 Download PDF

Info

Publication number
CN110796565A
CN110796565A CN201910974102.6A CN201910974102A CN110796565A CN 110796565 A CN110796565 A CN 110796565A CN 201910974102 A CN201910974102 A CN 201910974102A CN 110796565 A CN110796565 A CN 110796565A
Authority
CN
China
Prior art keywords
proctoring
evaluation
word
log text
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910974102.6A
Other languages
English (en)
Inventor
徐炫东
廖嘉炜
邹时容
池燕清
杜舒明
宋强
吴永欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangzhou Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Power Supply Bureau Co Ltd filed Critical Guangzhou Power Supply Bureau Co Ltd
Priority to CN201910974102.6A priority Critical patent/CN110796565A/zh
Publication of CN110796565A publication Critical patent/CN110796565A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Water Supply & Treatment (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及监理日志的分析方法及分析系统,分析方法包括以下步骤:获取待分析的监理日志文本;进行分词得到分词集合;从分词集合中查找评价词;确定监理日志文本的综合情感程度;在综合情感程度超过预设阈值时,发送监理日志文本。通过监理日志文本的分词及评价词查找,确定监理日志文本的综合情感程度,从文本的文字中通过技术手段获取监理日志文本的撰写人对于监理情况的情绪,无需人工干预亦无需投入人力资源,节约了人力成本及无效工作,提升了监理日志文本的分析处理效率,且通过情感分析技术来反映监理人员对当日工地的情况总体评价,有利于实现对负面情绪强的工地重点跟进,从而有利于防患于未然,以免恶性事件乃至安全事件的发生。

Description

监理日志的分析方法及分析系统
技术领域
本申请涉及电力系统日志分析领域,特别是涉及电力系统的监理日志的分析方法及分析系统。
背景技术
在能源互联网+新电改的背景下,智能电网是电力行业发展是必然趋势,云计算、大数据、物联网、移动互联网、人工智能等新一代科学技术将成为电力行业智能化发展的强大驱动器,电力企业正大力推进智能技术的研究和应用,在装备设施、现场作业、状态监测、状态评价及生产指挥等方面开展了广泛的试点和推广。同时高度关注智能技术的发展,积极推广成熟的智能技术,积极试点新型智能技术,不断提升生产领域智能化水平。
监理日志是记录监理员每天的监理工作的日志文件。监理员每天都会根据工地检查或现场检查的情况,填写监理日志,其中监理日志包含对工地情况或现场情况进行整体描述与评价,评价词语中会存在正面及负面的评价。管理人员希望通过每份日志总体评价情感倾向,作为判断该工地情况或现场情况的一个依据。
对于监理日志,一般都是由管理人员总监总代人工核查监理日志的质量情况,分析监理员对当日工地的情况总体评价,筛选出负面情绪强的工地,以对负面情绪强的工地重点跟进,尽可能防患于未然,以免恶性事件乃至安全事件的发生。
然而,监理公司每天会产生较多的监理日志,据统计,平均每日累计的监理日志和工作日志近200余篇,高峰期成倍数上涨,如此多的监理日志,有限的人力资源无法一一核查监理日志的质量情况。
发明内容
基于此,有必要提供一种监理日志的分析方法及分析系统。
一种监理日志的分析方法,其包括以下步骤:
S1,获取待分析的监理日志文本;
S2,对所述监理日志文本进行预处理,并进行分词得到分词集合;
S3,采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;
S4,根据获得的所述评价词,确定所述监理日志文本的综合情感程度;
S5,在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。
上述分析方法,通过监理日志文本的分词及评价词查找,确定监理日志文本的综合情感程度,从文本的文字中通过技术手段获取监理日志文本的撰写人对于监理情况的情绪,此阶段无需人工干预亦无需投入人力资源,节约了人力成本及无效工作,提升了监理日志文本的分析处理效率,且通过情感分析技术来反映监理人员对当日工地的情况总体评价,有利于实现对负面情绪强的工地重点跟进,从而有利于防患于未然,以免恶性事件乃至安全事件的发生。
进一步地,在其中一个实施例中,步骤S4中,根据获得的所述评价词,确定所述监理日志文本的情感倾向信息及情感级别信息,从而确定所述监理日志文本的综合情感程度。
在其中一个实施例中,所述评价词库包括预先建立的具有情感倾向信息以及情感程度级别信息的评价词信息。
在其中一个实施例中,步骤S4中还包括步骤:根据获得的多个所述评价词,确定所述监理日志文本的各所述评价词的情感权值;根据所述情感权值对各所述评价词的情感级别进行加权处理,获得所述监理日志文本的综合情感程度。
在其中一个实施例中,采用各所述评价词在所述监理日志文本中出现的频率,分别确定各所述评价词的情感权值。
在其中一个实施例中,步骤S4之后,步骤S5之前,所述分析方法还包括步骤:依据各所述监理日志文本的综合情感程度,对所有的所述监理日志文本进行排序。
进一步地,在其中一个实施例中,步骤S5中,在多个所述监理日志文本的所述综合情感程度超过预设阈值时,根据所述排序,发送所述监理日志文本或其分析结果。
在其中一个实施例中,步骤S5还包括:对综合情感程度超过预设阈值的所述监理日志文本进行报警提示。
在其中一个实施例中,步骤S5还包括:在所述监理日志文本的所述综合情感程度超过预设阈值时,从所述监理日志文本中查找与各所述评价词对应的评价实体对象,且抽取所述评价实体对象,形成实体关键词主题集并发送。
在其中一个实施例中,根据所述评价词在所述监理日志文本中的位置,确定查找区域;采用预设的评价实体对象库从所述查找区域中查找与所述评价词对应的所述评价实体对象。
在其中一个实施例中,所述查找区域为所述评价词在所述监理日志文本中的位置之前预设数量个字符的区域。
一种监理日志的分析系统,其包括:
文本获取单元,用于获取待分析的监理日志文本;
预处理单元,用于对所述监理日志文本进行预处理,并进行分词得到分词集合;
评价词查找单元,用于采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;
综合情感程度计算单元,用于根据获得的所述评价词,确定所述监理日志文本的综合情感程度;
发送单元,用于在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。
在其中一个实施例中,所述分析系统采用上述任一实施例所述分析方法实现。
附图说明
图1为本申请一实施例的流程示意图。
图2为本申请另一实施例的流程示意图。
图3为本申请另一实施例的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似改进,因此本申请不受下面公开的具体实施例的限制。
需要说明的是,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本申请的说明书所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本申请的说明书所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。在本申请的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本申请。本申请的说明书所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
在本申请一个实施例中,如图1所示,一种监理日志的分析方法,其包括以下步骤:S1,获取待分析的监理日志文本;S2,对所述监理日志文本进行预处理,并进行分词得到分词集合;S3,采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;S4,根据获得的所述评价词,确定所述监理日志文本的综合情感程度;S5,在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。上述分析方法,通过监理日志文本的分词及评价词查找,确定监理日志文本的综合情感程度,从文本的文字中通过技术手段获取监理日志文本的撰写人对于监理情况的情绪,此阶段无需人工干预亦无需投入人力资源,节约了人力成本及无效工作,提升了监理日志文本的分析处理效率,且通过情感分析技术来反映监理人员对当日工地的情况总体评价,有利于实现对负面情绪强的工地重点跟进,从而有利于防患于未然,以免恶性事件乃至安全事件的发生。
在其中一个实施例中,一种监理日志的分析方法,其包括以下实施例的部分步骤或全部步骤;即,所述分析方法包括以下的部分技术特征或全部技术特征。
在其中一个实施例中,S1,获取待分析的监理日志文本;在本申请一个具体实施例中,当监理员提交监理日志后,可获得该监理员提交的监理日志的文本,例如获得监理日志“钻桩施工、钢筋笼焊接、浇筑桩混凝土未发现异常;电缆沟侧壁模板拆除施工、混凝土面外观质量符合要求”。进一步地,在其中一个实施例中,主动获取待分析的监理日志文本;在其中一个实施例中,通过网络远程获取待分析的监理日志文本;在其中一个实施例中,通过网络远程接收待分析的监理日志文本。在一个具体应用的实施例中,现场监理人员通过手持终端发送监理日志文本,后台系统实时获取监理日志文本以待分析。这样的设计,把零碎的大量的监理日志文本汇总,一方面减轻了管理人员总监总代人工核查监理日志的工作负担,另一方面也减少了大量传递的中间环节,有利于提升处理效率及迅速体现分析结果。
在其中一个实施例中,S2,对所述监理日志文本进行预处理,并进行分词得到分词集合;即,对待分析的监理日志文本进行预处理,并进行分词得到分词集合。进一步地,在其中一个实施例中,采用数据库或者数据模块的形式进行分词。进一步地,在其中一个实施例中,进行预处理包括去掉所述监理日志文本中的标签。在其中一个实施例中,对所述监理日志文本进行预处理以去除错误格式或者错误内容,避免影响分词及后续步骤的评价词查找。进一步地,在其中一个实施例中,进行预处理包括数据清洗(Cleaning),把不完整数据、错误数据或多余数据过滤或删除,其中,不完整数据包括信息缺失或遗漏等,错误数据包括数据混乱、输入错误或格式错误等,多余数据包括重复数据或多余注释等。进一步地,在其中一个实施例中,进行预处理包括数据清晰化,把错别字进行更正,进行标点符号替换,进行数字替换,及/或进行链接替换等。这样的设计,有利于配合后续步骤从所述分词集合中准确地查找评价词。在本申请一个具体实施例中,对待分析的监理日志文本进行预处理,去掉句子中的标签,仅保留句子本身的内容。此外,在分词之前,本发明还对待分析的监理日志文本中的句子中的特殊符号进行预处理,如将所有全角符号转化为半角,将英文标点替换为中文标点,将连续的数字替换为<NUM>,将所有不规范的省略号替换为<ETC>,还将短链接替换为<SHORT_URL>,以避免分词带来的误差。也就是说,当获取到待分析的监理日志文本之后,可以对待分析的监理日志文本进行分词得到分词集合,例如对于监理日志“钻桩施工、钢筋笼焊接、浇筑桩混凝土未发现异常;电缆沟侧壁模板拆除施工、混凝土面外观质量符合要求”,分词后得到该文本的分词集合包括:钻桩,施工、钢筋笼、焊接、浇筑桩、混凝土、未、发现/未发现、异常、电缆沟、侧壁、模板、拆除、施工、混凝土、面、外观、质量、符合、要求,具体的可以通过常用的分词工具进行分词,在此不予赘述。
在其中一个实施例中,S3,采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;在其中一个实施例中,所述评价词库包括预先建立的具有情感倾向信息以及情感程度级别信息的评价词信息;评价词信息即具有情感倾向信息以及情感程度级别信息的评价词。进一步地,在其中一个实施例中,所述评价词库包括三方面信息:情感倾向信息、情感程度级别信息及评价词。在其中一个实施例中,所述评价词库为预先设置的具有情感倾向信息以及情感程度级别信息的关键词即评价词的集合,情感倾向信息用于表明该关键词的情感倾向属于正面还是负面;情感程度级别信息对应情感倾向信息设置,用于体现情感倾向信息的程度,可以根据实际需要,每个情感倾向可设有至少1个情感程度级别,其具体数目不做限定;评价词即为针对不同情感倾向和情感程度的关键词。也就是说,将所述分词集合中各分词依次与评价词库中的各关键词进行匹配,获得该待分析的监理日志文本中的评价词,并获得该评价词对应的情感倾向信息以及情感级别信息。进一步地,在其中一个实施例中,预设置或者调整所述评价词库。这样的设计,一方面通过评价词库实现评价词的控制及管理,用得越久,数据量越大,则评价词库越准确;另一方面在使用过程中,评价词库可以进行调整,优化评价词的设计,有利于提升评价词库的准确度。进一步地,在其中一个实施例中,所述评价词库的每一所述评价词具有情感级别,用于反映情感的强烈程度;例如“杀死”的情感级别高于“愤怒”的情感级别;进一步地,在其中一个实施例中,所述情感级别包括正向情感级别及反向情感级别,正向情感级别用于反映正面的情感,体现正能量;反向情感级别用于反映负面的情感,体现负能量;当监理日志文本充满了喜悦的正向情感级别的评价词时,反映现场情况是和谐、有序及高效的,这种情况下,在监理日志文本的综合情感程度超过预设阈值时,发送所述监理日志文本或其分析结果,可以作为表彰对象。当监理日志文本充满了愤懑的反向情感级别的评价词时,反映现场情况是糟糕、混乱及具有风险的,这种情况下,在监理日志文本的综合情感程度超过预设阈值时,发送所述监理日志文本或其分析结果,可以作为重点关注对象或者及时进行处理。
在其中一个实施例中,S4,根据获得的所述评价词,确定所述监理日志文本的综合情感程度;进一步地,在其中一个实施例中,步骤S4中,根据获得的所述评价词,确定所述监理日志文本的情感倾向信息及情感级别信息,从而确定所述监理日志文本的综合情感程度。即,一种监理日志的分析方法,其包括以下步骤:S1,获取待分析的监理日志文本;S2,对所述监理日志文本进行预处理,并进行分词得到分词集合;S3,采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;S4,根据获得的所述评价词,确定所述监理日志文本的情感倾向信息及情感级别信息,从而确定所述监理日志文本的综合情感程度;S5,在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。其余实施例以此类推。在其中一个实施例中,步骤S4中,根据获得的所述监理日志文本的所述评价词及其情感倾向信息、情感级别信息综合确定该待分析监理日志文本的综合情感程度。在其中一个实施例中,步骤S4中还包括步骤:根据获得的多个所述评价词,确定所述监理日志文本的各所述评价词的情感权值;根据所述情感权值对各所述评价词的情感级别进行加权处理,获得所述监理日志文本的综合情感程度。在其中一个实施例中,采用各所述评价词在所述监理日志文本中出现的频率,分别确定各所述评价词的情感权值。这样的设计,有利于从监理日志文本中分析得到其中的综合情感程度;获取监理人员对工地情况或现场情况进行整体描述与评价的一手资料且能够及时有效处理,通过综合情感程度切实有效地反映该监理日志文本所对应的工作现场的作业状况,尤其有利于迅速筛选出负面情绪强的工地,以对负面情绪强的工地重点跟进,尽可能防患于未然,以免恶性事件乃至安全事件的发生。
在本申请一个具体实施例中,步骤S4进一步包括:步骤S400,确定该待分析监理日志文本中各评价词的情感权值。在本申请一个具体实施例中,每个评价词对应不同的情感倾向以及情感级别程度,其中情感倾向可包括但不限于正面倾向和负面倾向,例如还可包括中性倾向,在此不做限定。
下面以正面倾向和负面倾向两类为例进行说明。正面倾向和负面倾向均包括多个情感程度级别。其中,可用Pi代表正面的第i个情感程度级别;用Qj代表负面的第j个情感程度级别。i和j均为任意正整数,当然,情感程度级别的数目可以根据实际需要进行设定,本申请不做限定。例如“符合…要求”为正面倾向,其情感程度级别为P1,“…情况良好”为正面倾向,其情感程度级别为P2,“…达不到…要求”为负面倾向,其情感程度级别为Q1,“要求…整改”为负面倾向,其情感程度级别为Q2,这里仅作为示例说明,本申请不以此为限制。
在本实施例中,可以利用各评价词在该待分析监理日志文本中出现的频率确定该评价词的权值。例如,可设有两个情感倾向,每个情感倾向设有三种情感程度。六种情感程度可分别表示为p1、p2、p3、q1、q2和q3。需要说明的是,这只是举例说明,本申请并不局限于计算两种情感倾向、六种情感程度级别的情况,可以根据需要计算数目的情感倾向和情感程度级别。假设评价词A对应的情感倾向为P,对应的情感程度级别为P1,其在该待分析监理日志文本中出现的频率为vp1,确定其情感权值为w1。
步骤S401,根据确定的情感权值对各评价词的情感级别进行加权获得待分析监理日志的综合情感程度。在本申请一个具体实施例中,假设待分析监理日志文本中A至E这5个评价词,其分别对应的情感倾向为P、P、Q、Q、P,对应的情感程度级别为P1、P3、Q2、Q1、P2,其情感权值为w1、w2、w3、w4、w5,则计算获得该待分析监理日志文本的综合情感程度为:M=w1*P1+w2*P3+w3*Q2+w4*Q1+w5*P2。
在其中一个实施例中,S5,在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。在其中一个实施例中,发送信号到目标终端例如管理人员的手机或者服务器等。进一步地,在其中一个实施例中,所述信号包括所述监理日志文本,即所述监理日志文本自身;及/或所述监理日志文本的分析结果;及/或报警信号;及/或紧急通知信息等。进一步地,在其中一个实施例中,发送所述监理日志文本或其分析结果到目标终端。可以理解的是,步骤S5中,根据需求不通,可以发送所述监理日志文本,也可以选择发送所述监理日志文本的分析结果。各实施例中,所述监理日志文本的分析结果包括所述监理日志文本的综合情感程度超过预设阈值、所述监理日志文本的综合情感程度、所述监理日志文本是否需要处理、所述监理日志文本反映问题的严重性、所述监理日志文本所对应现场情况是否需要立即采取干预措施等。在其中一个实施例中,所述超过,包括高于预设阈值、低于预设阈值或者不在预设阈值范围之内等。在其中一个实施例中,步骤S5中,在所述综合情感程度低于预设阈值时,发送所述监理日志文本或其分析结果。其余实施例以此类推。进一步地,在其中一个实施例中,步骤S5中,在所述综合情感程度超过预设阈值时,对所述监理日志文本进行标识,且发送所述监理日志文本或其分析结果。这样的设计,能够根据综合情感程度,对于综合情感程度超过预设阈值的监理日志文本所体现的问题严重的现场情况,及时有效地采取措施,达到防患于未然的作用。
在其中一个实施例中,步骤S5还包括:对所述综合情感程度超过预设阈值的所述监理日志文本进行报警提示。在本申请一个具体实施例中,综合情感程度越低,说明该监理日至的负面情绪越强,则对负面情绪强的监理日志进行提示。在其中一个实施例中,步骤S5还包括:在所述监理日志文本的所述综合情感程度超过预设阈值时,从所述监理日志文本中查找与各所述评价词对应的评价实体对象,且抽取所述评价实体对象,形成实体关键词主题集并发送,即步骤S5为:在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号;还从所述监理日志文本中查找与各所述评价词对应的评价实体对象,且抽取所述评价实体对象,形成实体关键词主题集并发送。如图2所示,一种监理日志的分析方法,其包括以下步骤:S1,获取待分析的监理日志文本;S2,对所述监理日志文本进行预处理,并进行分词得到分词集合;S3,采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;S4,根据获得的所述评价词,确定所述监理日志文本的综合情感程度;S5,在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号;还从所述监理日志文本中查找与各所述评价词对应的评价实体对象,且抽取所述评价实体对象,形成实体关键词主题集并发送。在本申请一个具体实施例中,所述评价实体对象,为评价词情感倾向所针对的实体对象,例如“钻桩施工、钢筋笼焊接、浇筑桩混凝土未发现异常”中,钻桩施工、钢筋笼焊接、浇筑桩混凝土为评价词”未发现异常”的评价实体对象。其余实施例以此类推。这样的设计,有利于将实体关键词反馈给管理人员,可以方便其有重点地管控各类项目以及风险,采用相应的技术手段来消除风险。
在其中一个实施例中,根据所述评价词在所述监理日志文本中的位置,确定查找区域;采用预设的评价实体对象库从所述查找区域中查找与所述评价词对应的所述评价实体对象。在其中一个实施例中,所述查找区域为所述评价词在所述监理日志文本中的位置之前预设数量个字符的区域。进一步地,在其中一个实施例中,所述查找区域包括所述评价词在所述监理日志文本中的位置之前预设第一数量个字符的区域及/或所述评价词在所述监理日志文本中的位置后预设第二数量个字符的区域;可以理解的是,预设数量、预设第一数量及预设第二数量可以相同或相异;在其中一个实施例中,预设数量、预设第一数量及预设第二数量均为5、6、7、8、9或10等;在其中一个实施例中,预设数量、预设第一数量及预设第二数量分别为5~15中的任一自然数。这样的设计,从文本的文字中通过技术手段获取监理日志文本的撰写人对于监理情况的情绪,及时对存在风险的工地现场进行处理例如整改或停工等,无需人工干预亦无需投入人力资源,节约了人力成本及无效工作,且能够达到当日事当日毕的结果;不仅提升了监理日志文本的分析处理效率,而且通过情感分析技术来反映监理人员对当日工地的情况总体评价,有利于实现对负面情绪强的工地重点跟进。
在其中一个实施例中,步骤S5具体包括以下步骤。步骤S500,根据所述评价词在该待分析监理日志文本中的位置,确定查找区域;步骤S501,利用预设的评价实体对象库从所述查找区域中查找出与所述评价词对应的评价实体对象。所述查找区域为评价词在该待分析监理日志文本中的位置前后预设数量个字符的区域。一般来说,在自然语言表达的时候,一个评价词所针对的评价对象通常不会距离该评价词太远,否则会导致看到该文本的人无法理解其要表达的语义,而且在监理日志中评价实体对象往往在评价词的位置之前,因此,可以根据评价词在单句文本中的位置,确定查找区域(向前查找),然后在查找区域中查找评价实体对象,将查找区域内的分词于预设的评价实体对象库查询,从而获得所述评价词对应的评价实体对象,提高与评价词对应的评价实体对象的查找准确率。
在其中一个实施例中,步骤S4之后,步骤S5之前,所述分析方法还包括步骤:依据各所述监理日志文本的综合情感程度,对所有的所述监理日志文本进行排序。例如,一种监理日志的分析方法,其包括以下步骤:S1,获取待分析的监理日志文本;S2,对所述监理日志文本进行预处理,并进行分词得到分词集合;S3,采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;S4,根据获得的所述评价词,确定所述监理日志文本的综合情感程度;S41,依据各所述监理日志文本的综合情感程度,对所有的所述监理日志文本进行排序;S5,在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。其余实施例以此类推。进一步地,在其中一个实施例中,步骤S5中,在多个所述监理日志文本的所述综合情感程度超过预设阈值时,根据所述排序,发送所述监理日志文本或其分析结果。这样的设计,一方面有利于管理人员对负面情绪强的监理日志进行重点跟进;又一方面有利于在及时处理大量监理日志文本时,例如对某日的大量监理日志文本进行分析排序,按顺序优先处理事态严重的工地现场;另一方面有利于历史分析且实现大数据管理作用,能够把数万份乃至更多的监理日志文本进行分析排序,不断积累经验教训,从而获得更准确的分析结果。
在其中一个实施例中,一种监理日志的分析系统,其采用上述任一实施例所述分析方法实现。在其中一个实施例中,所述分析系统具有用于实现所述分析方法各步骤对应的功能模块。在其中一个实施例中,如图3所示,一种监理日志的分析系统,其包括:文本获取单元301,用于获取待分析的监理日志文本;预处理单元302,用于对所述监理日志文本进行预处理,并进行分词得到分词集合;评价词查找单元303,用于采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;综合情感程度计算单元304,用于根据获得的所述评价词,确定所述监理日志文本的综合情感程度;发送单元305,用于在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。其余实施例以此类推。这样的设计,能够快速准确地从文本的文字中通过技术手段获取监理日志文本的撰写人对于监理情况的情绪,此阶段无需人工干预亦无需投入人力资源,节约了人力成本及无效工作,提升了监理日志文本的分析处理效率,且通过情感分析技术来反映监理人员对当日工地的情况总体评价,有利于实现对负面情绪强的工地重点跟进,从而有利于防患于未然,以免恶性事件乃至安全事件的发生。
在其中一个实施例中,文本获取单元301,用于获取待分析的监理日志文本。预处理单元302,用于对待分析的监理日志文本进行预处理,并进行分词得到分词集合。评价词查找单元303,用于从所述分词集合中查找评价词,所述评价词为所述分词集合中与预先建立的评价词库中关键词或关键词表达式匹配的字符串。综合情感程度计算单元304,用于根据获得的该待分析监理日志文本的评价词及其情感倾向信息、情感级别信息综合确定该待分析监理日志文本的综合情感程度。发送单元305,用于对综合情感程度超过预设阈值的所述监理日志文本进行报警提示及/或从所述监理日志文本中查找与各所述评价词对应的评价实体对象,且抽取所述评价实体对象,形成实体关键词主题集并发送。
在本申请一个具体实施例中,当监理员提交监理日志后,文本获取单元301可获得该监理员提交的监理日志的文本,例如获得监理日志“钻桩施工、钢筋笼焊接、浇筑桩混凝土未发现异常;电缆沟侧壁模板拆除施工、混凝土面外观质量符合要求”。
在本申请一个具体实施例中,预处理单元302对待分析的监理日志文本进行预处理,去掉句子中的标签,仅保留句子本身的内容。此外,在分词之前,预处理单元302还对待分析的监理日志文本中的句子中的特殊符号进行了正规化处理,如将所有全角符号转化为半角,将英文标点替换为中文标点,将连续的数字替换为<NUM>,将所有不规范的省略号替换为<ETC>,还将短链接替换为<SHORT_URL>,以避免分词带来的误差。也就是说,当获取到待分析的监理日志文本之后,可以对待分析的监理日志文本进行分词得到分词集合,例如对于监理日志“钻桩施工、钢筋笼焊接、浇筑桩混凝土未发现异常;电缆沟侧壁模板拆除施工、混凝土面外观质量符合要求”,分词后得到该文本的分词集合包括:钻桩,施工、钢筋笼、焊接、浇筑桩、混凝土、未、发现/未发现、异常、电缆沟、侧壁、模板、拆除、施工、混凝土、面、外观、质量、符合、要求,具体的可以通过常用的分词工具进行分词,在此不予赘述。具体地说,评价词库为预先建立的具有情感倾向信息以及情感程度级别信息的关键词,其至少包括三方面信息:1、情感倾向信息。例如,该关键词的情感倾向属于正面还是负面;2、情感程度级别信息:可以根据实际需要,每个情感倾向可设有至少1个情感程度级别,其具体数目不做限定;3、评价词:针对不同情感倾向和情感程度的关键词。也就是说,将所述分词集合中各分词依次与评价词库中的各关键词进行匹配,获得该待分析的监理日志文本中的评价词,并获得该评价词对应的情感倾向信息以及情感级别信息。
具体地,综合情感程度计算单元304进一步包括:情感权值确定单元,用于确定该待分析监理日志文本中各评价词的情感权值。在本实施例中,每个评价词对应不同的情感倾向以及情感级别程度,其中情感倾向可包括但不限于正面倾向和负面倾向,例如还可包括中性倾向,在此不做限定。下面以正面倾向和负面倾向两类为例进行说明。正面倾向和负面倾向均包括多个情感程度级别。其中,可用Pi代表正面的第i个情感程度级别;用Qj代表负面的第j个情感程度级别。i和j均为任意正整数,当然,情感程度级别的数目可以根据实际需要进行设定,本申请不做限定。例如“符合…要求”为正面倾向,其情感程度级别为P1,“…情况良好”为正面倾向,其情感程度级别为P2,“…达不到…要求”为负面倾向,其情感程度级别为Q1,“要求…整改”为负面倾向,其情感程度级别为Q2,这里仅以示例说明,本申请不以此为限制。在本实施例中,可以利用各评价词在该待分析监理日志文本中出现的频率确定该评价词的权值,例如,可设有两个情感倾向,每个情感倾向设有三种情感程度。六种情感程度可分别表示为p1、p2、p3、q1、q2和q3。需要说明的是,这只是举例说明,本申请并不局限于计算两种情感倾向、六种情感程度级别的情况,可以根据需要计算数目的情感倾向和情感程度级别。假设评价词A对应的情感倾向为P,对应的情感程度级别为P1,其在该待分析监理日志文本中出现的频率为vp1,确定其情感权值为w1。加权计算单元,用于根据确定的情感权值对各评价词的情感级别进行加权获得待分析监理日志的综合情感程度。在本申请具体实施例,假设待分析监理日志文本中A至E这5个评价词,其分别对应的情感倾向为P、P、Q、Q、P,对应的情感程度级别为P1、P3、Q2、Q1、P2,其情感权值为w1、w2、w3、w4、w5,则计算获得该待分析监理日志文本的综合情感程度为:
M=w1*P1+w2*P3+w3*Q2+w4*Q1+w5*P2。
进一步地,在其中一个实施例中,所述分析系统还包括:排序单元,用于依据各待分析监理日志文本的综合情感程度对所有待分析监理日至文本进行排序,以便管理人员对负面情绪强的监理日志进行重点跟进。在其中一个实施例中,所述分析系统还包括:报警提示单元,用于对综合情感程度低于预设阈值的监理日志进行报警提示。在本申请具体实施例中,综合情感程度越低,说明该监理日至的负面情绪越强,则对负面情绪强的监理日志进行提示。在其中一个实施例中,所述分析系统还包括:评价实体对象提取单元,用于从待分析监理日志文本中查找出与各评价词对应的评价实体对象,并抽取该些实体对象,形成实体关键词主题集,反馈给管理人员。在本申请具体实施例中,所述评价实体对象,指的是评价词情感倾向所针对的实体对象,例如“钻桩施工、钢筋笼焊接、浇筑桩混凝土未发现异常”中,钻桩施工、钢筋笼焊接、浇筑桩混凝土为评价词”未发现异常”的评价实体对象。具体地,所述评价实体对象提取单元进一步包括:查找区域确定单元,用于根据所述评价词在该待分析监理日志文本中的位置,确定查找区域;提取单元,用于利用预设的评价实体对象库从所述查找区域中查找出与所述评价词对应的评价实体对象。所述查找区域,指的是评价词在该待分析监理日志文本中的位置前后预设数量个字符的区域。一般来说,在自然语言表达的时候,一个评价词所针对的评价对象通常不会距离该评价词太远,否则会导致看到该文本的人无法理解其要表达的语义,而且在监理日志中评价实体对象往往在评价词的位置之前,因此,可以根据评价词在单句文本中的位置,确定查找区域(向前查找),然后在查找区域中查找评价实体对象,将查找区域内的分词于预设的评价实体对象库查询,从而获得所述评价词对应的评价实体对象,提高与评价词对应的评价实体对象的查找准确率。
这样的设计,通过对待分析的监理日志文本进行预处理,并进行分词得到分词集合,然后利用预先建立的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与预先建立的评价词库中关键词或关键词表达式匹配的字符串,最后根据获得的该待分析监理日志文本的评价词及其情感倾向信息、情感级别信息综合确定该待分析监理日志文本的综合情感程度,实现了对监理日志的情感分析,使得监理日志可以反映出监理员对当日工地的情况总体评价,以实现对负面情绪强的工地重点跟进。
需要说明的是,本申请的其它实施例还包括,上述各实施例中的技术特征相互组合所形成的、能够实施的监理日志的分析方法及分析系统,其中,所述监理日志的分析方法亦可称为处理方法或者监理日志的处理方法;所述分析系统亦可称为处理系统或者监理日志的处理系统。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的专利保护范围应以所附权利要求为准。

Claims (10)

1.一种监理日志的分析方法,其特征在于,包括以下步骤:
S1,获取待分析的监理日志文本;
S2,对所述监理日志文本进行预处理,并进行分词得到分词集合;
S3,采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;
S4,根据获得的所述评价词,确定所述监理日志文本的综合情感程度;
S5,在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。
2.根据权利要求1所述分析方法,其特征在于,所述评价词库包括预先建立的具有情感倾向信息以及情感程度级别信息的评价词信息。
3.根据权利要求1所述分析方法,其特征在于,步骤S4中还包括步骤:根据获得的多个所述评价词,确定所述监理日志文本的各所述评价词的情感权值;根据所述情感权值对各所述评价词的情感级别进行加权处理,获得所述监理日志文本的综合情感程度。
4.根据权利要求3所述分析方法,其特征在于,采用各所述评价词在所述监理日志文本中出现的频率,分别确定各所述评价词的情感权值。
5.根据权利要求1所述分析方法,其特征在于,步骤S4之后,步骤S5之前,所述分析方法还包括步骤:依据各所述监理日志文本的综合情感程度,对所有的所述监理日志文本进行排序。
6.根据权利要求1所述分析方法,其特征在于,步骤S5还包括:对综合情感程度超过预设阈值的所述监理日志文本进行报警提示。
7.根据权利要求1至6中任一项所述分析方法,其特征在于,步骤S5还包括:在所述监理日志文本的所述综合情感程度超过预设阈值时,从所述监理日志文本中查找与各所述评价词对应的评价实体对象,且抽取所述评价实体对象,形成实体关键词主题集并发送。
8.根据权利要求7所述分析方法,其特征在于,根据所述评价词在所述监理日志文本中的位置,确定查找区域;采用预设的评价实体对象库从所述查找区域中查找与所述评价词对应的所述评价实体对象。
9.根据权利要求8所述分析方法,其特征在于,所述查找区域为所述评价词在所述监理日志文本中的位置之前预设数量个字符的区域。
10.一种监理日志的分析系统,其特征在于,包括:
文本获取单元,用于获取待分析的监理日志文本;
预处理单元,用于对所述监理日志文本进行预处理,并进行分词得到分词集合;
评价词查找单元,用于采用预设的评价词库从所述分词集合中查找评价词,所述评价词为所述分词集合中与所述评价词库中关键词或关键词表达式相匹配的字符串;
综合情感程度计算单元,用于根据获得的所述评价词,确定所述监理日志文本的综合情感程度;
发送单元,用于在所述监理日志文本的所述综合情感程度超过预设阈值时,发送信号。
CN201910974102.6A 2019-10-14 2019-10-14 监理日志的分析方法及分析系统 Pending CN110796565A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910974102.6A CN110796565A (zh) 2019-10-14 2019-10-14 监理日志的分析方法及分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910974102.6A CN110796565A (zh) 2019-10-14 2019-10-14 监理日志的分析方法及分析系统

Publications (1)

Publication Number Publication Date
CN110796565A true CN110796565A (zh) 2020-02-14

Family

ID=69439094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910974102.6A Pending CN110796565A (zh) 2019-10-14 2019-10-14 监理日志的分析方法及分析系统

Country Status (1)

Country Link
CN (1) CN110796565A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256836A (zh) * 2020-11-04 2021-01-22 中国建设银行股份有限公司 记录数据的处理方法、装置和服务器
CN113806170A (zh) * 2021-09-07 2021-12-17 广东世纪信通网络科技有限公司 工程行业监理日志自动生成的方法、系统、介质及终端

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110078167A1 (en) * 2009-09-28 2011-03-31 Neelakantan Sundaresan System and method for topic extraction and opinion mining
CN103455562A (zh) * 2013-08-13 2013-12-18 西安建筑科技大学 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器
US20140278375A1 (en) * 2013-03-14 2014-09-18 Trinity College Dublin Methods and system for calculating affect scores in one or more documents
CN104573008A (zh) * 2015-01-08 2015-04-29 广东小天才科技有限公司 一种网络信息的监控方法及装置
CN108717406A (zh) * 2018-05-10 2018-10-30 平安科技(深圳)有限公司 文本情绪分析方法、装置及存储介质
CN109145216A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质
CN109522412A (zh) * 2018-11-14 2019-03-26 北京神州泰岳软件股份有限公司 文本情感分析方法、装置及介质
CN110189170A (zh) * 2019-05-27 2019-08-30 中译语通科技股份有限公司 市场情绪分析方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110078167A1 (en) * 2009-09-28 2011-03-31 Neelakantan Sundaresan System and method for topic extraction and opinion mining
US20140278375A1 (en) * 2013-03-14 2014-09-18 Trinity College Dublin Methods and system for calculating affect scores in one or more documents
CN103455562A (zh) * 2013-08-13 2013-12-18 西安建筑科技大学 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器
CN104573008A (zh) * 2015-01-08 2015-04-29 广东小天才科技有限公司 一种网络信息的监控方法及装置
CN108717406A (zh) * 2018-05-10 2018-10-30 平安科技(深圳)有限公司 文本情绪分析方法、装置及存储介质
CN109145216A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质
CN109522412A (zh) * 2018-11-14 2019-03-26 北京神州泰岳软件股份有限公司 文本情感分析方法、装置及介质
CN110189170A (zh) * 2019-05-27 2019-08-30 中译语通科技股份有限公司 市场情绪分析方法和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256836A (zh) * 2020-11-04 2021-01-22 中国建设银行股份有限公司 记录数据的处理方法、装置和服务器
CN113806170A (zh) * 2021-09-07 2021-12-17 广东世纪信通网络科技有限公司 工程行业监理日志自动生成的方法、系统、介质及终端
CN113806170B (zh) * 2021-09-07 2024-04-05 广东世纪信通科技股份有限公司 工程行业监理日志自动生成的方法、系统、介质及终端

Similar Documents

Publication Publication Date Title
CN105653444B (zh) 基于互联网日志数据的软件缺陷故障识别方法和系统
CN106055541A (zh) 一种新闻内容敏感词过滤方法及系统
CN109726246A (zh) 一种基于数据挖掘和可视化的电网事故关联原因回溯方法
US10776583B2 (en) Error correction for tables in document conversion
CN109240258A (zh) 基于词向量的汽车故障智能辅助诊断方法和系统
CN112163424A (zh) 数据的标注方法、装置、设备和介质
CN110866799A (zh) 使用人工智能监视在线零售平台的系统和方法
CN112036185B (zh) 一种基于工业企业构建命名实体识别模型的方法及装置
CN110147540B (zh) 业务安全需求文档生成方法及系统
CN110796565A (zh) 监理日志的分析方法及分析系统
CN107545505B (zh) 保险理财产品信息的识别方法及系统
JP6709812B2 (ja) 関係性推定モデル学習装置、方法、及びプログラム
CN112685215A (zh) 一种云平台异常日志分析方法
CN114817681B (zh) 一种基于大数据分析的金融风控系统及其管理设备
CN112347254A (zh) 新闻文本的分类方法、装置、计算机设备和存储介质
US11989677B2 (en) Framework for early warning of domain-specific events
CN110610003A (zh) 用于辅助文本标注的方法和系统
CN114357171A (zh) 一种应急事件处理方法、装置、存储介质及电子设备
CN114492392A (zh) 一种基于短语向量构造的年报风险挖掘系统和方法
CN113971205A (zh) 一种威胁报告攻击行为提取方法、装置、设备及存储介质
CN113674846A (zh) 基于lstm网络的医院智慧服务舆情监控平台
CN111241288A (zh) 一种大集中电力客户服务中心的突发事件感知系统以及构建方法
CN116795978A (zh) 一种投诉信息处理方法、装置、电子设备及介质
CN114417828A (zh) 一种服务器告警日志描述文本的实体关系抽取方法及系统
CN113901815A (zh) 基于大坝运行日志的应急工况事件检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: 510620 Tianhe District, Guangzhou, Tianhe South Road, No. two, No. 2, No.

Applicant after: Guangzhou Power Supply Bureau of Guangdong Power Grid Co.,Ltd.

Address before: 510620 Tianhe District, Guangzhou, Tianhe South Road, No. two, No. 2, No.

Applicant before: GUANGZHOU POWER SUPPLY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20200214

RJ01 Rejection of invention patent application after publication