CN113139705A - 业务项目的风险识别方法及装置 - Google Patents

业务项目的风险识别方法及装置 Download PDF

Info

Publication number
CN113139705A
CN113139705A CN202010052905.9A CN202010052905A CN113139705A CN 113139705 A CN113139705 A CN 113139705A CN 202010052905 A CN202010052905 A CN 202010052905A CN 113139705 A CN113139705 A CN 113139705A
Authority
CN
China
Prior art keywords
project
data
risk
unstructured
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010052905.9A
Other languages
English (en)
Inventor
华晴云
全东方
施锦河
储晶星
林方铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202010052905.9A priority Critical patent/CN113139705A/zh
Publication of CN113139705A publication Critical patent/CN113139705A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种业务项目的风险识别方法、装置、电子设备及存储介质,涉及电子信息领域,方法包括:获取业务项目的项目数据,提取项目数据中包含的结构化数据,根据结构化数据确定项目数据中包含的非结构化数据;针对结构化数据,根据业务项目类型确定与结构化数据相对应的结构化项目风险识别结果;针对非结构化数据进行语义分析,根据语义分析结果提取非结构化数据中包含的关键词,根据关键词确定与非结构化数据相对应的非结构化项目风险识别结果;根据结构化项目风险识别结果以及非结构化项目风险识别结果,识别业务项目中包含的风险点。该方式能够结合结构化数据以及非结构化数据的识别结果客观确定项目中的风险点。

Description

业务项目的风险识别方法及装置
技术领域
本发明涉及电子信息领域,具体涉及一种业务项目的风险识别方法及装置。
背景技术
大型建设工程项目,由于工期长、投资大、参与主体多、组织关系复杂等诸多因素会给项目实施带来困难,甚至造成重大的损失,在项目审批、实施的各个关键节点,针对项目风险进行识别能够有效确保工程的顺利实施。
但是,传统的项目风险控制方法大多是事前评估,集中在项目审批阶段。具体地,基于收集到的有限的项目申报信息进行风险评估,容易发生项目填报方虚报、夸大等情况,导致项目风险评估中还要进行真实性核验,因此增加了评估项目风险的复杂度。另外,在事前评估的过程中,大多通过专家打分方式进行评估,受人为因素的影响较大,导致评估结果缺乏客观性。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种业务项目的风险识别方法及装置。
根据本发明的一个方面,提供了一种业务项目的风险识别方法,包括:
获取业务项目的项目数据,提取所述项目数据中包含的结构化数据,根据所述结构化数据确定所述项目数据中包含的非结构化数据;
针对所述结构化数据,根据业务项目类型确定与所述结构化数据相对应的结构化项目风险识别结果;
针对所述非结构化数据进行语义分析,根据语义分析结果提取所述非结构化数据中包含的关键词,根据所述关键词确定与所述非结构化数据相对应的非结构化项目风险识别结果;
根据所述结构化项目风险识别结果以及所述非结构化项目风险识别结果,识别所述业务项目中包含的风险点。
根据本发明的另一个方面,提供了一种业务项目的风险识别装置,包括:
获取模块,适于获取业务项目的项目数据,提取所述项目数据中包含的结构化数据,根据所述结构化数据确定所述项目数据中包含的非结构化数据;
结构化处理模块,适于针对所述结构化数据,根据业务项目类型确定与所述结构化数据相对应的结构化项目风险识别结果;
非结构化处理模块,适于针对所述非结构化数据进行语义分析,根据语义分析结果提取所述非结构化数据中包含的关键词,根据所述关键词确定与所述非结构化数据相对应的非结构化项目风险识别结果;
风险识别模块,适于根据所述结构化项目风险识别结果以及所述非结构化项目风险识别结果,识别所述业务项目中包含的风险点。
依据本发明的再一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述的业务项目的风险识别方法对应的操作。
依据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述的业务项目的风险识别方法对应的操作。
在本发明提供的业务项目的风险识别方法及装置中,能够根据业务项目的项目数据进行风险识别,具体地,提取项目数据中包含的结构化数据以及非结构化数据,并分别针对结构化数据以及非结构化数据执行不同的风险识别方式,以得到对应于结构化数据的结构化项目风险识别结果以及对应于非结构化数据的非结构化项目风险识别结果,从而结合结构化项目风险识别结果以及非结构化项目风险识别结果客观识别业务项目中包含的风险点。该方式能够基于业务项目的项目数据进行评估,相较于项目申报信息而言,项目数据的真实性更加可靠,并且,该方式能够针对结构化数据以及非结构化数据执行不同的风险识别方式,从而结合结构化数据以及非结构化数据的识别结果客观确定项目中的风险点,避免了专家打分造成的主观影响。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例一提供的一种业务项目的风险识别方法的流程图;
图2示出了本发明实施例二提供的一种业务项目的风险识别方法的流程图;
图3示出了本发明实施例三提供的一种业务项目的风险识别装置的结构图;
图4示出了本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1示出了本发明实施例一提供的一种业务项目的风险识别方法的流程图。如图1所示,该方法包括:
步骤S110:获取业务项目的项目数据,提取项目数据中包含的结构化数据,根据结构化数据确定项目数据中包含的非结构化数据。
其中,项目数据可以进一步包括多个分别对应于不同的项目阶段或项目流程的阶段子数据,相应地,通过对各个阶段子数据进行处理,可以识别各个阶段的风险点并及时应对。
其中,业务项目的项目数据包含业务项目的各类相关信息。其中,项目数据中包含的结构化数据,结构化数据是指根据预设规范生成的数据,例如,预先设置多个项目字段以及各个项目字段对应的字段值的格式规范,相应地,根据预设的项目字段的字段名称以及字段值的格式规范即可提取项目数据中包含的结构化数据。非结构化数据是指不符合预设规范的数据内容,该部分内容缺乏对应的固定字段等固定格式,可能通过各种格式生成,因此,在提取非结构化数据时,可以直接将除结构化数据之外的内容确定为非结构化数据。
步骤S120:针对结构化数据,根据业务项目类型确定与结构化数据相对应的结构化项目风险识别结果。
具体地,针对结构化数据,通过层次分析法以及第一LMBP神经网络模型确定与结构化数据相对应的结构化项目风险识别结果;其中,层次分析法用于确定各个影响因子的权重,第一LMBP神经网络模型用于基于各个影响因子的权重识别与结构化数据相对应的结构化项目风险识别结果。
由此可见,针对结构化数据,能够通过神经网络模型进行识别,以确定对应的结构化项目风险识别结果。其中,结构化项目风险识别结果是指:直接包含在结构化数据中的风险点,或者,能够由结构化数据预测得到的潜在的风险点。
步骤S130:针对非结构化数据进行语义分析,根据语义分析结果提取非结构化数据中包含的关键词,根据关键词确定与非结构化数据相对应的非结构化项目风险识别结果。
具体地,由于非结构化数据不具有固定格式,因此,无法直接通过模型进行识别,需要先通过语义分析的方式提取其中的关键词,进而基于关键词进行识别。
具体实施时,针对非结构化数据进行预处理,确定预处理后的非结构化数据中的各个候选词语的语义贡献度以及词频统计特征;根据各个候选词语的语义贡献度以及词频统计特征,从各个候选词语中提取关键词,以便根据关键词确定与非结构化数据相对应的非结构化项目风险识别结果。
其中,在确定预处理后的非结构化数据中的各个候选词语的语义贡献度以及词频统计特征时,为了提升处理效率,预先根据各个候选词语的语义贡献度滤除候选词语中包含的非主题相关词语,得到候选词语中包含的主题相关词语,并确定各个主题相关词语的词频统计特征。相应地,在后续处理时,根据各个主题相关词语的语义贡献度以及词频统计特征,从各个主题相关词语中提取关键词,以便根据关键词确定与非结构化数据相对应的非结构化项目风险识别结果。各个主题相关词语的词频统计特征用于反映词语在文档中的出现频次等特征,具体包括:词频逆向文档频率、词性权重、和/或词语在文档中的出现位置。其中,词性权重是指词语对应的词性所占的权重,用于反映对应词性的重要度,例如,副词、形容词等词语的词性权重小于名词、动词等词语的词性权重。
另外,在根据关键词确定与非结构化数据相对应的非结构化项目风险识别结果时,具体通过第二LMBP神经网络模型确定与非结构化数据相对应的非结构化项目风险识别结果;其中,第二LMBP神经网络模型为多层神经网络结构。
由此可见,本步骤通过语义识别与神经网络模型相结合的方式进行非结构化项目风险识别结果的挖掘。具体实施时,可以根据关键词是否属于预设黑名单、分析关键词的情感语义等方式,确定敏感关键词,进而实现风险识别。
步骤S140:根据结构化项目风险识别结果以及非结构化项目风险识别结果,识别业务项目中包含的风险点。
其中,由于结构化项目风险识别结果以及非结构化项目风险识别结果分别源自不同类型的项目数据,因此,二者都能反映项目中的风险点,且能够从不同的方面反映不同的风险点。所以,通过结合结构化项目风险识别结果以及非结构化项目风险识别结果,能够更加准确地识别业务项目中包含的风险点。
具体地,针对识别出的风险点,确定与所述风险点相对应的风险规避策略,按照所述风险规避策略执行风险规避处理。其中,可以将风险点划分为多个类型,并分别针对不同类型的风险点设置不同的风险规避策略。例如,风险点的类型可以包括:高危风险点、中危风险点、低危风险点等,相应地,风险规避策略包括:终止项目的策略、暂停项目的策略、选取替代方案实施项目的策略、暂不处理策略等。
由此可见,在本发明提供的业务项目的风险识别方法中,能够根据业务项目的项目数据进行风险识别,具体地,提取项目数据中包含的结构化数据以及非结构化数据,并分别针对结构化数据以及非结构化数据执行不同的风险识别方式,以得到对应于结构化数据的结构化项目风险识别结果以及对应于非结构化数据的非结构化项目风险识别结果,从而结合结构化项目风险识别结果以及非结构化项目风险识别结果客观识别业务项目中包含的风险点。该方式能够基于业务项目的项目数据进行评估,相较于项目申报信息而言,项目数据的真实性更加可靠,并且,该方式能够针对结构化数据以及非结构化数据执行不同的风险识别方式,从而结合结构化数据以及非结构化数据的识别结果客观确定项目中的风险点,避免了专家打分造成的主观影响。
实施例二
为了便于理解,本发明实施例二提供了一种业务项目的风险识别方法,以便对实施例一中的各个步骤的具体实现细节进行详细说明:
通常情况下,对项目风险评估一般是通过建立相应的风险评价指标体系,再结合风险评估模型进行综合分析评估风险的整体水平。目前,对项目风险控制的处理大多集中在项目审批阶段,以往用于实现工程风险控制的风险识别方式如下:基于人工经验对工程风险进行分解和识别,采用的方法一般是基于已经确定的优化目标,如基于安全运行基本功能要求的工程风险分解识别,采用系统分解、因果推理分析,最终构建贝叶斯风险网络。目前的风险评估模型一般分为定性、定量、定性与定量结合三类,常用的风险识别方法包括头脑风暴法、专家咨询法、风险分解法、流程图法。例如,在定性与定量结合的方法中,能够在AHP法设定权重结构的基础上,采用BP神经网络方式进行项目风险评估。
但是,发明人在实现本发明的过程中发现,上述方式至少存在以下缺陷:BP神经网络只有当全局达到最优时才能建立完成,在少量样本和指标缺失的情况下,实用性上存在明显的弊端。由此可见,传统的风险评估方式通常存在以下缺陷:首先,传统的项目风险控制方法大多是事前评估,集中在项目审批阶段,基于收集到的有限项目申报信息进行评估,容易发生项目填报方虚报、夸大等情况,导致项目风险评估中还要进行真实性核验,增加评估项目风险的复杂度。其次,来自于工程实际处理过程的直接数据源较少,大多模型分解指标仍来自于专家打分的结果;并且,工程数据的特点在于,存在大量的非结构化数据,而对于非结构化数据,通常只能采用专家打分方式给出判断结果,无法做到快速更新、客观公正,容易具有主观性影响。再次,工程项目风险评估大多是事前评估,实施阶段难以把控,导致事中风险管控体系有很大的不确定性;工程项目风险预警未贯穿于工程的全流程阶段,更容易导致风险防控举措响应不及时。
为了解决上述问题,在本实施例中,针对项目实施各阶段的结构化数据和非结构化数据进行分析,并计算当前阶段的风险指标得分,以结构化数据计算得到的风险指标作为主要判断依据,非结构化数据处理得到的风险指标作为次要判断依据,实现全流程贯穿的工程风险监测并预警,并进行相应的风险干预举措。图2示出了本实施例的流程示意图。
下面详细介绍本实施例的具体实现流程,在本实施例中,主要通过结构化数据处理模块以及非结构化数据处理模块的相互配合实现:
一、结构化数据处理模块
结构化数据处理模块用于针对结构化数据,根据业务项目类型确定与所述结构化数据相对应的结构化项目风险识别结果。
在本实施例中,项目结构化数据来源于系统中采集的结构化数据,项目信息系统化可方便的完成数据校验,有效减少项目填报方虚报、夸大等现象。具体地,预先在系统中设置结构化数据的数据字段以及字段规范,进而根据上述规范提取结构化数据。
本方案与传统方案的不同之处在于:优化基于AHP模型后的指标得分实现分类风险打分模型,使用LMBP神经网络模型,继承了BP神经网络的自主调节能力,同时具有LMBP收敛速度快的优势和不易受误差和样本数量影响的优势,从而提高了实用性。结构化数据处理过程具体通过以下步骤实现:
步骤一:在项目建立初期,根据项目类型和影响因素,确定量化调整层的统计模型,调取数据库中各层的单元内容。
具体地,将提取出的结构化数据输入量化调整层,以确定其中包含的各个影响因子(也叫影响因素)。其中,提取出的结构化数据包括:项目类型数据、项目阶段数据、项目工期数据、项目费用数据、项目时间数据、项目订单数据、项目施工方数据等各种结构化数据。将上述结构化数据输入至量化调整层,以确定其中的各个影响因子。
步骤二:设计AHP法确定各项权重,此后该项目的结构化指标计算口径确定。
具体地,将量化调整层确定的各个影响因子输入至层次分析层,以利用AHP层次分析法确定各个影响因子的权重。
步骤三:采用LMBP神经网络模型,对同类型的项目风险评估模型指标计算进行训练,得到LMBP内部权值收敛后的稳定模型。优化后的LMBP神经网络算法权值调整公式为:ΔW=-(JTJ+uI)-1JTe,其中J表示误差对权值进行微分的Jacobi矩阵,e为误差向量,u为学习率,I为单位矩阵。其中,LMBP神经网络模型包括输入层Input layer、隐层hide later、输出层outputlayer。
步骤四:在项目各阶段根据最新的维度数据,输出基于结构化数据的项目风险值作为风险识别判断的主要依据。
二、非结构化数据处理模块
非结构化数据处理模块用于针对非结构化数据进行语义分析,根据语义分析结果提取非结构化数据中包含的关键词,根据关键词确定与非结构化数据相对应的非结构化项目风险识别结果。
具体地,本方案进一步针对项目非结构化数据提取文本关键词。具体地,基于对项目数据中包含的风险评估文档、项目说明文档等非结构化数据进行与风险评估相关的关键词提取,主要包含文本预处理、语义贡献值计算、词语关键度计算等处理过程。
具体实施时,非结构化数据处理过程主要包括基于语义的关键词提取过程以及LSTM情感分类过程,其中,LSTM情感分类过程基于关键词提取过程实现。具体地,关键词提取过程又划分为预处理过程、语义贡献值计算过程、词语统计特征计算过程、计算词语关键度以及输出关键词的过程。
首先,针对关键词提取过程进行介绍:
关键词提取过程首先由文本预处理模块实现,该文本预处理模块用于针对非结构化数据进行预处理:
第一、对非结构化的文本数据进行分词和词性标注,获得候选词语列表;
第二、从候选词语列表中滤除无用词语,例如,去除停用词,获得词语集合V;
第三,记录词语集合V中各个词语的文本、长度、位置和词性等特征。
接下来,由语义贡献值计算模块计算词语集合V中各个词语的语义贡献值,该语义贡献值也叫语义贡献度,用于反映词语在文档中对文档内容的语义贡献大小,越重要的词语的语义贡献值越高,如作为主语或宾语的名词、作为谓语的动词等;越次要的词语的语义贡献值越低,如作为定语、状语或补语的名词、副词、形容词等。具体地,语义贡献值计算模块用于完成如下三方面的计算:
第一,语义相似度计算,基于词语集合构建顶点集V,将语义相似度作为边集E,从而构建词语网络图G={V,E};
第二,完成词语的语义贡献度计算,贡献度计算公式如下:
Figure BDA0002371829970000091
其中,n为图G的顶点数,gmk表示点Vm和Vk之间的最短路径数,gmk(Vi)表示点Vm和Vk之间经过顶点Vi的最短路径数。采用随机划分文档区间的方式,分别计算区间内的语义贡献度,可有效排除与主题无关的词语。其中,与主题无关的词语即为非主题相关词语,进而得到主题相关词语。
第三,计算词语的统计特征,包括词频TF、逆向文档频率IDF、词性所属的重要度pos、词语在文章中出现的位置loc等。其中,词语的统计特征即为词频统计特征。
最后,由词语关键度计算模块计算各个词语的关键度。具体地,将各个词语(如主题相关词语)的语义贡献度以及词频统计特征值加权计算得到词语的关键度,进而根据词语的关键度输出关键词。
介绍完关键词提取过程之后,接下来,介绍基于关键词提取过程实现的情感分类过程。具体地,情感分类基于从非结构化数据中提取的关键词实现。
具体实施时,根据文本关键词提取模块的输出结果,定位到关键词所在的语句,将该语句的分词过滤结果按上下文顺序输入LSTM模型。LSTM模型在RNN的基础上引入记忆单元,能够保留RNN优点的同时,完成编码距离久远的上下文历史信息。为实现文本的深层次特征挖掘,在本实施例中,将多个LSTM层叠起来,通过多层神经网络结构来挖掘文本深层特征。输入特征向量经过LSTM层得到高维向量,可以学习到更深层次的特征,全连接层接收来自上一层的全部输出,针对输出向量加权求和,加权后的输出结果经过激励函数并传播到Dropout(随机失活)层。Dropout层在训练和预测时随机让网络中某些隐含层节点不工作,减少特征个数,能有效防止过拟合。最后,Softmax层输出对样本分类的结果,取最大后验概率值作为输出风险指数0-1之间的概率值。该概率值即为非结构化项目风险识别结果,用于反映项目存在风险的概率。由此可见,通过对关键词进行情感分类,能够识别各个关键词的情感倾向,从而结合情感倾向进行风险识别。例如,情感倾向越负面、越强烈的关键词对应的风险指数越大;情感倾向越正面、越缓和的关键词对应的风险指数越小。
最后,在得到非结构化项目风险识别结果(即辅助风险指标)以及结构化项目风险识别结果之后,进一步实施风险控制:
项目风险应对措施主要包括如下几种:项目风险规避措施、项目风险遏制措施、项目风险化解措施、项目风险消减措施、项目风险转移措施、项目风险容忍措施等。制定和完善项目风险应对措施,基于对项目以下维度的判断情况:i)项目风险的特性;ii)项目组织抗风险能力;iii)可供选择的风险应对措施。其中前两者可以从结构化数据风险评估装置和非结构化风险评估装置的中间过程数据选取作为参考指标。
由此可见,本发明涉及基于结构化数据的项目风险评估、项目非结构化数据文本关键词提取、项目非结构化数据的情感分类、项目风险追踪、项目风险控制举措等部分,形成完整的识别、确认、干预流程,识别项目全流程的风险并预警,及时识别风险类型并进行相应举措,将项目过程中的风险发生成本降至最低。
综上可知,在本实施例中,根据项目结构化数据评估项目风险体系,采用LMBP神经网络计算主要风险指标(即结构化项目风险识别结果),可以较BP神经网络算法减少迭代步数、缩短收敛时间,提高生产过程中的可操作性。另外,针对项目全流程中的非结构化数据,采用文本处理的手段,利用关键词提取、文本情感分类模块,减少专家打分等手段带来的人为因素对风险评估的干扰因素,同时能在项目全过程进行该次要风险指标的计算,为及时预警风险点提供技术支持。
总而言之,在现有技术中,大多为事前的风险评估方法,采用BP神经网络的项目风险评估模型,受样本量限制,对指标数据的完整性要求较高,可操作性受到制约,且无法做到全项目过程实时的风险预警。本发明采用LMBP神经网络计算主风险指标,可以较BP神经网络算法减少迭代步数、缩短收敛时间,在不影响训练模型准确率的情况下,LMBP网络模型既收敛,且所需时间最短。另外,本发明针对项目过程中的非结构化项目数据进行分析,为实现文本的深层次特征挖掘,通过多通道的LSTM叠加,使用多层神经网络结构来挖掘文本深层特征。因此,本发明可以在项目开始前和进行过程中都进行项目风险计算和评分,全流程贯穿于工程风险监测并预警,以便进行及时的风险干预举措。
实施例三
图3示出了本发明实施例三提供的一种业务项目的风险识别装置的结构示意图,具体包括:
获取模块31,适于获取业务项目的项目数据,提取所述项目数据中包含的结构化数据,根据所述结构化数据确定所述项目数据中包含的非结构化数据;
结构化处理模块32,适于针对所述结构化数据,根据业务项目类型确定与所述结构化数据相对应的结构化项目风险识别结果;
非结构化处理模块33,适于针对所述非结构化数据进行语义分析,根据语义分析结果提取所述非结构化数据中包含的关键词,根据所述关键词确定与所述非结构化数据相对应的非结构化项目风险识别结果;
风险识别模块34,适于根据所述结构化项目风险识别结果以及所述非结构化项目风险识别结果,识别所述业务项目中包含的风险点。
可选的,所述结构化处理模块具体适于:
针对所述结构化数据,通过层次分析法以及第一LMBP神经网络模型确定与所述结构化数据相对应的结构化项目风险识别结果;
其中,所述层次分析法用于确定各个影响因子的权重,第一LMBP神经网络模型用于基于各个影响因子的权重识别与所述结构化数据相对应的结构化项目风险识别结果。
可选的,所述非结构化处理模块具体适于:
针对所述非结构化数据进行预处理,确定预处理后的非结构化数据中的各个候选词语的语义贡献度以及词频统计特征;
根据各个候选词语的语义贡献度以及词频统计特征,从各个候选词语中提取关键词。
可选的,所述非结构化处理模块具体适于:
根据各个候选词语的语义贡献度滤除候选词语中包含的非主题相关词语,得到候选词语中包含的主题相关词语,并确定各个主题相关词语的词频统计特征。
可选的,各个主题相关词语的词频统计特征包括:词频逆向文档频率、词性权重、和/或词语在文档中的出现位置。
可选的,所述非结构化处理模块具体适于:
通过第二LMBP神经网络模型确定与所述非结构化数据相对应的非结构化项目风险识别结果;其中,所述第二LMBP神经网络模型为多层神经网络结构。
可选的,所述风险识别模块具体适于:
针对识别出的风险点,确定与所述风险点相对应的风险规避策略,按照所述风险规避策略执行风险规避处理。
实施例四
本申请实施例四提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的业务项目的风险识别方法。可执行指令具体可以用于使得处理器执行上述方法实施例中对应的各个操作。
实施例五
图4示出了根据本发明实施例五的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)406、存储器(memory)404、以及通信总线408。
其中:
处理器402、通信接口406、以及存储器404通过通信总线408完成相互间的通信。
通信接口406,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述业务项目的风险识别方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器404,用于存放程序410。存储器404可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行上述方法实施例中对应的各个操作。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种业务项目的风险识别方法,包括:
获取业务项目的项目数据,提取所述项目数据中包含的结构化数据,根据所述结构化数据确定所述项目数据中包含的非结构化数据;
针对所述结构化数据,根据业务项目类型确定与所述结构化数据相对应的结构化项目风险识别结果;
针对所述非结构化数据进行语义分析,根据语义分析结果提取所述非结构化数据中包含的关键词,根据所述关键词确定与所述非结构化数据相对应的非结构化项目风险识别结果;
根据所述结构化项目风险识别结果以及所述非结构化项目风险识别结果,识别所述业务项目中包含的风险点。
2.根据权利要求1所述的方法,其中,所述针对所述结构化数据,根据业务项目类型确定与所述结构化数据相对应的结构化项目风险识别结果包括:
针对所述结构化数据,通过层次分析法以及第一LMBP神经网络模型确定与所述结构化数据相对应的结构化项目风险识别结果;
其中,所述层次分析法用于确定各个影响因子的权重,第一LMBP神经网络模型用于基于各个影响因子的权重识别与所述结构化数据相对应的结构化项目风险识别结果。
3.根据权利要求1所述的方法,其中,所述针对所述非结构化数据进行语义分析,根据语义分析结果提取所述非结构化数据中包含的关键词包括:
针对所述非结构化数据进行预处理,确定预处理后的非结构化数据中的各个候选词语的语义贡献度以及词频统计特征;
根据各个候选词语的语义贡献度以及词频统计特征,从各个候选词语中提取关键词。
4.根据权利要求3所述的方法,其中,所述确定预处理后的非结构化数据中的各个候选词语的语义贡献度以及词频统计特征包括:
根据各个候选词语的语义贡献度滤除候选词语中包含的非主题相关词语,得到候选词语中包含的主题相关词语,并确定各个主题相关词语的词频统计特征。
5.根据权利要求4所述的方法,其中,各个主题相关词语的词频统计特征包括:词频逆向文档频率、词性权重、和/或词语在文档中的出现位置。
6.根据权利要求1所述的方法,其中,所述根据所述关键词确定与所述非结构化数据相对应的非结构化项目风险识别结果包括:
通过第二LMBP神经网络模型确定与所述非结构化数据相对应的非结构化项目风险识别结果;其中,所述第二LMBP神经网络模型为多层神经网络结构。
7.根据权利要求1所述的方法,其中,所述识别所述业务项目中包含的风险点包括:
针对识别出的风险点,确定与所述风险点相对应的风险规避策略,按照所述风险规避策略执行风险规避处理。
8.一种业务项目的风险识别装置,包括:
获取模块,适于获取业务项目的项目数据,提取所述项目数据中包含的结构化数据,根据所述结构化数据确定所述项目数据中包含的非结构化数据;
结构化处理模块,适于针对所述结构化数据,根据业务项目类型确定与所述结构化数据相对应的结构化项目风险识别结果;
非结构化处理模块,适于针对所述非结构化数据进行语义分析,根据语义分析结果提取所述非结构化数据中包含的关键词,根据所述关键词确定与所述非结构化数据相对应的非结构化项目风险识别结果;
风险识别模块,适于根据所述结构化项目风险识别结果以及所述非结构化项目风险识别结果,识别所述业务项目中包含的风险点。
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的业务项目的风险识别方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的业务项目的风险识别方法对应的操作。
CN202010052905.9A 2020-01-17 2020-01-17 业务项目的风险识别方法及装置 Pending CN113139705A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010052905.9A CN113139705A (zh) 2020-01-17 2020-01-17 业务项目的风险识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010052905.9A CN113139705A (zh) 2020-01-17 2020-01-17 业务项目的风险识别方法及装置

Publications (1)

Publication Number Publication Date
CN113139705A true CN113139705A (zh) 2021-07-20

Family

ID=76808443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010052905.9A Pending CN113139705A (zh) 2020-01-17 2020-01-17 业务项目的风险识别方法及装置

Country Status (1)

Country Link
CN (1) CN113139705A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780827A (zh) * 2021-09-14 2021-12-10 北京沃东天骏信息技术有限公司 一种物品筛选方法、装置、电子设备及计算机可读介质
CN115983622A (zh) * 2022-11-17 2023-04-18 浙江淏瀚信息科技有限公司 一种内控协同管理系统的风险预警方法
CN116402048A (zh) * 2023-06-02 2023-07-07 布比(北京)网络技术有限公司 一种可解释的区块链应用趋势分析方法及系统
CN117422314A (zh) * 2023-12-19 2024-01-19 鲁信科技股份有限公司 一种基于大数据分析的企业数据评估方法及设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150248476A1 (en) * 2013-03-15 2015-09-03 Akuda Labs Llc Automatic Topic Discovery in Streams of Unstructured Data
CN106469340A (zh) * 2015-08-17 2017-03-01 苏州优估营网络科技有限公司 一种基于神经网络的复合型项目风险评估模型
CN108132929A (zh) * 2017-12-25 2018-06-08 上海大学 一种海量非结构化文本的相似性计算方法
US20180349817A1 (en) * 2017-06-01 2018-12-06 Autodesk, Inc. Architecture, engineering and construction (aec) risk analysis system and method
CN109472462A (zh) * 2018-10-18 2019-03-15 中山大学 一种基于多模型堆栈融合的项目风险评级方法及装置
CN110147425A (zh) * 2019-05-22 2019-08-20 华泰期货有限公司 一种关键词提取方法、装置、计算机设备及存储介质
CN110334202A (zh) * 2019-03-28 2019-10-15 平安科技(深圳)有限公司 基于新闻应用软件的用户兴趣标签构建方法及相关设备
CN110362828A (zh) * 2019-07-16 2019-10-22 中国工商银行股份有限公司 网络资讯风险识别方法及系统
CN110619568A (zh) * 2019-09-17 2019-12-27 王文斌 风险评估报告的生成方法、装置、设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150248476A1 (en) * 2013-03-15 2015-09-03 Akuda Labs Llc Automatic Topic Discovery in Streams of Unstructured Data
CN106469340A (zh) * 2015-08-17 2017-03-01 苏州优估营网络科技有限公司 一种基于神经网络的复合型项目风险评估模型
US20180349817A1 (en) * 2017-06-01 2018-12-06 Autodesk, Inc. Architecture, engineering and construction (aec) risk analysis system and method
CN108132929A (zh) * 2017-12-25 2018-06-08 上海大学 一种海量非结构化文本的相似性计算方法
CN109472462A (zh) * 2018-10-18 2019-03-15 中山大学 一种基于多模型堆栈融合的项目风险评级方法及装置
CN110334202A (zh) * 2019-03-28 2019-10-15 平安科技(深圳)有限公司 基于新闻应用软件的用户兴趣标签构建方法及相关设备
CN110147425A (zh) * 2019-05-22 2019-08-20 华泰期货有限公司 一种关键词提取方法、装置、计算机设备及存储介质
CN110362828A (zh) * 2019-07-16 2019-10-22 中国工商银行股份有限公司 网络资讯风险识别方法及系统
CN110619568A (zh) * 2019-09-17 2019-12-27 王文斌 风险评估报告的生成方法、装置、设备及存储介质

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
孙文建,杨文亚: ""基于LMBP神经网络的国际工程项目风险评价研究"", 《现代电子技术》, vol. 40, no. 23, pages 109 - 118 *
孙文建: ""基于 LMBP神经网络的国际工程项目风险评价研究"", 《现代电子技术》, vol. 40, no. 23, pages 109 - 118 *
孙文建: "基于 LMBP 神经网络的国际工程项目风险评价研究"", 《现代电子技术》, vol. 40, no. 23, 1 December 2017 (2017-12-01), pages 109 - 118 *
柳尚: ""基于数据挖掘的隧道施工全过程安全风险动态评估方法及工程应用"", 《中国优秀硕士学位论文全文数据库工程科技 II 辑》,, no. 01, 15 January 2019 (2019-01-15), pages 034 - 1506 *
柳尚: ""基于数据挖掘的隧道施工全过程安全风险动态评估方法及工程应用"", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》, no. 01, pages 034 - 1506 *
柳尚: ""基于数据挖掘的隧道施工全过程安全风险动态评估方法及工程应用"", 《中国优秀硕士学位论文全文数据库工程科技II辑》, no. 01, pages 034 - 1506 *
王立霞等: "基于语义的中文文本关键词提取算法", 《计算机工程》, vol. 38, no. 01, 5 January 2012 (2012-01-05), pages 1 - 4 *
骆珣: "《项目管理》", 30 June 2006, 北京理工大学出版社, pages: 1 - 12 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780827A (zh) * 2021-09-14 2021-12-10 北京沃东天骏信息技术有限公司 一种物品筛选方法、装置、电子设备及计算机可读介质
CN115983622A (zh) * 2022-11-17 2023-04-18 浙江淏瀚信息科技有限公司 一种内控协同管理系统的风险预警方法
CN115983622B (zh) * 2022-11-17 2023-09-26 浙江淏瀚信息科技有限公司 一种内控协同管理系统的风险预警方法
CN116402048A (zh) * 2023-06-02 2023-07-07 布比(北京)网络技术有限公司 一种可解释的区块链应用趋势分析方法及系统
CN116402048B (zh) * 2023-06-02 2023-10-10 布比(北京)网络技术有限公司 一种可解释的区块链应用趋势分析方法及系统
CN117422314A (zh) * 2023-12-19 2024-01-19 鲁信科技股份有限公司 一种基于大数据分析的企业数据评估方法及设备
CN117422314B (zh) * 2023-12-19 2024-04-12 鲁信科技股份有限公司 一种基于大数据分析的企业数据评估方法及设备

Similar Documents

Publication Publication Date Title
CN110799981B (zh) 用于与领域无关的方面级别情绪检测的系统和方法
Clark et al. Improving coreference resolution by learning entity-level distributed representations
CN113139705A (zh) 业务项目的风险识别方法及装置
Mandal et al. Unsupervised approaches for measuring textual similarity between legal court case reports
US11741384B2 (en) Adaptable systems and methods for discovering intent from enterprise data
Sindhura et al. Sentiment analysis for product reviews based on weakly-supervised deep embedding
Spangher et al. Multitask semi-supervised learning for class-imbalanced discourse classification
Sarnovský et al. Fake news detection related to the covid-19 in slovak language using deep learning methods
Bella et al. ATLaS: A framework for traceability links recovery combining information retrieval and semi-supervised techniques
Lee et al. Detecting suicidality with a contextual graph neural network
Azad et al. Picking pearl from seabed: Extracting artefacts from noisy issue triaging collaborative conversations for hybrid cloud services
Tan et al. Constructing and interpreting causal knowledge graphs from news
CN109299007A (zh) 一种缺陷修复者自动推荐方法
Tirunagari Data mining of causal relations from text: analysing maritime accident investigation reports
CN115965030A (zh) 一种区域数据监测方法和系统
Liu et al. Multiple instance learning for offensive language detection
Jayashree et al. Sentimental analysis on voice based reviews using fuzzy logic
Wen et al. Few-shot named entity recognition with joint token and sentence awareness
Shupta et al. An Adaptive Approach to Detecting Fake News Based on Generalized Text Features.
Mentzingen et al. Automation of legal precedents retrieval: findings from a rapid literature review
CN118171645B (zh) 一种基于文本分类的商业信息分析方法及系统
Baginski Automatic Detection and classification of suicide-related content in English texts
Mamatha et al. Supervised aspect category detection of co-occurrence data using conditional random fields
US11966570B2 (en) Automated processing and dynamic filtering of content for display
Dunér et al. Solving Problems, One Role at a Time

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination