CN111798118B - 企业经营风险监控方法及装置 - Google Patents
企业经营风险监控方法及装置 Download PDFInfo
- Publication number
- CN111798118B CN111798118B CN202010607938.5A CN202010607938A CN111798118B CN 111798118 B CN111798118 B CN 111798118B CN 202010607938 A CN202010607938 A CN 202010607938A CN 111798118 B CN111798118 B CN 111798118B
- Authority
- CN
- China
- Prior art keywords
- enterprise
- node
- beneficiary
- candidate
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种企业经营风险监控方法及装置,方法包括:根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,两个节点之间的边表示实体之间的关联关系,节点包括:唯一的候选企业节点和多个受益人节点;获取预设的企业经营虚拟图谱,判断预设的企业经营虚拟图谱中的边是否在受益人网络图谱中,若否且边对应的两个节点在受益人网络图谱中,则基于边更新受益人网络图谱;监控更新后的受益人网络图谱是否存在包含候选企业节点的闭环链路,若是,则确定候选企业节点对应的候选企业存在经营风险。本申请能够提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种企业经营风险监控方法及装置。
背景技术
金融部门的主要客户为企业法人客户,对企业风险进行监控是十分必要的,例如,监控企业经营过程中是否存在投资风险、任职风险和财务风险等,对于金融部门投资决策具有重要参考意义并且对维护金融部门的安全与利益十分重要。
目前企业经营风险监控的方式大多采用基于物理族谱及经营类模型的监控方式,依赖的信息量大,若针对单个企业客户开展尽职调查的时间、资源成本较高,通常适合评估企业自身经营活动的风险,而对于隐藏在常规经营活动之下的违规性风险的识别度较低,不适合针对所有企业客户进行拉网式开展。通常情况下个人或者团体所能获取到的关键信息较为有限,并且多数信息对于企业风险特征的关系并不明确。
发明内容
针对现有技术中的问题,本申请提出了一种企业经营风险监控方法及装置,能够提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度。
为了解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种企业经营风险监控方法,包括:
根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点;
获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱;
监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险。
进一步地,所述预获取的企业经营物理图谱包括:多个链路,每个链路包括:多个候选企业节点,且存在两个人员节点分别位于所在链路的两端;相对应的,在所述确定该受益人网络图谱中的候选企业节点对应的候选企业存在企业经营风险之后,还包括:获取所述闭环链路中存在关联关系的两个受益人节点,作为所述企业经营物理图谱的人员节点;确定所述人员节点对应的链路,并将该链路中的各个候选企业节点各自对应的候选企业均作为存在经营风险的企业。
进一步地,所述企业经营物理图谱包括:多个候选企业节点,分别与各个所述候选企业节点关联的股东节点、法人节点和被投资方节点;相对应的,所述根据预获取的企业经营物理图谱,生成多个受益人网络图谱,包括:若经判断确定所述股东节点对应的股东投资比值超过股东投资比值阈值,则将该股东节点作为对应的候选企业节点的第一受益人节点;将所述法人节点作为对应的候选企业节点的第二受益人节点;将所述被投资方节点作为对应的候选企业节点的第三受益人节点;获取所述被投资方节点的第一受益人节点、第二受益人节点和第三受益人节点,作为该被投资方节点对应的候选企业节点的第四受益人节点;根据各个所述候选企业节点,以及各个所述候选企业节点各自的第一受益人节点、第二受益人节点、第三受益人节点和第四受益人节点,生成各个所述候选企业各自对应的受益人网络图谱。
进一步地,在所述获取预设的企业经营虚拟图谱之前,还包括:获取多个预设的企业经营领域词;应用预设的实体提取模型,确定各个所述企业经营领域词中的实体并在该企业经营领域词中标注各个所述实体,得到已标注的企业经营领域词,所述实体表示候选企业或人员;应用预设的图神经模型和各个所述已标注的企业经营领域词,得到所述实体之间的关联关系;根据所述实体之间的关联关系和实体构建所述企业经营虚拟图谱。
进一步地,在所述获取多个预设的企业经营领域词之前,还包括:从预设的网络媒体渠道,采集多个企业经营资讯文本;将所述企业经营资讯文本输入预设的汉语语言模型,得到各个所述企业经营资讯文本中的候选短语,获取该候选短语中与预设的领域词典匹配的候选短语;基于预设的分类模型,得到所述匹配的候选短语的评分;将所述评分大于评分阈值的候选短语输入预设的领域语言模型,并将该预设的领域语言模型的输出作为所述企业经营领域词。
进一步地,所述应用预设的实体提取模型,确定各个所述企业经营领域词中的实体,包括:应用预设的词向量模型得到所述企业经营领域词对应的第一词向量,应用预设的第一双向长短记忆网络模型得到所述企业经营领域词对应的第二词向量;将所述第一词向量和第二词向量的向量拼接结果输入预设的第二双向长短记忆网络模型,并将该第二双向长短记忆网络模型的输出作为第三词向量;应用预设的语言模型,得到所述企业经营领域词对应的第四词向量;将所述第三词向量和第四词向量的向量拼接结果输入第三双向长短记忆网络模型,根据该第三双向长短记忆模型的输出得到各个所述企业经营领域词中的实体。
第二方面,本申请提供一种企业经营风险监控装置,包括:
第一生成模块,用于根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点;
更新模块,用于获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱;
监控模块,用于监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险。
进一步地,所述预获取的企业经营物理图谱包括:多个链路,每个链路包括:多个候选企业节点,且存在两个人员节点分别位于所在链路的两端;相对应的,所述的企业经营风险监控装置,还包括:第二生成模块,用于获取所述闭环链路中存在关联关系的两个受益人节点,作为所述企业经营物理图谱的人员节点;确定模块,用于确定所述人员节点对应的链路,并将该链路中的各个候选企业节点各自对应的候选企业均作为存在经营风险的企业。
进一步地,所述企业经营物理图谱包括:多个候选企业节点,分别与各个所述候选企业节点关联的股东节点、法人节点和被投资方节点;相对应的,所述第一生成模块,用于执行以下步骤:若经判断确定所述股东节点对应的股东投资比值超过股东投资比值阈值,则将该股东节点作为对应的候选企业节点的第一受益人节点;将所述法人节点作为对应的候选企业节点的第二受益人节点;将所述被投资方节点作为对应的候选企业节点的第三受益人节点;获取所述被投资方节点的第一受益人节点、第二受益人节点和第三受益人节点,作为该被投资方节点对应的候选企业节点的第四受益人节点;根据各个所述候选企业节点,以及各个所述候选企业节点各自的第一受益人节点、第二受益人节点、第三受益人节点和第四受益人节点,生成各个所述候选企业各自对应的受益人网络图谱。
进一步地,所述的企业经营风险监控装置还包括:获取模块,用于获取多个预设的企业经营领域词;标注模块,用于应用预设的实体提取模型,确定各个所述企业经营领域词中的实体并在该企业经营领域词中标注各个所述实体,得到已标注的企业经营领域词,所述实体表示候选企业或人员;获取关联关系模块,用于应用预设的图神经模型和各个所述已标注的企业经营领域词,得到所述实体之间的关联关系;构建模块,用于根据所述实体之间的关联关系和实体构建所述企业经营虚拟图谱。
进一步地,所述的企业经营风险监控装置还包括:采集模块,用于从预设的网络媒体渠道,采集多个企业经营资讯文本;获取候选短语模块,用于将所述企业经营资讯文本输入预设的汉语语言模型,得到各个所述企业经营资讯文本中的候选短语,获取该候选短语中与预设的领域词典匹配的候选短语;匹配模块,用于基于预设的分类模型,得到所述匹配的候选短语的评分;分类模块,用于将所述评分大于评分阈值的候选短语输入预设的领域语言模型,并将该预设的领域语言模型的输出作为所述企业经营领域词。
进一步地,所述标注模块用于执行以下步骤:应用预设的词向量模型得到所述企业经营领域词对应的第一词向量,应用预设的第一双向长短记忆网络模型得到所述企业经营领域词对应的第二词向量;将所述第一词向量和第二词向量的向量拼接结果输入预设的第二双向长短记忆网络模型,并将该第二双向长短记忆网络模型的输出作为第三词向量;应用预设的语言模型,得到所述企业经营领域词对应的第四词向量;将所述第三词向量和第四词向量的向量拼接结果输入第三双向长短记忆网络模型,根据该第三双向长短记忆模型的输出得到各个所述企业经营领域词中的实体。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的企业经营风险监控方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述的企业经营风险监控方法。
由上述技术方案可知,本申请提供一种企业经营风险监控方法及装置。其中,该方法包括:根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点;获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱;监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险;能够提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度;同时,能够保证企业经营风险监控所需的数据量,提高企业经营风险监控的自动化程度,节省成本,及时对企业经营风险进行预警。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例中企业经营风险监控方法的流程示意图;
图2是本申请另一实施例中企业经营风险监控方法的流程示意图;
图3是本申请实施例中企业经营风险监控方法的步骤301至步骤305的流程示意图;
图4是本申请实施例中企业经营风险监控方法的步骤401至步骤404的流程示意图;
图5是本申请实施例中企业经营风险监控方法的步骤501至步骤504的流程示意图;
图6是本申请实施例中企业经营风险监控方法的步骤601至步骤604的流程示意图;
图7是本申请具体应用实例中获取企业领域词过程的流程示意图;
图8是本申请具体应用实例中获取实体过程的逻辑框图;
图9是本申请实施例中企业经营风险监控装置的结构示意图;
图10是本申请具体应用实例中企业经营风险监控系统的结构示意图;
图11是本申请具体应用实例中领域词典装置与领域词抽取装置之间的逻辑示意图;
图12是本申请具体应用实例中构建虚拟族谱装置与领域词抽取装置之间的逻辑示意图;
图13是本申请具体应用实例中获取企业公开信息装置与构建物理族谱装置的逻辑示意图;
图14是本申请一个举例中企业物理族谱的结构示意图;
图15是本申请具体应用实例中构建受益人网络装置与构建物理族谱装置之间的逻辑示意图;
图16是本申请一个举例中企业受益人网络的结构示意图;
图17是本申请具体应用实例中虚拟族谱构建构装置、构建受益人网络装置、构建物理族谱装置和风险识别装置之间的逻辑示意图;
图18是本申请一个举例中更新企业受益人网络的逻辑示意图;
图19是本申请一个举例中企业经营风险识别的逻辑示意图;
图20为本申请实施例的电子设备9600的系统构成示意框图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度,本申请从考虑改变现有的企业经营风险监控方式出发,提供一种企业经营风险监控方法及装置,通过构建企业常规经营物理族谱以外的企业虚拟族谱,确定企业受益人之间的关联关系,进而推断出在常规风险以外的补充风险,能够解决单一图谱的不足,为企业风险监控提供了较好的补充手段,企业物理族谱相当于企业经营物理图谱,企业虚拟族谱相当于企业经营虚拟图谱。本申请使用的算法、架构特别适用于预测企业经营活动隐含风险的场景。本申请通过有向图建立企业族谱,包括企业物理族谱,用于体现直接血缘,与企业虚拟族谱,用于体现间接影响,通过识别企业物理族谱与企业虚拟族谱中的受益人相关性对企业风险进行预警。企业物理族谱通过企业基本信息构建,为企业明确存在关联的族谱。企业虚拟族谱为企业隐族谱,并不在企业公开信息中,需要通过机器学习算法识别相关信息中的实体关系进行构建。在企业经营企业族谱中识别企业经营活动最终收益人,如企业物理族谱中的最终受益人与企业虚拟族谱中的受益人关系存在交集,则可识别企业经营活动存在风险的可能性。本申请通过领域词抽取,获得企业经营活动和组织关系等类型的短语。通过提取领域词的实体,得到企业经营活动和组织关系的三元组,进而实现企业虚拟族谱的构建。企业物理族谱基于公开信息,包括企业对外投资、控股、法人对外投资和高管任职等关系构建。在企业物理族谱中,通过受益人识别模型完成企业受益人关系网络图谱建立。将企业虚拟族谱与企业经营企业受益人关系网络图谱的关系进行并运算,若受益人的入度存在新增,则企业受益人关系网络图谱中的实体企业存在经营风险,即企业受益人可能存在额外收益,以此获知新的企业风险点。
为了提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度,本申请实施例提供一种企业经营风险监控装置,该装置可以是一服务器或客户端设备,所述客户端设备可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备和智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表和智能手环等。
在实际应用中,进行企业经营风险监控的部分可以在如上述内容所述的服务器侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
所述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
具体通过下述各个实施例进行说明。
为了提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而提高企业经营风险监控的准确性、效率和自动化程度,本实施例提供一种执行主体是企业经营风险监控装置的企业经营风险监控方法,如图1所示,该方法具体包含有如下内容:
步骤101:根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点。
具体地,所述企业经营物理图谱为根据企业基本信息构建且企业明确存在关联关系的图谱;在所述受益人网络图谱中所述受益人节点对应的受益人为所述候选企业节点对应的候选企业的受益人。所述实体之间的关联关系包括:候选企业与受益人之间的关联关系,以及受益人之间的关联关系;所述关联关系可以是投资关系和任职关系。
步骤102:获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱。
可以理解的是,将表示关联关系的边添加至所示受益人网络图谱,增加了所述受益人网络图谱中的关联关系。
步骤103:监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险。
可以理解的是,所述闭环链路可以是根据所述边新增的闭环链路,也可以是所述受益人网络图谱原有的闭环链路。所述经营风险可以是投资风险、任职风险和财务风险等。
具体地,在步骤103之后,还包含有:将存在企业经营风险的候选企业对应的预警信息输出,以实时对存在经营风险的企业进行预警。
为了进一步提高企业经营风险监控的准确性,在本申请一个实施例中,所述预获取的企业经营物理图谱包括:多个链路,每个链路包括:多个候选企业节点,且存在两个人员节点分别位于其所在链路的两端;相对应的,参见图2,在步骤103之后,还包含有:
步骤201:获取所述闭环链路中存在关联关系的两个受益人节点,作为所述企业经营物理图谱的人员节点。
其中,若所述闭环链路有多组存在关联关系的受益人节点,则分别确定各组受益人节点在所述预获取的企业经营物理图谱中对应的链路。
步骤202:确定所述人员节点对应的链路,并将该链路中的各个候选企业节点各自对应的候选企业均作为存在经营风险的企业。
具体地,可以确定在所述预获取的企业经营物理图谱中从一个受益人节点至对应的另一受益人节点所经过的各个边,以及与所述边关联的候选企业节点,确定该候选企业节点对应的候选企业存在企业经营风险。
为了提高受益人网络图谱的可靠性,进而应用可靠的受益人网络图谱提高企业经营风险监控的准确性,在本申请一个实施例中,所述企业经营物理图谱包括:多个候选企业节点,分别与各个所述候选企业节点关联的股东节点、法人节点和被投资方节点;参见图3,相对应的,步骤101包含有:
步骤301:若经判断确定所述股东节点对应的股东投资比值超过股东投资比值阈值,则将该股东节点作为对应的候选企业节点的第一受益人节点。
其中,所述股东节点对应的股东投资比值为该股东节点对应的自然人或法人,向所述候选企业节点对应的候选企业投资的金额占所述候选企业总被投资金额的比值。
步骤302:将所述法人节点作为对应的候选企业节点的第二受益人节点。
步骤303:将所述被投资方节点作为对应的候选企业节点的第三受益人节点。
步骤304:获取所述被投资方节点的第一受益人节点、第二受益人节点和第三受益人节点,作为该被投资方节点对应的候选企业节点的第四受益人节点。
步骤305:根据各个所述候选企业节点,以及各个所述候选企业节点各自的第一受益人节点、第二受益人节点、第三受益人节点和第四受益人节点,生成各个所述候选企业各自对应的受益人网络图谱。
可以理解的是,所述受益人节点包括:第一受益人节点、第二受益人节点、第三受益人节点和第四受益人节点中的至少一种。在另一受益人网络图谱中,所述被投资方节点可以作为候选企业节点。
为了构建可靠的企业经营虚拟图谱,进而应用可靠的企业经营虚拟图谱提高企业经营风险监控的准确性和智能化程度,在本申请一个实施例中,参见图4,在步骤102之前还包含有:
步骤401:获取多个预设的企业经营领域词。
其中,所述企业经营领域词为在企业经营领域经常出现,而很少在其他不相关领域出现的术语词汇,如:“企业A完成上市”、“企业B董事长张三”和“企业B董事长张三出席企业A上市”等。
步骤402:应用预设的实体提取模型,确定各个所述企业经营领域词中的实体并在该企业经营领域词中标注各个所述实体,得到已标注的企业经营领域词,所述实体表示候选企业或人员。
具体地,所述预设的实体提取模型为预先训练得到的用于确定企业经营领域词中的实体的神经网络模型;可以在企业经营领域词中的实体两侧添加标识符,如$符号,得到已标注的企业经营领域词。所述候选企业标识可以是企业全称或简称,用于区分不用的企业;所述人员标识可以是人员名称,用于区分不同的人员。
步骤403:应用预设的图神经模型和各个所述已标注的企业经营领域词,得到所述实体之间的关联关系。
具体地,可以将各个所述已标注的企业经营领域词输入预设的图神经模型,并根据该预设的图神经模型的输出得到实体之间的关联关系;所述图神经模型可以是预先训练得到的GCN图神经网络。
步骤404:根据所述实体之间的关联关系和实体构建所述企业经营虚拟图谱。
为了保证企业经营风险监控依赖的数据量,提高获取数据的效率并节省成本,进而提高构建企业经营领域词的效率和准确性,在本申请一个实施例中,参见图5,在步骤401之前还包含有:
步骤501:从预设的网络媒体渠道,采集多个企业经营资讯文本。
具体地,所述网络媒体渠道可以是预先设定的多个媒体网站,如新闻媒体网站和社交媒体网站;所述企业经营资讯文本可以是从媒体网站中获取的文本信息。
步骤502:将所述企业经营资讯文本输入预设的汉语语言模型,得到各个所述企业经营资讯文本中的候选短语,获取该候选短语中与预设的领域词典匹配的候选短语。
具体地,领域词典为特征领域特有的术语或表达方式的集合,可根据实际需要进行设置。所述汉语语言模型可以是预先训练得到的N-Gram汉语语言模型,用于获取企业经营资讯文本中的候选短语,该候选短语为符合汉语语法的短语。
步骤503:基于预设的分类模型,得到所述匹配的候选短语的评分。
具体地,所述分类模型可以是预先训练得到的基于随机森林算法的模型,用于评价上一步得到的所述匹配的候选短语。
步骤504:将所述评分大于评分阈值的候选短语输入预设的领域语言模型,并将该预设的领域语言模型的输出作为所述企业经营领域词。
具体地,所述领域语言模型可以是预先训练得到的BERT领域语言模型,用于得到所述企业经营领域词。
为了提高获取实体的准确性和效率,进而能够提高企业经营风险监控的准确性、效率和自动化程度,在本申请一个实施例中,参见图6,步骤402中所述的应用预设的实体提取模型,确定各个所述企业经营领域词中的实体包含有:
步骤601:应用预设的词向量模型得到所述企业经营领域词对应的第一词向量,应用预设的第一双向长短记忆网络模型得到所述企业经营领域词对应的第二词向量。
具体地,所述词向量模型为预先训练得到的Word2Vector模型,用于获取企业经营领域词对应的第一词向量;述第一双向长短记忆网络模型可以为预先训练得到的BILSTM模型,用于得到所述企业经营领域词对应的第二词向量。
步骤602:将所述第一词向量和第二词向量的向量拼接结果输入预设的第二双向长短记忆网络模型,并将该第二双向长短记忆网络模型的输出作为第三词向量。
具体地,所述第二双向长短记忆网络模型可以为预先训练得到的BILSTM模型,用于根据所述第一词向量和第二词向量得到第三词向量。
步骤603:应用预设的语言模型,得到所述企业经营领域词对应的第四词向量。
具体地,所述语言模型可以为预先训练得到的ELMO语言模型,用于得到所述企业经营领域词对应的第四词向量。
步骤604:将所述第三词向量和第四词向量的向量拼接结果输入第三双向长短记忆网络模型,根据该第三双向长短记忆模型的输出得到各个所述企业经营领域词中的实体。
具体地,可以将该第三双向长短记忆网络模型的输出进行全连接FullConnection操作,应用所述全连接操作的结果和条件随机场CRF算法,得到各个所述企业经营领域词中的实体。
为了进一步说明本方案,本申请提供一种企业经营风险监控方法的具体应用实例,具体描述如下:
1)获取企业经营领域词,如图7所示,具体包含有:
S11:获取企业相关信息;具体地,从预设的网络数据源,获取候选企业对应的企业经营资讯文本。
S12:获取N-gram候选短语;具体地,将所述企业经营资讯文本输入预设的汉语语言模型,得到所述企业经营资讯文本对应的第一短语集,以实现词频过滤。
例如:企业经营资讯文本可以是“……xx年xx月xx日企业A于xx交易所完成上市,上市当天企业B董事长张三出席庆祝仪式,并合影留念……”。
第一短语集可以包含有:“企业A完成上市”、“企业B董事长张三”、“企业B董事长张三出席企业A上市”、“企业A上市当天企业B”、“企业A企业B合影交易所庆祝仪式”、“企业A上市企业B”、“上市企业B董事长张三合影留念”以及“董事长张三出席庆祝仪式”等。
其中,企业经营资讯文本作为最基础的语料,通过汉语语言模型将语料中的的关键词构成符合汉语语法的短语,不考虑含义是否正确。
S13:对候选短语进行初标;得到与预设的领域词典匹配的第二短语集,该预设的领域词典即企业大辞典,可根据实际需要设置。
在一个举例中,若领域词典包含有:“上市”和“董事长”词语,则只保留此类型的短语,获得第二短语集包含有:“企业A完成上市”、“企业B董事长张三”、“企业B董事长张三出席企业A上市”、“企业A上市当天企业B”、“企业A上市企业B”、“董事长张三合影留念”和“董事长张三出席庆祝仪式”等。
S14:应用随机森林分类器;将第二短语集输入预设的分类模型,得到所述第二短语集中各个候选短语各自的评分,并将评分超过评分阈值的候选短语作为中间候选短语,所述预设的分类模型为预先训练得到的随机森林分类器。
其中,所述随机森林分类器的Wide统计特征包含有:频率、凝聚度和自由度等;所述随机森林分类器的Deep语义特征包含有:字向量、词向量以及基于词向量的内部相似度等;能够将候选短语中质量较差的短语进行去除,例如去除“企业A上市企业B”、“企业A上市当天企业B”和“事长张三合影留念”等短语,保留下来的即为中间候选短语。
S15:领域语言模型过滤;应用预设的领域语言模型过滤所述中间候选短语,得到企业经营领域词。
2)获取实体,如图8所示,具体包含有:
S21:获取企业经营领域词,如词a1和词a2,将企业经营领域词输入预设的Word2Vector模型得到该企业经营领域词对应的词向量。
S22:将企业经营领域词输入BILSTM模型,获取处理后的首尾字符拼接向量,即字向量。
S23:将S21的词向量和S22的字向量进行向量拼接,获取该企业经营领域词的组合向量。
S24:将S23输出的组合向量,输入BILSTM模型,获取处理后词向量h1。
S25:将企业经营领域词,如词a1和词a2输入ELMO语言模型得到该企业经营领域词对应的词向量h1"和词向量h1"',将词向量h1"和词向量h1"'进行向量拼接,得到处理后词向量h1',其中,ELMO语言模型为双向的LSTM语言模型。
S26:将S24输出的处理后词向量h1和S25输出的处理后词向量h1’再次输入BILSTM模型进行向量计算。
S27:将S26的计算结果进行FC(full connection)操作,获取操作结果。
S28:将S27的结果输入CRF算法(条件随机场)进行解码,获取实体,如图8中的实体B和实体C。
3)构建企业虚拟关系图谱
S31:在领域词中已识别的实体两侧加上标识符$符号,获得标注的领域词。
S32:将标注的领域词输入图神经网络GCN,进行实体关系抽取。
S33:根据实体关系和实体构建企业虚拟族谱,该企业虚拟族谱实现的功能相当于上述企业经营虚拟图谱实现的功能。
4)构建企业物理族谱
S41:根据企业公开信息和投资关系信息生成企业物理族谱,其中,该企业物理族谱包含有多个实体节点以及实体节点之间的关联关系;该实体节点包括:企业节点和人员节点,人员节点包括:股东节点和法人节点,企业节点包括:投资方节点和被投资方节点,该企业物理族谱实现的功能相当于上述企业经营物理图谱实现的功能。
5)生成受益人网络图谱
S51:将所述物理族谱中与企业节点直接关联的股东节点中,对应的股东投资比值符合预设条件的,作为所述企业节点对应的第一受益人节点。
S52:将所述物理族谱中与企业节点直接关联的法人节点作为该企业节点对应的第二受益人节点。
S53:将所述物理族谱中与企业节点直接关联的被投资方节点作为该企业节点对应的第三受益人节点。
S54:确定所述物理族谱中与企业节点直接关联的被投资方节点,将该被投资方节点的第一受益人节点、第二受益人节点和第三受益人节点作为所述企业节点对应的第四受益人节点。
S55:根据各个所述企业节点和各个所述企业节点对应的第一受益人节点、第二受益人节点、第三受益人节点和第四受益人节点,生成各个企业各自对应的受益人网络图谱,每个所述受益人网络图谱包括:企业节点和与该企业节点分别连接的受益人节点。
6)企业经营风险监控
S61:根据企业虚拟族谱,补充各个企业对应的受益人网络图谱,即将受益人网络图谱中各个实体节点之间不存在,但是在企业虚拟族谱中存在的关联关系,添加至受益人网络图谱,但是不增加受益人网络图谱中的实体节点。
S62:判断受益人网络图谱中是否产生新的闭环链路,即某受益人的入度>1。
S63:将产生新闭环链路的受益人节点代入企业物理族谱,获取实际关系链路。
S64:获取S63所得关系链路中的所有企业,将该关系链路中的所有企业均确定为经营风险企业。
从软件层面来说,为了提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而提高企业经营风险监控的准确性、效率和自动化程度,本申请提供一种用于实现所述企业经营风险监控方法中全部或部分内容的企业经营风险监控装置的实施例,参见图9,所述企业经营风险监控装置具体包含有如下内容:
第一生成模块01,用于根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点。
更新模块02,用于获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱。
监控模块03,用于监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险。
在本申请一个实施例中,所述预获取的企业经营物理图谱包括:多个链路,每个链路包括:多个候选企业节点,且存在两个人员节点分别位于所在链路的两端;相对应的,所述的企业经营风险监控装置,还包括:
第二生成模块,用于获取所述闭环链路中存在关联关系的两个受益人节点,作为所述企业经营物理图谱的人员节点。
确定模块,用于确定所述人员节点对应的链路,并将该链路中的各个候选企业节点各自对应的候选企业均作为存在经营风险的企业。
在本申请一个实施例中,所述企业经营物理图谱包括:多个候选企业节点,分别与各个所述候选企业节点关联的股东节点、法人节点和被投资方节点;相对应的,所述第一生成模块,用于执行以下步骤:
S71:若经判断确定所述股东节点对应的股东投资比值超过股东投资比值阈值,则将该股东节点作为对应的候选企业节点的第一受益人节点。
S72:将所述法人节点作为对应的候选企业节点的第二受益人节点。
S73:将所述被投资方节点作为对应的候选企业节点的第三受益人节点。
S74:获取所述被投资方节点的第一受益人节点、第二受益人节点和第三受益人节点,作为该被投资方节点对应的候选企业节点的第四受益人节点。
S75:根据各个所述候选企业节点,以及各个所述候选企业节点各自的第一受益人节点、第二受益人节点、第三受益人节点和第四受益人节点,生成各个所述候选企业各自对应的受益人网络图谱。
在本申请一个实施例中,所述的企业经营风险监控装置,还包括:
获取模块,用于获取多个预设的企业经营领域词。
标注模块,用于应用预设的实体提取模型,确定各个所述企业经营领域词中的实体并在该企业经营领域词中标注各个所述实体,得到已标注的企业经营领域词,所述实体表示候选企业或人员。
获取关联关系模块,用于应用预设的图神经模型和各个所述已标注的企业经营领域词,得到所述实体之间的关联关系。
构建模块,用于根据所述实体之间的关联关系和实体构建所述企业经营虚拟图谱。
在本申请一个实施例中,所述的企业经营风险监控装置,还包括:
采集模块,用于从预设的网络媒体渠道,采集多个企业经营资讯文本。
获取候选短语模块,用于将所述企业经营资讯文本输入预设的汉语语言模型,得到各个所述企业经营资讯文本中的候选短语,获取该候选短语中与预设的领域词典匹配的候选短语。
匹配模块,用于基于预设的分类模型,得到所述匹配的候选短语的评分。
分类模块,用于将所述评分大于评分阈值的候选短语输入预设的领域语言模型,并将该预设的领域语言模型的输出作为所述企业经营领域词。
在本申请一个实施例中,所述标注模块用于执行以下步骤:
应用预设的词向量模型得到所述企业经营领域词对应的第一词向量,应用预设的第一双向长短记忆网络模型得到所述企业经营领域词对应的第二词向量。
将所述第一词向量和第二词向量的向量拼接结果输入预设的第二双向长短记忆网络模型,并将该第二双向长短记忆网络模型的输出作为第三词向量。
应用预设的语言模型,得到所述企业经营领域词对应的第四词向量。
将所述第三词向量和第四词向量的向量拼接结果输入第三双向长短记忆网络模型,根据该第三双向长短记忆模型的输出得到各个所述企业经营领域词中的实体。
本说明书提供的企业经营风险监控装置的实施例具体可以用于执行上述企业经营风险监控方法的实施例的处理流程,其功能在此不再赘述,可以参照上述企业经营风险监控方法实施例的详细描述。
为了进一步说明本方案,本申请还提供一种企业经营风险监控系统,如图10所示,该系统包括:资讯信息抽取装置1;领域词抽取装置2;虚拟族谱构建装置3;企业公开信息装置4;构建物理族谱装置5;构建企业受益人网络装置6,企业受益人网络,即上述受益人网络图谱用于标识企业经营活动的最终受益人;风险识别装置7,用于完成企业虚拟族谱与企业受益人网络的合并,发现企业隐含风险。领域词典装置8,用于存储企业经营活动领域的词典参数及算法;关系抽取装置9,用于存储实体识别算法模型及关系抽取算法模型,以进行企业虚拟族谱构建;该企业经营风险监控系统实现的功能相当于上述企业经营风险监控装置实现的功能。
具体地,企业经营风险监控系统首先从外媒报道、社交媒体和新闻媒体等媒体渠道获取与企业经营活动相关的资讯信息作为基本分析的语料。上述语料输入领域词抽取装置2中,以提取基于短语的领域词。领域词的提取主要用于进行信息过滤,将语料中与企业经营活动密切相关的组成部分提炼出来,输入虚拟族谱构建装置3。构建企业虚拟族谱需要完成领域词中实体和关系的提取,通过关系抽取装置9中提供的基于字的CRF算法及语言模型知识,完成“实体-关系-实体”的三元组建立,再通过将三元组的实体进行组装,完成企业虚拟族谱的建立。企业公开信息装置4中存储有企业基本信息包括企业法人、股东、董事和投资信息等,将上述信息输入构建物理族谱装置5中提炼企业经营关系的企业物理族谱。将企业物理族谱输入构建企业受益人网络装置6,通过限定受益人规则,将无效的关联去除,只保留经营活动的受益人关系,即完成企业受益人网络构建。风险识别装置7通过将企业虚拟族谱与企业受益人网络构建进行重合,发现仅在企业虚拟族谱中存在的关系,若该关系补充后的企业受益人网络中存在闭环链路,则表示企业的经营活动中可能存在利益输送,该条闭环链路上的企业存在经营风险。具体描述如下:
如图11所示,领域词抽取装置2包含有:候选集模块11,候选集初标模块12,特征分类模块13,领域词模块14和随机森林算法模块15;对于领域词抽取,先从企业相关信息中自动产生大量的汉语语言模型(N-Gram)候选集,存储在候选集模块11,然后使用领域词典装置8对候选集进行初标,得到一个训练样本集存储在候选集初标模块12。领域词典为人工维护,例如“投资”、“任职”、“注资”、“全资子公司”和“法定代表人”等。以此为基础,通过随机森林算法模块15,用正负样本训练多棵树来构建分类器,在特征分类模块13中,对候选短语的质量进行评分。分类器的特征包含两类:一类是Wide统计特征:频率、凝聚度和自由度等;另一类是Deep语义特征:字向量、词向量和基于词向量的内部相似度等。领域词模块14使用预训练的BERT领域语言模型对前述分类的候选短语进行修剪,得到领域词。
如图12所示,虚拟族谱构建装置3包括:实体提取模块21、关系提取模块22、虚拟族谱模块23、语言模型模块24和图神经网络模块25。
具体地,从领域词抽取装置2中获取上一阶段生成的领域词,结合语言模型模块24存储的语言模型,在实体提取模块21完成实体提取。具体做法为,在基于字的BILSTM+CRF框架基础之上,结合词性、Pre-train和语言模型构建企业虚拟族谱。
在本具体应用实例中,所述基于字的BILSTM+CRF框架可以包含有:嵌入层、编码层和解码层。
1.Embedder嵌入层:嵌入层的输入是已经完成分词的领域词,词向量由两部分拼接组成,一部分是Word2Vector模型预训练好的词向量,另一部分是经过BILSTM模型处理后的首尾字符拼接向量;在第一层向量拼接之后,送入到第二层BILSTM模型,然后其输出和预训练好的ELMO领域语言模型的结果进行拼接。
2.Encoder编码层:编码层采用BILSTM模型,并且用通用领域的语料进行了Chunking任务的预训练。
3Decoder解码层:解码层采用CRF。
完成实体提取后,在实体两侧加上标识符。将处理好的结果输入关系提取模块22。结合图神经网络模块25完成关系提取。对于关系的提取,采用图神经网络GCN实现。通过实体两侧加上标识符来显示的告诉模型标识符中间是实体,可以进一步提升模型效果。“实体-关系”提取后,将结果输入虚拟族谱模块23,进行实体和关系的组装,完成企业虚拟族谱构建。
如图13所示,所述构建物理族谱装置5包含有:投资关系提取模块31、任职关系提取模块32和物理族谱模块33。通过读取企业公开信息装置4中的数据,获取企业实体的属性,具体为:企业名称、社会统一信用代码、经营状态、注册资本、行业门类、行政区划和机构类型,提取企业相关实体,具体为:企业法人、企业股东和主要管理人员。通过投资关系提取模块31完成企业对外投资类关系的获取,主要提取关系:企业对外投资和企业法人对外投资。通过任职关系提取模块32完成企业相关人关系的获取,主要提取关系:法人、董事、董事长、副董事长、监事、总经理、执行董事、股东、法定代表人其它公司任职和关联被执行人。通过实体和关系的提取,完成企业物理族谱的构建,保存在物理族谱模块33。
如图14所示,在一个举例中,企业物理族谱以实体为节点,节点包括:表示人员的“张三”、“张四”……“张七”,以及表示企业的“企业000”、“企业001”……“企业031”。两个节点之间的边表示实体之间的关联关系,箭头指向的节点表示被投资企业或任职人员。
如图15所示,构建企业受益人网络装置6包含有:关系提取模块41、受益人网络模块42和受益人规则模块43;基于构建物理族谱装置5中的关系和受益人规则模块43保存的业务规则,在关系提取模块41中,对企业物理族谱中的关系进行传递和删减,受益人与企业之间保留关系,非受益人关系剪除。完成企业受益人网络的生成,保存在受益人网络模块42中。具体规则如下:
1、股权占比规则,股东投资比值大于等于20%,或股权占比为前10的自然人或法人,计算为受益人。
2、法人规则,企业法人计算为企业受益人。
3、企业对外投资规则,企业对外投资的被投资方,计算为受益人。
4、受益人传递规则,企业对外投资的被投资方的受益人,也作为该企业的受益人。
参见图16,在一个举例中,保留“企业000”,“企业000”的受益人“企业001”、“企业002”、“张三”、“张四”、“张五”、“张六”、“张八”、“王三”、“王四”和“王五”,以及“企业000”与受益人之间的直接关联。
如图17所示,通过将虚拟族谱构建装置3得到的企业虚拟族谱与构建企业受益人网络装置6得到的企业受益人网络进行重合,得到仅在企业虚拟族谱中存在的关系,若该关系的补充使得企业受益人网络中产生新的闭环链路,则表示企业的经营活动中可能存在利益输送,预示该条闭环链路上的企业存在经营风险。将该条链路输入构建物理族谱装置5,得出该条闭环链路上的所有企业节点,将上述企业节点输入风险识别装置7进行保存。在一个举例中,如图18所示,企业虚拟族谱中存在B1-A1关联关系,而企业受益人网络中无此关联关系,若将B1-A1关联关系补充到企业受益人网络中,则该网络存在闭环链路。如图19所示,通过将“受益人A1-受益人B1”代入企业物理族谱,该链路上存在企业C1、企业D1和企业E1,且企业C1与企业D1、企业E1的关系为投资类,则存在受益人A1通过经营关系将利益输送到企业D1、企业E1,再通过受益人B1获取额外利益的可能性,企业C1、企业D1和企业E1存在经营风险,需要进行风险评估。
由上述描述可知,本申请提供的企业经营风险监控方法及装置,能够提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度;具体地,通过构建企业常规族谱以外的企业虚拟族谱,找出企业受益人之间的关联关系,进而推断出在常规模型以外的补充风险,解决了单一模型的不足,为企业风险识别提供了较好的补充手段。自动构建企业虚拟族谱,简化人工梳理工作,避免遗漏。自动构建企业受益人网络,减少人工干预,减少持续维护的工作投入。通过自动发现企业受益人之间的利益输送,获取企业隐含的风险行为,进而进行风险提示,减少人工排查开销。
从硬件层面来说,为了提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而提高企业经营风险监控的准确性、效率和自动化程度,本申请提供一种用于实现所述企业经营风险监控方法中的全部或部分内容的电子设备的实施例所述电子设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现所述企业经营风险监控装置以及用户终端等相关设备之间的信息传输;该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照实施例用于实现所述企业经营风险监控方法的实施例及用于实现所述企业经营风险监控装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
图20为本申请实施例的电子设备9600的系统构成的示意框图。如图20所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图20是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
在本申请一个或多个实施例中,企业经营风险监控功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
步骤101:根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点。
步骤102:获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱。
步骤103:监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险。
从上述描述可知,本申请的实施例提供的电子设备,能够提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度。
在另一个实施方式中,企业经营风险监控装置可以与中央处理器9100分开配置,例如可以将企业经营风险监控装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现企业经营风险监控功能。
如图20所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图20中所示的所有部件;此外,电子设备9600还可以包括图20中没有示出的部件,可以参考现有技术。
如图20所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
上述描述可知,本申请的实施例提供的电子设备,能够提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度。
本申请的实施例还提供能够实现上述实施例中的企业经营风险监控方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的企业经营风险监控方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤101:根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点。
步骤102:获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱。
步骤103:监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险。
从上述描述可知,本申请实施例提供的计算机可读存储介质,能够提高获取企业经营相关数据以及数据之间关联关系的效率和准确性,进而能够提高企业经营风险监控的准确性、效率和自动化程度。
本申请中上述方法的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本申请中应用了具体实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种企业经营风险监控方法,其特征在于,包括:
根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点;
获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱;
监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险;
所述企业经营物理图谱包括:多个候选企业节点,分别与各个所述候选企业节点关联的股东节点、法人节点和被投资方节点;相对应的,所述根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,包括:
若经判断确定所述股东节点对应的股东投资比值超过股东投资比值阈值,则将该股东节点作为对应的候选企业节点的第一受益人节点;
将所述法人节点作为对应的候选企业节点的第二受益人节点;
将所述被投资方节点作为对应的候选企业节点的第三受益人节点;
获取所述被投资方节点的第一受益人节点、第二受益人节点和第三受益人节点,作为该被投资方节点对应的候选企业节点的第四受益人节点;
根据各个所述候选企业节点,以及各个所述候选企业节点各自的第一受益人节点、第二受益人节点、第三受益人节点和第四受益人节点,生成各个所述候选企业各自对应的受益人网络图谱;
在所述获取预设的企业经营虚拟图谱之前,还包括:
获取多个预设的企业经营领域词;
应用预设的实体提取模型,确定各个所述企业经营领域词中的实体并在该企业经营领域词中标注各个所述实体,得到已标注的企业经营领域词,所述实体表示候选企业或人员;
应用预设的图神经模型和各个所述已标注的企业经营领域词,得到所述实体之间的关联关系;
根据所述实体之间的关联关系和实体构建所述企业经营虚拟图谱。
2.根据权利要求1所述的企业经营风险监控方法,其特征在于,所述预获取的企业经营物理图谱包括:多个链路,每个链路包括:多个候选企业节点,且存在两个人员节点分别位于其所在链路的两端;
相对应的,在所述确定该候选企业节点对应的候选企业存在经营风险之后,还包括:
获取所述闭环链路中存在关联关系的两个受益人节点,作为所述企业经营物理图谱的人员节点;
确定所述人员节点对应的链路,并将该链路中的各个候选企业节点各自对应的候选企业均作为存在经营风险的企业。
3.根据权利要求1所述的企业经营风险监控方法,其特征在于,在所述获取多个预设的企业经营领域词之前,还包括:
从预设的网络媒体渠道,采集多个企业经营资讯文本;
将所述企业经营资讯文本输入预设的汉语语言模型,得到各个所述企业经营资讯文本中的候选短语,获取该候选短语中与预设的领域词典匹配的候选短语;
基于预设的分类模型,得到所述匹配的候选短语的评分;
将所述评分大于评分阈值的候选短语输入预设的领域语言模型,并将该预设的领域语言模型的输出作为所述企业经营领域词。
4.根据权利要求1所述的企业经营风险监控方法,其特征在于,所述应用预设的实体提取模型,确定各个所述企业经营领域词中的实体,包括:
应用预设的词向量模型得到所述企业经营领域词对应的第一词向量,应用预设的第一双向长短记忆网络模型得到所述企业经营领域词对应的第二词向量;
将所述第一词向量和第二词向量的向量拼接结果输入预设的第二双向长短记忆网络模型,并将该第二双向长短记忆网络模型的输出作为第三词向量;
应用预设的语言模型,得到所述企业经营领域词对应的第四词向量;
将所述第三词向量和第四词向量的向量拼接结果输入第三双向长短记忆网络模型,根据该第三双向长短记忆模型的输出得到各个所述企业经营领域词中的实体。
5.一种企业经营风险监控装置,其特征在于,包括:
第一生成模块,用于根据预获取的企业经营物理图谱,生成多个以实体为节点的受益人网络图谱,其中,两个节点之间的边表示实体之间的关联关系,该节点包括:唯一的候选企业节点和多个受益人节点;
更新模块,用于获取预设的企业经营虚拟图谱,判断所述预设的企业经营虚拟图谱中的边是否在所述受益人网络图谱中,若否且该边对应的两个节点在所述受益人网络图谱中,则基于所述边更新所述受益人网络图谱;
监控模块,用于监控更新后的所述受益人网络图谱是否存在包含有所述候选企业节点的闭环链路,若是,则确定该候选企业节点对应的候选企业存在经营风险;
所述企业经营物理图谱包括:多个候选企业节点,分别与各个所述候选企业节点关联的股东节点、法人节点和被投资方节点;相对应的,所述第一生成模块,用于执行以下步骤:
若经判断确定所述股东节点对应的股东投资比值超过股东投资比值阈值,则将该股东节点作为对应的候选企业节点的第一受益人节点;
将所述法人节点作为对应的候选企业节点的第二受益人节点;
将所述被投资方节点作为对应的候选企业节点的第三受益人节点;
获取所述被投资方节点的第一受益人节点、第二受益人节点和第三受益人节点,作为该被投资方节点对应的候选企业节点的第四受益人节点;
根据各个所述候选企业节点,以及各个所述候选企业节点各自的第一受益人节点、第二受益人节点、第三受益人节点和第四受益人节点,生成各个所述候选企业各自对应的受益人网络图谱;
所述的企业经营风险监控装置还包括:
获取模块,用于获取多个预设的企业经营领域词;
标注模块,用于应用预设的实体提取模型,确定各个所述企业经营领域词中的实体并在该企业经营领域词中标注各个所述实体,得到已标注的企业经营领域词,所述实体表示候选企业或人员;
获取关联关系模块,用于应用预设的图神经模型和各个所述已标注的企业经营领域词,得到所述实体之间的关联关系;
构建模块,用于根据所述实体之间的关联关系和实体构建所述企业经营虚拟图谱。
6.根据权利要求5所述的企业经营风险监控装置,其特征在于,所述预获取的企业经营物理图谱包括:多个链路,每个链路包括:多个候选企业节点,且存在两个人员节点分别位于所在链路的两端;
相对应的,所述的企业经营风险监控装置,还包括:
第二生成模块,用于获取所述闭环链路中存在关联关系的两个受益人节点,作为所述企业经营物理图谱的人员节点;
确定模块,用于确定所述人员节点对应的链路,并将该链路中的各个候选企业节点各自对应的候选企业均作为存在经营风险的企业。
7.根据权利要求5所述的企业经营风险监控装置,其特征在于,还包括:
采集模块,用于从预设的网络媒体渠道,采集多个企业经营资讯文本;
获取候选短语模块,用于将所述企业经营资讯文本输入预设的汉语语言模型,得到各个所述企业经营资讯文本中的候选短语,获取该候选短语中与预设的领域词典匹配的候选短语;
匹配模块,用于基于预设的分类模型,得到所述匹配的候选短语的评分;
分类模块,用于将所述评分大于评分阈值的候选短语输入预设的领域语言模型,并将该预设的领域语言模型的输出作为所述企业经营领域词。
8.根据权利要求5所述的企业经营风险监控装置,其特征在于,所述标注模块用于执行以下步骤:
应用预设的词向量模型得到所述企业经营领域词对应的第一词向量,应用预设的第一双向长短记忆网络模型得到所述企业经营领域词对应的第二词向量;
将所述第一词向量和第二词向量的向量拼接结果输入预设的第二双向长短记忆网络模型,并将该第二双向长短记忆网络模型的输出作为第三词向量;
应用预设的语言模型,得到所述企业经营领域词对应的第四词向量;
将所述第三词向量和第四词向量的向量拼接结果输入第三双向长短记忆网络模型,根据该第三双向长短记忆模型的输出得到各个所述企业经营领域词中的实体。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至4任一项所述的企业经营风险监控方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被执行时实现权利要求1至4任一项所述的企业经营风险监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010607938.5A CN111798118B (zh) | 2020-06-30 | 2020-06-30 | 企业经营风险监控方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010607938.5A CN111798118B (zh) | 2020-06-30 | 2020-06-30 | 企业经营风险监控方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111798118A CN111798118A (zh) | 2020-10-20 |
CN111798118B true CN111798118B (zh) | 2023-08-18 |
Family
ID=72809611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010607938.5A Active CN111798118B (zh) | 2020-06-30 | 2020-06-30 | 企业经营风险监控方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111798118B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112417060A (zh) * | 2020-11-19 | 2021-02-26 | 中国建设银行股份有限公司 | 识别企业关系的方法、装置、设备和计算机可读介质 |
CN114299718B (zh) * | 2021-12-28 | 2023-02-10 | 广州小鹏汽车科技有限公司 | 交互方法、服务器及存储介质 |
CN114202261B (zh) * | 2022-02-18 | 2022-05-31 | 北京科技大学 | 一种村级工业园火灾风险有向图刻画方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101207517A (zh) * | 2007-12-12 | 2008-06-25 | 浙江大学 | 一种分布式企业服务总线节点可靠性维护方法 |
-
2020
- 2020-06-30 CN CN202010607938.5A patent/CN111798118B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101207517A (zh) * | 2007-12-12 | 2008-06-25 | 浙江大学 | 一种分布式企业服务总线节点可靠性维护方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111798118A (zh) | 2020-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240078386A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
CN111798118B (zh) | 企业经营风险监控方法及装置 | |
CN111241237B (zh) | 一种基于运维业务的智能问答数据处理方法及装置 | |
WO2021063089A1 (zh) | 规则匹配方法、规则匹配装置、存储介质及电子设备 | |
CN111783471B (zh) | 自然语言的语义识别方法、装置、设备及存储介质 | |
KR102008169B1 (ko) | 고객 질의 대응 서버, 방법 및 판독 가능 저장매체에 저장된 컴퓨터 프로그램 | |
CN111930914A (zh) | 问题生成方法和装置、电子设备以及计算机可读存储介质 | |
CN111009238A (zh) | 一种拼接语音的识别方法和装置以及设备 | |
CN111832318A (zh) | 单语句自然语言处理方法、装置、计算机设备及可读存储介质 | |
CN112417121A (zh) | 客户意图识别方法、装置、计算机设备及存储介质 | |
CN113407677A (zh) | 评估咨询对话质量的方法、装置、设备和存储介质 | |
CN113868419B (zh) | 基于人工智能的文本分类方法、装置、设备及介质 | |
CN115438149A (zh) | 一种端到端模型训练方法、装置、计算机设备及存储介质 | |
WO2022073341A1 (zh) | 基于语音语义的疾病实体匹配方法、装置及计算机设备 | |
US20230206007A1 (en) | Method for mining conversation content and method for generating conversation content evaluation model | |
CN110377706B (zh) | 基于深度学习的搜索语句挖掘方法及设备 | |
CN111949777A (zh) | 一种基于人群分类的智能语音对话方法、装置及电子设备 | |
CN114282498B (zh) | 一种应用于电力交易的数据知识处理系统 | |
CN114417974B (zh) | 模型训练方法、信息处理方法、装置、电子设备和介质 | |
CN114662452A (zh) | 去隐私化的文本标签分析方法及装置 | |
CN114118937A (zh) | 基于任务的信息推荐方法、装置、电子设备及存储介质 | |
CN114218431A (zh) | 视频搜索方法、装置、电子设备以及存储介质 | |
CN113609833A (zh) | 文件的动态生成方法、装置、计算机设备及存储介质 | |
KR101890704B1 (ko) | 음성 인식과 언어 모델링을 이용한 간편 메시지 출력장치 및 출력방법 | |
CN111159421A (zh) | 基于知识图谱的基金查询方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |