CN115456438A - 企业经营行为异常预警方法及其应用 - Google Patents
企业经营行为异常预警方法及其应用 Download PDFInfo
- Publication number
- CN115456438A CN115456438A CN202211157981.1A CN202211157981A CN115456438A CN 115456438 A CN115456438 A CN 115456438A CN 202211157981 A CN202211157981 A CN 202211157981A CN 115456438 A CN115456438 A CN 115456438A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- foreign trade
- supervision
- behavior
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Animal Behavior & Ethology (AREA)
Abstract
本申请提出了企业经营行为异常预警方法及其应用,基于大数据机器学习和知识图谱相结合的企业经营行为异常预警方法与系统,利用知识图谱的关系提取能力,将关系映射为监管指标,通过图计算的知识图谱抽取实体与实体之间点边关系来进行全维度指标自动收集,并通过知识图谱的相似度计算自动进行监管指标分类归集;利用机器学习技术实现对分类归集的同类指标的异常发现,通过纵向和横向的统计、比对实现指标异常项的自动发现。本申请可提升职能部门的监管、处置效率,对不同类别的外贸企业进行自动异常识别和及时预警,降低外贸监管风险,降低监管成本。
Description
技术领域
本申请涉及大数据技术领域,特别是一种涉及企业经营行为异常预警方法及其应用。
背景技术
随着经济发展,我国目前有超过546万家企业名称或经营范围含“外贸、进出口、外销”,政府职能部门对百万数量级企业的外贸经营活动进行监管,工作任务重、难度大,现有的外贸企业经营活动监管主要依赖专家经验制定监管规则进行数据建模分析,发现和预警外贸经营异常的企业,存在时效性差、异常发现不全面的问题。
而且现有的方式基于专家经验进行数据建模分析的外贸经营异常企业预警方式,存在以下缺点:
专家经验往往是事后总结、提炼的,受限于经验的滞后性,外贸违法违规行为被发现前通常无法进行及时预警;基于专家经验的系统监管规则设定、分析模型配置和调优周期会比较长,即时发现了新的外贸违法违规方式,也需要较长的时间才能实现外贸经营违法违规预警,预警响应滞后;外贸类别繁多,专家规则或模型在细分行业、商品类型差异下的阈值选择问题上缺乏依据,难以甄别外贸经营行为是否存在违法违规;成本控制方面,专家规则或模型方式必然需要对外贸业务进行全面研究,需要投入大量的人力和资金,导致相关部门只能抓大放小,12类外贸违法违规行为难以全面覆盖管控。同时,现有方式预警外贸经营异常企业,职能部门还需凭借自己的业务经验,人工方式去检索、核对相关信息,没有一个汇总企业外贸经营的画像数据帮助工作人员核实预警的异常外贸行为是否真的异常,增加了处置时间开销。
因此,亟待一种能够快速高效地基于监管数据进行企业经营异常预警的方法,提升职能部门的监管、处置效率,对不同类别的外贸企业进行自动异常识别和及时预警,降低外贸监管风险,降低监管成本。
发明内容
本申请实施例提供了企业经营行为异常预警方法及其应用,针对目前技术存在的效率低下、预警响应滞后等问题。
本发明核心技术主要是基于传统大数据技术,对已经完成数据标准化的企业外贸行为数据,利用图计算技术实现企业外贸行为的知识图谱刻画,生成企业外贸行为画像;利用机器学习技术,对企业外贸行为画像生成的各维度外贸行为特征指标化应用,进行横向和纵向分析,统计和比对企业的外贸行为,包括合同额、单价、频度、货运方式、进出口岸等,发现企业外贸异常行为,进行告警。
第一方面,本申请提供了企业经营行为异常预警方法,所述方法包括以下步骤:
S00、根据企业外贸数据开展企业外贸行为画像加工,以获得基于外贸画像的企业外贸行为指标,作为企业外贸行为画像;
S10、利用已有的监管案例,通过机器学习获取监管指标和异常特征,并根据已有成熟的监管指标和新获取的监管指标以及异常特征生成监管指标库;
S20、开展知识图谱技术的相似度计算,对企业外贸行为指标进行分类统计和比对分析,分类汇总企业外贸异常行为和该企业的商品异常项;
S30、根据企业外贸异常行为和企业的商品异常项与监管指标库比对,将中标的企业外贸行为和企业的商品异常项为归集到告警事件库并形成告警事件,将未中标的企业外贸行为和企业的商品异常项归集到疑似风险库。
进一步地,步骤S00的具体步骤为:
S01、基于知识图谱进行企业外贸数据中的企业外贸关系维度配置,配置企业外贸行为的关系路径,该关系路径包括企业登记信息、报关员、商品HS编码、合同编号、合同金额及商品单价;
S02、基于图计算技术对企业外贸行为进行知识图谱计算,引入神经网络的三元组关系,并在知识图谱的关系图谱基础上引入时序、时空关系,以生成三维的企业外贸行为图像。
进一步地,步骤S00中,还包括:
S03、通过专业人员对企业外贸行为图像进行各维度校验,以核查企业外贸行为图像的准确性;
S04、根据企业登记信息和企业外贸行为涉及的商品信息,以商品HS编码为维度,通过机器学习对企业同故宫标签的方式进行分类归集和管理;
S05、将企业外贸图像与监管指标库进行关联,以支持监管指标查询功能。
进一步地,步骤S10中,通过机器学习获取的监管指标和异常特征经过专业人员审核调校,以根据已有成熟的监管指标和审核调校后的监管指标以及异常特征生成监管指标库。
进一步地,步骤S20的具体步骤为:
S21、基于知识图谱的企业外贸图像和企业的商品画像的各个维度指标,通过余弦相似度算法分类和统计企业外贸行为;
S22、根据企业外贸行为图像,通过支持向量机算法对分类和统计后的企业外贸行为进行纵向比对,以获取企业异常外贸行为;
根据企业的商品HS编码,通过支持向量机算法对分类和统计后的企业外贸行为进行横向比对,以获取同类商品外贸行为异常的企业;
S23、汇总企业外贸异常行为和该企业的商品异常项,并按照监管指标的分类,进行异常项归类。
进一步地,步骤S02中,三元组关系以实体-关系-实体作为基本单位,将企业外贸行为转变成外贸关系,再转变成外贸特征。
进一步地,还包括S40:对疑似风险库进行指标分类归集,以供专业人员识别研判,并通过机器学习继续分析研判,以获取新的监管线索。
第二方面,本申请提供了一种企业经营行为异常预警系统,包括:
大数据计算平台,提供数据存储和离线计算功能,至少存储有企业外贸数据;
图计算平台,提供知识图谱系统所需的计算能力;
机器学习系统,提供机器学习功能,并用于对分类统计后的企业外贸行为指标进行比对分析,获取汇总企业外贸异常行为和该企业的商品异常项;用于开展知识图谱技术的相似度计算,对企业外贸行为指标进行分类统计;
知识图谱系统,用于根据企业外贸数据开展企业外贸行为画像加工,以获得基于外贸画像的企业外贸行为指标,作为企业外贸行为画像;
预警应用系统,用于将告警事件库中的告警事件进行告警,并能够基于企业外贸图像、监管指标库、告警事件库以及疑似风险库进行查询应用;
监管指标库,用于利用已有的监管案例,通过机器学习系统获取监管指标和异常特征,并根据已有成熟的监管指标和新获取的监管指标以及异常特征生成监管指标库;
告警事件库,用于将中标的企业外贸行为和企业的商品异常项为归集到告警事件库并形成告警事件;用于对疑似风险库进行指标分类归集,以供专业人员识别研判,并通过机器学习系统继续分析研判,以获取新的监管线索
疑似风险库,用于将未中标的企业外贸行为和企业的商品异常项归集到疑似风险库。
第三方面,本申请提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述的企业经营行为异常预警方法。
第四方面,本申请提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括根据上述的企业经营行为异常预警方法。
本发明的主要贡献和创新点如下:1、与现有技术相比,本申请通过大数据、知识图谱等最新的数据挖掘、计算技术,对企业外贸行为中的对象、活动和频度进行自动识别和异常分析,可高效且精确地挖掘外贸企业违法违规行为,同时可提升职能部门的监管、处置效率,对不同类别的外贸企业进行自动异常识别和及时预警,降低外贸监管风险,降低监管成本;
2、与现有技术相比,本申请可对企业基本信息、外贸监管数据的抽取、维度加工,并进行关系计算,得到真实反映企业外贸经营行为的各维度属性和行为数据,包括企业个体属性、行业属性、商品属性、报关活动、商品运输方式的维度数据和频度数据,形成企业对外贸易的画像。同时根据职能部门监管要求,利用机器学习技术,根据企业外贸行为画像各维度、频度数据,进行企业自身对外贸易活动同比,并对同类商品的其他企业对外贸易活动进行横向比对,挖掘存在异常指标值的企业,进行自动预警,推送企业信息和报关信息,便于职能部门工作人员进行线索核实和处置。简化了监管部门工作人员贸易监管操作流程,优化了贸易监管预警的准确率,补全了贸易监管异常目标覆盖面,提升了贸易监管预警的时效。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的企业经营行为异常预警方法的流程图;
图2是根据本申请实施例的电子装置的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
针对目前外贸企业经营活动监管主要依赖专家经验制定监管规则进行数据建模分析,发现和预警外贸经营异常的企业,存在时效性差、异常发现不全面的问题。
基于此,本发明基于知识图谱技术和大数据技术来解决现有技术存在的问题。
实施例一
本申请旨在提出企业经营行为异常预警方法,通过大数据、知识图谱等最新的数据挖掘、计算技术,对企业外贸行为中的对象、活动和频度进行自动识别和异常分析,挖掘外贸企业违法违规行为。
更为具体地,本申请基于传统大数据技术,对已经完成数据标准化的企业外贸行为数据,利用图计算技术实现企业外贸行为的知识图谱刻画,生成企业外贸行为画像;利用机器学习技术,对企业外贸行为画像生成的各维度外贸行为特征指标化应用,进行横向和纵向分析,统计和比对企业的外贸行为,包括合同额、单价、频度、货运方式、进出口岸等,发现企业外贸异常行为,进行告警。
具体地,本申请实施例提供了企业经营行为异常预警方法,可以提升职能部门的监管、处置效率,对不同类别的外贸企业进行自动异常识别和及时预警,降低外贸监管风险,降低监管成本,具体地,参考图1,所述方法包括:
S00、根据企业外贸数据开展企业外贸行为画像加工,以获得基于外贸画像的企业外贸行为指标,作为企业外贸行为画像;
具体地,包括:
S01、配置企业外贸行为关系路径,包括企业、报关员、商品HS编码、合同编号、合同金额、商品单价等企业外贸行为维度;
其中,知识配置基于知识图谱进行企业外贸行为关系维度配置,配置企业外贸行为关系路径,包括企业、报关员、商品HS编码、合同编号、合同金额、商品单价等企业外贸行为维度,为企业外贸行为画像提供关联关系、时序关系、时空关系等维度的点、边知识建模。
S01、基于图计算技术对企业外贸行为进行知识图谱计算,在关系图谱基础上,引入时序、时空关系,生成三维的企业外贸行为画像;
其中,在企业外贸行为画像中,突破传统的一条条外贸行为记录,引入外贸知识图谱技术,通过对象与对象之间的关系、频度、要素等信息,立体、直观的刻画企业外贸行为,包括企业与企业、企业与商品、企业与口岸、企业与运输工具、商品与口岸、商品与运输工具的画像。
在本实施例中,具体通过基于图计算技术对企业外贸行为进行知识图谱计算,引入图神经网络(GNN)的三元组关系,并在关系图谱基础上,引入时序、时空关系,生成三维的企业外贸行为画像,立体、直观地展示节点之间的外贸行为关系,包括频度、时序、时空等特征值。
S02、专业人员对企业外贸行为画像进行校验,核查企业外贸行为画像的准确性;
其中,生成企业外贸行为画像,需要专业人员对企业外贸行为画像各个维度进行校验,核查企业外贸行为画像的准确性,审核通过后,即完成知识建模的确认。
S03、依据企业外贸商品的HS编码,进行企业分类自动标注,并支持以报关商品类别标签的方式进行分类管理,在此基础上扩展企业分类标签,包括报企业进出口货物标签、企业进口许可商品标签、贸易方式标签、运输工具标签等;
其中,根据企业登记信息和外贸行为涉及的商品信息,以HS编码为维度,通过TF-IDF统计算法进行外贸企业分类,支持通过标签的方式对企业进行分类归集和管理。
S04、企业外贸行为画像与监管指标库进行关联,支持监管指标查询功能,通过监管指标快速筛选符合监管关注特征的外贸企业及其异常的外贸经营行为;
其中,可提供企业外贸行为画像指标查询模块,企业外贸行为画像与监管指标库进行关联,支持监管指标查询功能。
S10、利用已有的监管案例,通过机器学习获取监管指标和异常特征,并根据已有成熟的监管指标和新获取的监管指标以及异常特征生成监管指标库;
具体地,包括:
S11、标准化输入监管部门的历史案例信息,提供可信、高质量的样本案例;
其中,主要是将监管部门汇总的历史监管案例信息(企业违法违规外贸事件数据),通过已有的数据标准化模块导入大数据计算平台,供机器学习集群进行挖掘、分析。
S12、对监管案例进行机器学习,基于企业外贸行为知识图谱的各个维度,如企业、报关员、合同金额、商品单价、进出口岸等,进行异常特征挖掘;
其中,主要是通过大数据计算平台对监管案例数据运用机器学习技术进行挖掘、分析,基于企业外贸行为知识图谱的各个维度,如企业、报关员、合同金额、商品单价、进出口岸等,进行违法违规外贸行为关联的异常特征挖掘。
S13、对大数据和机器学习提取的异常指标、阈值进行专业人员审核和调校;
其中,主要是对大数据和机器学习提取的异常特征进行汇总,并统计阈值,生成监管指标,包含各维度特征和阈值,进行专业人员审核和调校,生成最终的监管指标。
S14、汇总监管部门成熟的监管指标和系统提取的新异常指标,生成监管指标库;
其中,主要是汇总监管部门成熟的监管指标和系统提取的新异常指标,生成监管指标库,实现对监管指标的管理和应用。
S20、开展知识图谱技术的相似度计算,对企业外贸行为指标进行分类统计和比对分析,分类汇总企业外贸异常行为和该企业的商品异常项;
具体地,包括:
S21、基于知识图谱的企业、商品画像的各个维度指标,通过余弦相似度算法(coine),分类和统计企业外贸行为;目的在于进行指标分类。
在本实施例中,应用知识图谱的相似度算法和机器学习向量机算法,一方面实现对监管案例的监管指标发现,一方面能够对海量企业贸易行为进行同类企业贸易行为的横向和纵向比对,发现异常企业贸易行为,挖掘疑似外贸违法违规行为的异常事件。
在本实施例中,余弦相似度算法(coine)如下:
其中,V和E分代表各个三元组关系的相似度比对,在信息检索的情况下,由于一个词的频率(TF-IDF权)不能为负数,所以两个指标的余弦相似性范围从0到1,从三元组关系的指标定义,两个企业外贸行为夹角越小,趋近于0度,余弦值越接近于1,它们的方向更加吻合,则越相似,因此取值≥0.9为同类指标;
S22、根据企业外贸经营行为画像,对统计的企业外贸行为进行纵向比对,发现企业异常外贸行为;
其中,主要通过支持向量机算法(SVM),对统计的企业外贸行为进行纵向比对,发现企业异常外贸行为,将汇聚在边缘侧面的设定为异常项;目的在于发现异常项。
S23、根据商品HS编码,对同类企业的外贸行为进行横向比对,发现同类商品外贸行为异常的企业;
其中,通过现有的支持向量机算法(SVM),对同类企业的外贸行为进行横向比对,发现同类商品外贸行为异常的企业,将汇聚在边缘侧面的设定为异常项;目的还是在于发现异常项。
在本实施例中,支持向量机算法(SVM)属于分类型算法,SVM模型将实例表示为空间中的点,将使用一条直线分隔数据点,对余弦值≥0.9的企业外贸行为时间进行完全标记。
其中,考虑企业外贸行为的特征和变量为客观值,因此采用硬边距的线性SVM算法,给定输入数据和学习目标:
硬边界SVM是在线性可分问题中求解最大边距超平面(maximum-marginhyperplane)的算法,约束条件是样本点到决策边界的距离大于等于1;
硬边界SVM可以转化为一个等价的二次凸优化(quadratic convexoptimization)问题进行求解,样本点的函数间隔:Di= yi(w.xi+b),M样本点的几何间隔为Mi= yi(w.xi+b)/||W||,最大间隔分离超平面:
MaxM
St:yi(w.xi+b)/||W||>=Mi=1,2,….N;
目标函数变为:
St.yi(w.xi+b)-1≥0,i=1,2,...,N;
如此,线性近似可分支持向量机学习问题最终变成:
而分类超平面表示为:
间隔最小:
其中,所有正分类点到平面距离与所有负分类点到平面距离总和达最大,设平面为分类正确的超平面,即硬间隔最大化,得到的SVM模型称为硬间隔支持向量机.所有样本都必须正确划分。将分类最多的平面定义为超平面,对其他边缘侧面的外贸行为设定为异常项。
S24、汇总企业外贸异常行为;
其中,主要是汇总企业外贸异常行为,按照监管指标的分类,进行异常项归类。
S30、根据企业外贸异常行为和企业的商品异常项与监管指标库比对,将中标的企业外贸行为和企业的商品异常项为归集到告警事件库并形成告警事件,将未中标的企业外贸行为和企业的商品异常项归集到疑似风险库。
具体地,包括:
S31、对归类的异常项进行比对分析,根据点、边关系归属,比对对应类别的监管指标,并进行阈值比对;
其中,这里的阈值可以根据实际情况设定,如专家以及专业人员评审通过后设定。
S32、对比对失败,未发现监管指标库中有同类的点、边关系的异常项,以及对未达到阈值的异常项,归集到疑似风险企业库;
其中,疑似风险企业库还需专业人员进行人工研判,决策疑似风险的企业外贸行为是否要进行处置,需要处置的企业外贸行为事件转到处置部门,专业人员进行人工研判,将新发现的未纳入监管指标的有监管价值的异常贸易行为,创建新的监管分类指标,通过机器学习对疑似风险的企业外贸行为进行特征挖掘,与监管指标库进行自动比较,将历史企业外贸行为与当前的风险指标进行比对,发现新的监管线索。
S33、对达到阈值的异常项,形成告警事件,归集到告警列表;
S34、将外贸行为事件和异常项推送到处置部门,形成告警事件。
在本实施例中,本申请中的基于知识图谱,引入图神经网络(GNN),实现基于有限实体关系的无限规则、指标计算。当前的画像应用更多的是实体+属性或实体+行为的二元组关系,是以单一对象为展开的目标档案的更细粒度刻画;而基于知识图谱GNN的企业贸易行为画像,引入了“实体+属性/行为+实体”三元组关系,因此,本申请通过定义实体-实体的对应,通过知识图谱技术,能够自动实现三元组画像,同时也自动创建了企业外贸行为的各类指标(关系),实现指标的全维度、全覆盖生成。
其中,三元组关系表示用G=(V,E,A,X) 来表示:
其中 V={v1,v2……,vn} 是节点集合,E=e_ij 表示边的集合(关系),A 是大小为|V|×|V|的邻接矩阵,用于表示节点之间的连接关系,如果 e_ij∈E,则 A_ij=1,X 是大小为|V|×d 的特征矩阵,X 的第i行 X_i:表示第i个节点的属性特征,其中d是属性的维度。如下表所示:
V V | 企业 | 报关员 | 商品 | 金额 | 口岸 | 运输 工具 | 运输 公司 |
企业 | E1、 E2... | E1、 E2... | E1、 E2... | E1、 E2... | E1、 E2... | E1、 E2... | E1、 E2... |
报关员 | E1、 E2... | ... | ... | ... | ... | ... | ... |
商品 | E1、 E2... | ... | ... | ... | ... | ... | ... |
金额 | E1、 E2... | ... | ... | ... | ... | ... | ... |
口岸 | E1、 E2... | ... | ... | ... | ... | ... | ... |
运输工具 | E1、 E2... | ... | ... | ... | ... | ... | ... |
运输公司 | E1、 E2... | ... | ... | ... | ... | ... | ... |
其中,每个节点v的特征用Ev表示,上述公式简化为Ev=f(V,E)。
本实施例中提到的在知识图谱基础上,引入TF-IDF统计算法统计外贸企业行业分类和指标分类,通过点边关系的关键词提取和统计,实现指标的自动分类。TF-IDF是一种统计方法,它是用来统计一个字词对于一个语料库或者一个文件集在一个文件中的重要性,词语随着在文件中的出现的次数成正比,在本发明中,通过TF-IDF统计算法自动对实体之间的关系进行关键词提取和统计分类。具体原理为现有技术,在本实施例中,分类某个企业贸易行为主要通过三元组关系中的词条的TF-IDF值进行。
实施例二
基于相同的构思,本申请还提出了一种企业经营行为异常预警系统,包括:
大数据计算平台,提供数据存储和离线计算功能,至少存储有企业外贸数据;
其中,数据计算平台作为本申请依赖的通用计算平台,是企业经营行为异常预警方法与系统的基础设施,提供数据存储、离线计算功能,还存储监管部门的企业外贸数据,并进行数据治理和资源化加工;同时内置各种大数据算法,为机器学习提供计算和数据资源支撑。
图计算平台,提供知识图谱系统所需的计算能力;
其中,图计算平台作为本发明依赖的专用计算平台,也是企业经营行为异常预警方法与系统的基础设施,提供知识图谱系统所需的计算能力,根据知识图谱系统配置的知识建模进行企业外贸数据的点边计算,自动挖掘企业外贸数据中的“实体-关系-实体”的三元组关系。
机器学习系统,提供机器学习功能,并用于对分类统计后的企业外贸行为指标进行比对分析,获取汇总企业外贸异常行为和该企业的商品异常项;用于开展知识图谱技术的相似度计算,对企业外贸行为指标进行分类统计;
其中,机器学习系统是依赖大数据计算平台计算资源,运用机器学习的算法集,对知识图谱系统归集“实体-关系-实体”的三元组关系集,进行集内特征计算,发现企业外贸行为数据异常项。
知识图谱系统,用于根据企业外贸数据开展企业外贸画像加工,以获得基于外贸画像的企业外贸行为指标,作为企业外贸行为画像;
其中,知识图谱系统是配置知识建模、关系维度,定义图计算规则,提供路径分析、中心性、社区发现等算法,利用其“实体-关系-实体”三元组基本单位,将企业贸易行为转变为贸易关系,再转变为外贸特征,为企业外贸行为画像提供管理服务和规则配置服务。
预警应用系统,用于将告警事件库中的告警事件进行告警,并能够基于企业外贸图像、监管指标库、告警事件库以及疑似风险库进行查询应用;
其中,预警应用系统围绕知识图谱系统和机器学习系统加工的企业外贸行为画像应用、监管指标库应用、告警事件库应用、疑似风险库应用,进行企业经营行为异常预警管理和应用。预警应用系统除了异常告警,还支持基于企业外贸行为画像、监管指标库、告警事件库、疑似风险库的查询应用。
监管指标库,用于利用已有的监管案例,通过机器学习系统获取监管指标和异常特征,并根据已有成熟的监管指标和新获取的监管指标以及异常特征生成监管指标库;
告警事件库,用于将中标的企业外贸行为和企业的商品异常项为归集到告警事件库并形成告警事件;用于对疑似风险库进行指标分类归集,以供专业人员识别研判,并通过机器学习系统继续分析研判,以获取新的监管线索;
疑似风险库,用于将未中标的企业外贸行为和企业的商品异常项归集到疑似风险库。主要是对发现且未达到监管阈值的企业外贸行为,或监管指标库中尚未纳入的企业外贸行为,统一登记到疑似风险企业库,由专业人员进行研判。还可通过机器学习对疑似风险的企业外贸行为进行特征挖掘,与监管指标库进行自动比较,将历史企业外贸行为与当前的风险指标进行比对,发现新的监管线索。
综上,本申请基于大数据机器学习和知识图谱相结合的企业经营行为异常预警方法与系统,利用知识图谱的关系提取能力,将关系映射为监管指标,通过图计算的知识图谱抽取实体与实体之间点边关系来进行全维度指标自动收集,并通过知识图谱的相似度计算自动进行监管指标分类归集;利用机器学习技术实现对分类归集的同类指标的异常发现,通过纵向和横向的统计、比对实现指标异常项的自动发现。
实施例三
本实施例还提供了一种电子装置,参考图2,包括存储器404和处理器402,该存储器404中存储有计算机程序,该处理器402被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
具体地,上述处理器402可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecificIntegratedCircuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器404可以包括用于数据或指令的大容量存储器404。举例来说而非限制,存储器404可包括硬盘驱动器(HardDiskDrive,简称为HDD)、软盘驱动器、固态驱动器(SolidStateDrive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器404可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器404可在数据处理装置的内部或外部。在特定实施例中,存储器404是非易失性(Non-Volatile)存储器。在特定实施例中,存储器404包括只读存储器(Read-OnlyMemory,简称为ROM)和随机存取存储器(RandomAccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(ProgrammableRead-OnlyMemory,简称为PROM)、可擦除PROM(ErasableProgrammableRead-OnlyMemory,简称为EPROM)、电可擦除PROM(ElectricallyErasableProgrammableRead-OnlyMemory,简称为EEPROM)、电可改写ROM(ElectricallyAlterableRead-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(StaticRandom-AccessMemory,简称为SRAM)或动态随机存取存储器(DynamicRandomAccessMemory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器404(FastPageModeDynamicRandomAccessMemory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDateOutDynamicRandomAccessMemory,简称为EDODRAM)、同步动态随机存取内存(SynchronousDynamicRandom-AccessMemory,简称SDRAM)等。
存储器404可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器402所执行的可能的计算机程序指令。
处理器402通过读取并执行存储器404中存储的计算机程序指令,以实现上述实施例中的任意企业经营行为异常预警方法。
可选地,上述电子装置还可以包括传输设备406以及输入输出设备408,其中,该传输设备406和上述处理器402连接,该输入输出设备408和上述处理器402连接。
传输设备406可以用来经由一个网络接收或者发送数据。上述的网络具体实例可包括电子装置的通信供应商提供的有线或无线网络。在一个实例中,传输设备包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备406可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
输入输出设备408用于输入或输出信息。在本实施例中,输入的信息可以是企业外贸数据等,输出的信息可以是告警事件等。
实施例四
本实施例还提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括根据实施例一的企业经营行为异常预警方法。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
通常,各种实施例可以以硬件或专用电路、软件、逻辑或其任何组合来实现。本发明的一些方面可以以硬件来实现,而其他方面可以由控制器、微处理器或其他计算设备执行的固件或软件来实现,但是本发明不限于此。尽管本发明的各个方面可以被示出和描述为框图、流程图或使用一些其他图形表示,但是应当理解,作为非限制性示例,本文中描述的这些框、装置、系统、技术或方法可以以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备或其某种组合来实现。
本发明的实施例可以由计算机软件来实现,该计算机软件由移动设备的数据处理器诸如在处理器实体中可执行,或者由硬件来实现,或者由软件和硬件的组合来实现。包括软件例程、小程序和/或宏的计算机软件或程序(也称为程序产品)可以存储在任何装置可读数据存储介质中,并且它们包括用于执行特定任务的程序指令。计算机程序产品可以包括当程序运行时被配置为执行实施例的一个或多个计算机可执行组件。一个或多个计算机可执行组件可以是至少一个软件代码或其一部分。另外,在这一点上,应当注意,如图中的逻辑流程的任何框可以表示程序步骤、或者互连的逻辑电路、框和功能、或者程序步骤和逻辑电路、框和功能的组合。软件可以存储在诸如存储器芯片或在处理器内实现的存储块等物理介质、诸如硬盘或软盘等磁性介质、以及诸如例如DVD及其数据变体、CD等光学介质上。物理介质是非瞬态介质。
本领域的技术人员应该明白,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以作出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.企业经营行为异常预警方法,其特征在于,包括以下步骤:
S00、根据企业外贸数据开展企业外贸行为画像加工,以获得基于外贸画像的企业外贸行为指标,作为企业外贸行为画像;
S10、利用已有的监管案例,通过机器学习获取监管指标和异常特征,并根据已有成熟的监管指标和新获取的监管指标以及异常特征生成监管指标库;
S20、开展知识图谱技术的相似度计算,对所述企业外贸行为指标进行分类统计和比对分析,分类汇总企业外贸异常行为和该企业的商品异常项;
S30、根据企业外贸异常行为和企业的商品异常项与监管指标库比对,将中标的企业外贸行为和企业的商品异常项为归集到告警事件库并形成告警事件,将未中标的企业外贸行为和企业的商品异常项归集到疑似风险库。
2.如权利要求1所述的企业经营行为异常预警方法,其特征在于,步骤S00的具体步骤为:
S01、基于知识图谱进行企业外贸数据中的企业外贸关系维度配置,配置企业外贸行为的关系路径,该关系路径包括企业登记信息、报关员、商品HS编码、合同编号、合同金额及商品单价;
S02、基于图计算技术对所述企业外贸行为进行知识图谱计算,引入神经网络的三元组关系,并在知识图谱的关系图谱基础上引入时序、时空关系,以生成三维的企业外贸行为图像。
3.如权利要求2所述的企业经营行为异常预警方法,其特征在于,步骤S00中,还包括:
S03、通过专业人员对所述企业外贸行为图像进行各维度校验,以核查所述企业外贸行为图像的准确性;
S04、根据所述企业登记信息和所述企业外贸行为涉及的商品信息,以所述商品HS编码为维度,通过机器学习对企业同故宫标签的方式进行分类归集和管理;
S05、将所述企业外贸图像与所述监管指标库进行关联,以支持监管指标查询功能。
4.如权利要求1所述的企业经营行为异常预警方法,其特征在于,步骤S10中,通过机器学习获取的监管指标和异常特征经过专业人员审核调校,以根据已有成熟的监管指标和审核调校后的监管指标以及异常特征生成所述监管指标库。
5.如权利要求1所述的企业经营行为异常预警方法,其特征在于,步骤S20的具体步骤为:
S21、基于知识图谱的企业外贸图像和企业的商品画像的各个维度指标,通过余弦相似度算法分类和统计企业外贸行为;
S22、根据所述企业外贸行为图像,通过支持向量机算法对分类和统计后的企业外贸行为进行纵向比对,以获取企业异常外贸行为;
根据企业的商品HS编码,通过支持向量机算法对分类和统计后的企业外贸行为进行横向比对,以获取同类商品外贸行为异常的企业;
S23、汇总企业外贸异常行为和该企业的商品异常项,并按照监管指标的分类,进行异常项归类。
6.如权利要求2所述的企业经营行为异常预警方法,其特征在于,步骤S02中,三元组关系以实体-关系-实体作为基本单位,将企业外贸行为转变成外贸关系,再转变成外贸特征。
7.如权利要求1-6任意一项所述的企业经营行为异常预警方法,其特征在于,还包括S40:对所述疑似风险库进行指标分类归集,以供专业人员识别研判,并通过机器学习继续分析研判,以获取新的监管线索。
8.一种企业经营行为异常预警系统,其特征在于,包括:
大数据计算平台,提供数据存储和离线计算功能,至少存储有企业外贸数据;
图计算平台,提供知识图谱系统所需的计算能力;
机器学习系统,提供机器学习功能,并用于对分类统计后的企业外贸行为指标进行比对分析,获取汇总企业外贸异常行为和该企业的商品异常项;用于开展知识图谱技术的相似度计算,对企业外贸行为指标进行分类统计;
知识图谱系统,用于根据企业外贸数据开展企业外贸行为画像加工,以获得基于外贸画像的企业外贸行为指标,作为企业外贸行为画像;
预警应用系统,用于将告警事件库中的告警事件进行告警,并能够基于企业外贸图像、监管指标库、告警事件库以及疑似风险库进行查询应用;
监管指标库,用于利用已有的监管案例,通过机器学习系统获取监管指标和异常特征,并根据已有成熟的监管指标和新获取的监管指标以及异常特征生成监管指标库;
告警事件库,用于将中标的企业外贸行为和企业的商品异常项为归集到告警事件库并形成告警事件;用于对所述疑似风险库进行指标分类归集,以供专业人员识别研判,并通过机器学习系统继续分析研判,以获取新的监管线索
疑似风险库,用于将未中标的企业外贸行为和企业的商品异常项归集到疑似风险库。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至7任一项所述的企业经营行为异常预警方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括根据权利要求1至7任一项所述的企业经营行为异常预警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211157981.1A CN115456438A (zh) | 2022-09-22 | 2022-09-22 | 企业经营行为异常预警方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211157981.1A CN115456438A (zh) | 2022-09-22 | 2022-09-22 | 企业经营行为异常预警方法及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115456438A true CN115456438A (zh) | 2022-12-09 |
Family
ID=84306345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211157981.1A Pending CN115456438A (zh) | 2022-09-22 | 2022-09-22 | 企业经营行为异常预警方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115456438A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116757709A (zh) * | 2023-08-22 | 2023-09-15 | 南京海关工业产品检测中心 | 一种基于知识图谱的铜精矿进口风险分析方法及系统 |
CN117436820A (zh) * | 2023-12-15 | 2024-01-23 | 广州敏行数字科技有限公司 | 一种基于人工智能的控制方法及系统 |
CN117710081A (zh) * | 2023-11-29 | 2024-03-15 | 浙江孚临科技有限公司 | 一种用于金融风险控制的信息服务处理系统 |
-
2022
- 2022-09-22 CN CN202211157981.1A patent/CN115456438A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116757709A (zh) * | 2023-08-22 | 2023-09-15 | 南京海关工业产品检测中心 | 一种基于知识图谱的铜精矿进口风险分析方法及系统 |
CN116757709B (zh) * | 2023-08-22 | 2023-11-14 | 南京海关工业产品检测中心 | 一种基于知识图谱的铜精矿进口风险分析方法及系统 |
CN117710081A (zh) * | 2023-11-29 | 2024-03-15 | 浙江孚临科技有限公司 | 一种用于金融风险控制的信息服务处理系统 |
CN117436820A (zh) * | 2023-12-15 | 2024-01-23 | 广州敏行数字科技有限公司 | 一种基于人工智能的控制方法及系统 |
CN117436820B (zh) * | 2023-12-15 | 2024-04-30 | 广州敏行数字科技有限公司 | 一种基于人工智能的控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115456438A (zh) | 企业经营行为异常预警方法及其应用 | |
CN112949914A (zh) | 一种产业集群的识别方法、装置、存储介质及电子设备 | |
CN112905340A (zh) | 系统资源分配方法、装置及设备 | |
CN111078512A (zh) | 告警记录生成方法、装置、告警设备及存储介质 | |
CN115879017A (zh) | 一种电力敏感数据自动化分类分级方法、装置及存储介质 | |
US8650180B2 (en) | Efficient optimization over uncertain data | |
CN115730087A (zh) | 基于知识图谱的矛盾纠纷分析和预警方法及其应用 | |
CN114118793A (zh) | 一种地方交易所风险预警方法、装置及设备 | |
US20230273924A1 (en) | Trimming blackhole clusters | |
CN116739605A (zh) | 交易数据检测方法、装置、设备及存储介质 | |
CN116628584A (zh) | 电力敏感数据处理方法、装置、电子设备及存储介质 | |
CN116821087A (zh) | 输电线路故障数据库构建方法、装置、终端及存储介质 | |
US10509809B1 (en) | Constructing ground truth when classifying data | |
CN114692978A (zh) | 一种基于大数据的社交媒体用户行为预测方法及系统 | |
CN112529319A (zh) | 基于多维特征的评分方法、装置、计算机设备及存储介质 | |
CN111612302A (zh) | 一种集团级数据管理方法和设备 | |
Alamir et al. | Application of machine learning with Big data analytics in the insurance industry | |
CN117708759B (zh) | 定位企业所属产业链环节的方法及装置 | |
CN113705920B (zh) | 火电厂用水数据样本集的生成方法和终端设备 | |
CN114978878B (zh) | 定位方法、装置、电子设备及计算机可读存储介质 | |
CN113723835B (zh) | 火电厂用水评估方法和终端设备 | |
Sreevalsan-Nair et al. | CAP-DSDN: Node Co-association Prediction in Communities in Dynamic Sparse Directed Networks and a Case Study of Migration Flow. | |
US10733183B2 (en) | Method for searching for reliable, significant and relevant patterns | |
CN116384750A (zh) | 生成标记样本及训练风险评级预测模型的方法及计算设备 | |
CN114186964A (zh) | 基于信息差异比对的工程档案实施主动收集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |