CN115481909A - 用于经营性机构审计的机构画像生成方法和装置 - Google Patents

用于经营性机构审计的机构画像生成方法和装置 Download PDF

Info

Publication number
CN115481909A
CN115481909A CN202211163404.3A CN202211163404A CN115481909A CN 115481909 A CN115481909 A CN 115481909A CN 202211163404 A CN202211163404 A CN 202211163404A CN 115481909 A CN115481909 A CN 115481909A
Authority
CN
China
Prior art keywords
label
data
model
fact
agency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211163404.3A
Other languages
English (en)
Inventor
虞樱
任远
李雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202211163404.3A priority Critical patent/CN115481909A/zh
Publication of CN115481909A publication Critical patent/CN115481909A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种用于经营性机构审计的机构画像生成方法和装置,涉及大数据领域,方法包括:获取经营性机构的企业数据;根据企业数据生成经营性机构的事实标签,事实标签可以通过对企业数据进行分析统计得到;根据企业数据生成经营性机构的模型标签;将事实标签及模型标签作为模型参数,将企业数据中的舆情数据作为特征,通过多元逻辑回归模型的处理得到输出数据并作为健康度预测标签;根据事实标签、模型标签及健康度预测标签构建机构画像。本申请通过采集企业大数据,建立带有健康度预测标签的机构画像,每个机构进行画像,使得审计员可以随时监控机构数据变化情况,把握风险动向,将有限的审计产能用于最需要进行现场审计的机构,降低企业风险。

Description

用于经营性机构审计的机构画像生成方法和装置
技术领域
本发明涉及大数据领域,可用于金融领域,尤其涉及一种用于经营性机构审计的机构画像生成方法和装置。
背景技术
通常大型商业银行集团公司参与营运的机构数量少则几百,多则成千上万家。从地理位置上区分包括:境内机构和境外机构;从性质上区分包括:总行、一级分行、二级分行、直属分行和网点;从经营属性:银行、保险、理财等。风险管理的适当性和有效性是内部审计的重要工作内容。随着大数据技术的日益成熟,数据呈现出全面性、海量性、动态性特征。由于数据的复杂性,采用传统的内部审计作业模式、方式方法,无法对集团公司的各机构的存在的风险进行预测,从而无法有效地把控风险。
发明内容
有鉴于此,本发明提供一种基于大数据的自动推荐整改问题责任人的方法和装置,以解决上述提及的现有审计系统及方法不能及时对集团公司的各机构的存在的风险进行预测,从而无法有效地把控风险的问题。
为了实现上述目的,本发明采用以下方案:
根据本发明的第一方面,提供一种用于经营性机构审计的机构画像生成方法,所述方法包括:获取经营性机构的企业数据,将所述企业数据进行清洗过滤并经文本挖掘算法处理后导入数据湖进行存储;根据所述企业数据生成所述经营性机构的事实标签,所述事实标签可以通过对所述企业数据进行分析统计得到;根据所述企业数据生成所述经营性机构的模型标签,所述模型标签通过将所述企业数据输入预设数据模型,经过所述预设数据模型处理后得到;将所述事实标签及所述模型标签作为模型参数,将所述企业数据中的舆情数据作为特征,以所述舆情数据分别和事实标签及所述模型标签构成的二维数组作为多元逻辑回归模型的输入,通过所述多元逻辑回归模型的处理得到输出数据,将所述输出数据作为所述经营性机构的健康度预测标签;根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像
根据本发明的第二方面,提供一种用于经营性机构审计的机构画像生成装置,所述装置包括:数据获取单元,用于获取经营性机构的企业数据,将所述企业数据进行清洗过滤并经文本挖掘算法处理后导入数据湖进行存储;事实标签生成单元,用于根据所述企业数据生成所述经营性机构的事实标签,所述事实标签可以通过对所述企业数据进行分析统计得到;模型标签生成单元,用于根据所述企业数据生成所述经营性机构的模型标签,所述模型标签通过将所述企业数据输入预设数据模型,经过所述预设数据模型处理后得到;健康度预测标签单元,用于将所述事实标签及所述模型标签作为模型参数,将所述企业数据中的舆情数据作为特征,以所述舆情数据分别和事实标签及所述模型标签构成的二维数组作为多元逻辑回归模型的输入,通过所述多元逻辑回归模型的处理得到输出数据,将所述输出数据作为所述经营性机构的健康度预测标签;画像构建单元,用于根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像。
根据本发明的第三方面,提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,处理器执行所述计算机程序时实现上述方法的步骤。
根据本发明的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
根据本发明的第五方面,提供一种计算机程序产品,包括计算机程序/指令,其所述计算机程序/指令被处理器执行时实现上述方法的步骤。
由上述技术方案可知,本申请通过采集企业大数据,建立带有健康度预测标签的机构画像,每个机构进行画像,使得审计员可以随时监控机构数据变化情况,把握风险动向,将有限的审计产能用于最需要进行现场审计的机构,降低企业风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本申请实施例提供的一种用于经营性机构审计的机构画像生成方法的流程示意图;
图2是本申请实施例提供的一种用于经营性机构审计的机构画像生成装置的结构示意图;
图3是本申请另一实施例提供的用于经营性机构审计的机构画像生成装置的结构示意图;
图4是本申请另一实施例提供的用于经营性机构审计的机构画像生成装置的结构示意图;
图5是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本申请中技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。本申请实施例中的用户信息均是通过合法合规途径获得,并且对用户信息的获取、存储、使用、处理等经过客户授权同意的。
如图1所示为本申请实施例提供的一种用于经营性机构审计的机构画像生成方法的流程示意图,该方法包括如下步骤:
步骤S101:获取经营性机构的企业数据,将所述企业数据进行清洗过滤并经文本挖掘算法处理后导入数据湖进行存储。
在本实施例中银行经营性机构的企业数据可以包括结构化数据、非结构化数据、区块链上数据和互联网数据,其中结构化数据和非结构化数据可以从银行不同系统进行导入,区块链上数据可以通过专用接口导入,而互联网数据可以通过互联网予以获得。
结构化数据包括从银行内部不同系统中采集的财务数据,例如资产负债数据、利润数据、现金流数据、贷款交易明细数据等,以及从银行内部不同系统中,采集的全部投诉数据、审计问题、整改情况等数据。
非结构化数据包括从银行内部不同系统中采集的员工违规、涉案数据。
区块链上数据包括监管机构对本机构的投诉数据、法院对本机构的立案数据、机构市场占有率、机构所在区域GDP增速等。
互联网数据包括通过互联网可以获得的本机构的舆情数据、声誉数据。
在本实施例中,将上述企业数据进行清洗过滤后,可以通过词频-逆向文件频率(term frequency–inverse document frequency,TF-IDF)、线性判别式分析(LinearDiscriminant Analysis,LDA)等文本挖掘算法进行分类处理,然后再导入数据湖进行存储。
步骤S102:根据所述企业数据生成所述经营性机构的事实标签,所述事实标签可以通过对所述企业数据进行分析统计得到。
在本实施例中,事实标签可以包括:行内投诉、监管投诉、问题整改率和项目覆盖率,这类标签可以通过对相关数据进行统计分析得到。
步骤S103:根据所述企业数据生成所述经营性机构的模型标签,所述模型标签通过将所述企业数据输入预设数据模型,经过所述预设数据模型处理后得到。
在本实施例中,模型标签可以包括:资产质量评级、资本充足性、盈利能力、流动性和贷款质量。对于每一项内容,可以通过预设数据模型进行计算,得到几类分级标签,比如对于资产质量评级,通过计算可以分为五级:1级(<5%质量很高)、2级(5%-15%质量令人满意)、3级(15%-30%不太令人满意)、4级(30%-50%贷款存在严重问题)、5级(>50%资产质量极差)。
以上述资产质量评级为例,该预设数据模型计算公式比如可以为:加权问题贷款与基础资本之比=加权问题贷款/基础资本=(次级贷款×20%+可疑贷款×50%+损失贷款×100%)/(权益资本+盈余+留存收益+贷款损失准备)。
步骤S104:将所述事实标签及所述模型标签作为模型参数,将所述企业数据中的舆情数据作为特征,以所述舆情数据分别和事实标签及所述模型标签构成的二维数组作为多元逻辑回归模型的输入,通过所述多元逻辑回归模型的处理得到输出数据,将所述输出数据作为所述经营性机构的健康度预测标签。
比如,可以将下述二维数组及其对应权重作为多元逻辑回归模型的输入,便可得到表1所列出的经营性机构的风险预测值,可以风险预测值作为经营性机构的健康度预测标签。
客户监管投诉情况(0,0;1,0;2,0;3,0;4,0;5,1;6,1;......)权重:0.2
不良贷款曝光情况 (0,0;1,1;2,1;3,1;4,1;5,1;6,1;......) 权重:2
理财产品投诉情况 (10万以下,0; 10万以上,1;100万,1; )...... 权重:2高管变动情况(0,0;1,0;2,1;3,1;4,1;5,1;6,1;......)权重:0.5
员工异常行为(0,0;1,0;2,0;3,0;4,0;5,1;6,1;......)权重:0.1
所在区域GDP趋势:(2.5,0;3.6,0;-1.2,1;-2.3,-1;4,0;-5,1;-6,1;......)权重:0.1法院立案通知(0,0;1,0;2,0;3,0;4,0;5,1;6,1;......)权重:1.2
法律纠纷情况(0,0;1,0;2,0;3,0;4,0;5,1;6,1;......)权重:0.3
所在机构市场占有率(0.1,1;
0.5,0;0.7,0;0.01,0;0.03,0;0.0004,0;0.005,1;0.00006,1;......)权重:1.5
表1
风险预测值 对应分值
风险低 0
风险高 1
步骤S105:根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像。
优选的,本实施例基于大数据的自动推荐整改问题责任人的方法还可以包括如下步骤:动态获取经营性机构的风险数据,根据所述风险数据通过预设预测模型产生风险预测标签,根据所述事实标签、所述模型标签、所述健康度预测标签及所述风险预测标签动态构建机构画像并进行机构画像替换。通过动态获取风险数据并生成风险预测标签,再更新机构画像,可以动态地对企业风险状况进行监测,从而可以及时介入审计,进一步降低企业风险。
优选的,上述风险数据包括员工异常行为数据和涉案数据,上述根据风险数据通过预设预测模型产生风险预测标签包括:根据所述异常行为数据和涉案数据利用异常行为和涉案主题模型进行处理得到机构操作风险等级标签。
在本实施例中,该异常行为和涉案主题模型可以进行如下步骤来实现得到机构操作风险等级标签:
步骤a、指定关键词库,该关键词库中的数据以(违规关键词,分值)的形式进行存储,比如(迟到,1)、(借款,2)等。
步骤b、遍历员工违规记录、机构涉案记录等与员工异常行为和涉案相关的材料;
步骤c、计算每个机构的机构风险值Rn=sum(出现在关键词库中的次数*分值);
步骤d、计算所有机构的合计风险值Total;
步骤e、某机构风险概率=Rn*100/Total。
通过上述步骤处理,可以得到如表2的机构操作风险等级标签及对应分值:
表2
Figure BDA0003861126140000061
优选的,上述风险数据还可以包括贷款分类和贷款收益率,上述根据风险数据通过预设预测模型产生风险预测标签包括:根据所述贷款分类和贷款收益率专有模型生成机构信用风险等级标签。该贷款分类和贷款收益率专有模型也可为多元逻辑回归模型,其输入可以为贷款分类(收益率,对应分值)的二维数组,比如:
短期贷款:(-0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
长期贷款:(0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
活期贷款:(0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
定期贷款:(0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
透支:(0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
批发贷款:(0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
零售贷款:(0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
固定利率贷款:(0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
浮动利率贷款:(0.01,5;0,5;0.01,4;-0.1,5;0.05,1;0.001,3;0.02,2;.....)
然后通过贷款分类和贷款收益率专有模型处理可以得到如表3的机构信用风险等级标签及对应分值:
表3
Figure BDA0003861126140000071
优选的,本实施例基于大数据的自动推荐整改问题责任人的方法还可以包括如下步骤:根据事实标签和模型标签生成健康度评价标签,具体来说可以将上述步骤的事实标签和模型标签根据分级标准赋予不同分值,从而统计所有分值作为健康度评价标签,分值越高,代表该经营性机构越健康,分值越低,代表该经营性机构风险高,需要及时进行内部审计。另外,还可以根据实际情况对所述事实标签和所述模型标签对应的分值赋予权重参数化,并通过训练模型不断调整权重参数,从而使得对经营性机构当前的健康评价越来越准确。步骤S105中根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像可以进一步包括:根据所述事实标签、所述模型标签、所述健康度预测标签及所述健康度评价标签构建机构画像。
本申请通过采集企业大数据,建立带有健康度预测标签的机构画像,每个机构进行画像,使得审计员可以随时监控机构数据变化情况,把握风险动向,将有限的审计产能用于最需要进行现场审计的机构,降低企业风险。
如图2所示为本申请实施例提供的一种用于经营性机构审计的机构画像生成装置的结构示意图,所述装置包括:数据获取单元210、事实标签生成单元220、模型标签生成单元230、健康度预测标签单元240和画像构建单元250,其中数据获取单元210分别和事实标签生成单元220及模型标签生成单元230相连,健康度预测标签单元240分别和事实标签生成单元220、模型标签生成单元230及画像构建单元250相连,而画像构建单元250还分别和事实标签生成单元220及模型标签生成单元230相连。
数据获取单元210用于获取经营性机构的企业数据,将企业数据进行清洗过滤并经文本挖掘算法处理后导入数据湖进行存储。
事实标签生成单元220用于根据数据获取单元210获取的企业数据生成经营性机构的事实标签,该事实标签可以通过对所述企业数据进行分析统计得到。
模型标签生成单元230用于根据数据获取单元210获取的企业数据生成经营性机构的模型标签,该模型标签通过将企业数据输入预设数据模型,经过所述预设数据模型处理后得到。
健康度预测标签单元240用于将上述事实标签及上述模型标签作为模型参数,将所述企业数据中的舆情数据作为特征,以所述舆情数据分别和事实标签及所述模型标签构成的二维数组作为多元逻辑回归模型的输入,通过所述多元逻辑回归模型的处理得到输出数据,将所述输出数据作为所述经营性机构的健康度预测标签。
画像构建单元250用于根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像。
本申请通过采集企业大数据,建立带有健康度预测标签的机构画像,每个机构进行画像,使得审计员可以随时监控机构数据变化情况,把握风险动向,将有限的审计产能用于最需要进行现场审计的机构,降低企业风险。
如图3所示为本申请另一实施例提供的用于经营性机构审计的机构画像生成装置的结构示意图,该装置包括:数据获取单元310、事实标签生成单元320、模型标签生成单元330、健康度预测标签单元340、画像构建单元350和风险预测标签单元360,其中数据获取单元310分别和事实标签生成单元320及模型标签生成单元330相连,健康度预测标签单元340分别和事实标签生成单元320、模型标签生成单元330及画像构建单元350相连,而画像构建单元350还分别和事实标签生成单元320及模型标签生成单元330相连,风险预测标签单元360分别和数据获取单元310及画像构建单元350相连。
数据获取单元310用于获取经营性机构的企业数据,将企业数据进行清洗过滤并经文本挖掘算法处理后导入数据湖进行存储。在本实施例中,数据获取单元310还用于动态获取经营性机构的风险数据,该风险数据可以包括员工异常行为数据、涉案数据、贷款分类和贷款收益率。
事实标签生成单元320用于根据数据获取单元310获取的企业数据生成经营性机构的事实标签,该事实标签可以通过对所述企业数据进行分析统计得到。
模型标签生成单元330用于根据数据获取单元310获取的企业数据生成经营性机构的模型标签,该模型标签通过将企业数据输入预设数据模型,经过所述预设数据模型处理后得到。
健康度预测标签单元340用于将上述事实标签及上述模型标签对应的数据作为多元逻辑回归模型的输入,通过所述多元逻辑回归模型的处理得到输出数据,将所述输出数据作为所述经营性机构的健康度预测标签。
风险预测标签单元360用于根据数据获取单元310获取的风险数据通过预设预测模型产生风险预测标签。比如,可以通过数据获取单元310获取的员工异常行为数据和涉案数据,利用异常行为和涉案主题模型进行处理得到机构操作风险等级标签,以及通过数据获取单元310获取的贷款分类和贷款收益率,根据贷款分类和贷款收益率利用专有模型生成机构信用风险等级标签。
画像构建单元350用于根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像,以及用于根据所述事实标签、所述模型标签、所述健康度预测标签及所述风险预测标签动态构建机构画像并进行机构画像替换。
本申请通过采集企业大数据,建立带有健康度预测标签的机构画像,每个机构进行画像,使得审计员可以随时监控机构数据变化情况,把握风险动向,将有限的审计产能用于最需要进行现场审计的机构,降低企业风险,另外通过动态获取风险数据并生成风险预测标签,再更新机构画像,可以动态地对企业风险状况进行监测,从而可以及时介入审计,进一步降低企业风险。
如图4所示为本申请另一实施例提供的用于经营性机构审计的机构画像生成装置的结构示意图,该装置包括:数据获取单元410、事实标签生成单元420、模型标签生成单元430、健康度预测标签单元440、画像构建单元450和健康度评价单元460,其中数据获取单元410分别和事实标签生成单元420及模型标签生成单元430相连,健康度预测标签单元440分别和事实标签生成单元420、模型标签生成单元430及画像构建单元450相连,而画像构建单元450还分别和事实标签生成单元420及模型标签生成单元430相连,健康度评价单元460分别和事实标签生成单元420、模型标签生成单元430及画像构建单元450相连。
数据获取单元410、事实标签生成单元420、模型标签生成单元430和健康度预测标签单元440与图2实施例中对应单元作用相同,在此不再进行赘述。
健康度评价单元460用于根据事实标签生成单元420生成的事实标签和模型标签生成单元430生成的模型标签生成健康度评价标签。具体来说,可以将事实标签和所述模型标签根据分级标准赋予不同分值,然后统计所有分值作为健康度评价标签。并且还可以根据实际情况对所述事实标签和所述模型标签对应的分值赋予权重参数化,并通过训练模型不断调整权重参数,从而使得对经营性机构当前的健康评价越来越准确。
画像构建单元450用于根据事实标签、模型标签、健康度预测标签及健康度评价标签构建机构画像。需要指出的是,健康度评价单元460也可以应用在图3对应的实施例中,其产生的健康度评价标签也作为图3中画像构建单元350的一个要素。
本申请通过采集企业大数据,建立带有健康度预测标签的机构画像,每个机构进行画像,使得审计员可以随时监控机构数据变化情况,把握风险动向,将有限的审计产能用于最需要进行现场审计的机构,降低企业风险,另外通过健康度评价标签可以实时地展示经营性机构当前的健康状况,为审计人员提供审计参考。
图5是本发明实施例提供的电子设备的示意图。图5所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器501和存储器502。处理器501和存储器502通过总线503连接。存储器502适于存储处理器501可执行的一条或多条指令或程序。该一条或多条指令或程序被处理器501执行以实现上述用于经营性机构审计的机构画像生成方法中的步骤。
上述处理器501可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器501通过执行存储器502所存储的命令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线503将上述多个组件连接在一起,同时将上述组件连接到显示控制器504和显示装置以及输入/输出(I/O)装置505。输入/输出(I/O)装置505可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出(I/O)装置505通过输入/输出(I/O)控制器506与系统相连。
其中,存储器502可以存储软件组件,例如操作系统、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现上述用于经营性机构审计的机构画像生成方法的步骤。
本发明实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述用于经营性机构审计的机构画像生成方法的步骤。
综上所述,本申请通过采集企业大数据,建立带有健康度预测标签的机构画像,每个机构进行画像,使得审计员可以随时监控机构数据变化情况,把握风险动向,将有限的审计产能用于最需要进行现场审计的机构,降低企业风险,另外通过动态获取风险数据并生成风险预测标签,再更新机构画像,可以动态地对企业风险状况进行监测,从而可以及时介入审计,进一步降低企业风险。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种用于经营性机构审计的机构画像生成方法,其特征在于,所述方法包括:
获取经营性机构的企业数据,将所述企业数据进行清洗过滤并经文本挖掘算法处理后导入数据湖进行存储;
根据所述企业数据生成所述经营性机构的事实标签,所述事实标签通过对所述企业数据进行分析统计得到;
根据所述企业数据生成所述经营性机构的模型标签,所述模型标签通过将所述企业数据输入预设数据模型,经过所述预设数据模型处理后得到;
将所述事实标签及所述模型标签作为模型参数,将所述企业数据中的舆情数据作为特征,以所述舆情数据分别和事实标签及所述模型标签构成的二维数组作为多元逻辑回归模型的输入,通过所述多元逻辑回归模型的处理得到输出数据,将所述输出数据作为所述经营性机构的健康度预测标签;
根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像。
2.如权利要求1所述的用于经营性机构审计的机构画像生成方法,其特征在于,动态获取经营性机构的风险数据,根据所述风险数据通过预设预测模型产生风险预测标签,根据所述事实标签、所述模型标签、所述健康度预测标签及所述风险预测标签动态构建机构画像并进行机构画像替换。
3.如权利要求2所述的用于经营性机构审计的机构画像生成方法,其特征在于,所述风险数据包括员工异常行为数据和涉案数据,所述根据所述风险数据通过预设预测模型产生风险预测标签包括:根据所述异常行为数据和涉案数据利用异常行为和涉案主题模型进行处理得到机构操作风险等级标签。
4.如权利要求2所述的用于经营性机构审计的机构画像生成方法,其特征在于,所述风险数据包括贷款分类和贷款收益率,所述根据所述风险数据通过预设预测模型产生风险预测标签包括:根据所述贷款分类和贷款收益率专有模型生成机构信用风险等级标签。
5.如权利要求1所述的用于经营性机构审计的机构画像生成方法,其特征在于,还包括:根据所述事实标签和所述模型标签生成健康度评价标签,所述根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像进一步包括:根据所述事实标签、所述模型标签、所述健康度预测标签及所述健康度评价标签构建机构画像。
6.如权利要求5所述的用于经营性机构审计的机构画像生成方法,其特征在于,所述根据所述事实标签和所述模型标签生成健康度评价标签包括:
将所述事实标签和所述模型标签根据分级标准赋予不同分值,统计所有分值作为健康度评价标签。
7.如权利要求5所述的用于经营性机构审计的机构画像生成方法,其特征在于,根据实际情况对所述事实标签和所述模型标签对应的分值赋予权重参数化,并通过训练模型不断调整权重参数。
8.一种用于经营性机构审计的机构画像生成装置,其特征在于,所述装置包括:
数据获取单元,用于获取经营性机构的企业数据,将所述企业数据进行清洗过滤并经文本挖掘算法处理后导入数据湖进行存储;
事实标签生成单元,用于根据所述企业数据生成所述经营性机构的事实标签,所述事实标签通过对所述企业数据进行分析统计得到;
模型标签生成单元,用于根据所述企业数据生成所述经营性机构的模型标签,所述模型标签通过将所述企业数据输入预设数据模型,经过所述预设数据模型处理后得到;
健康度预测标签单元,用于将所述事实标签及所述模型标签作为模型参数,将所述企业数据中的舆情数据作为特征,以所述舆情数据分别和事实标签及所述模型标签构成的二维数组作为多元逻辑回归模型的输入,通过所述多元逻辑回归模型的处理得到输出数据,将所述输出数据作为所述经营性机构的健康度预测标签;
画像构建单元,用于根据所述事实标签、所述模型标签及所述健康度预测标签构建机构画像。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述用于经营性机构审计的机构画像生成方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述用于经营性机构审计的机构画像生成方法的步骤。
11.计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至7任一项所述用于经营性机构审计的机构画像生成方法的步骤。
CN202211163404.3A 2022-09-23 2022-09-23 用于经营性机构审计的机构画像生成方法和装置 Pending CN115481909A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211163404.3A CN115481909A (zh) 2022-09-23 2022-09-23 用于经营性机构审计的机构画像生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211163404.3A CN115481909A (zh) 2022-09-23 2022-09-23 用于经营性机构审计的机构画像生成方法和装置

Publications (1)

Publication Number Publication Date
CN115481909A true CN115481909A (zh) 2022-12-16

Family

ID=84393694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211163404.3A Pending CN115481909A (zh) 2022-09-23 2022-09-23 用于经营性机构审计的机构画像生成方法和装置

Country Status (1)

Country Link
CN (1) CN115481909A (zh)

Similar Documents

Publication Publication Date Title
US20230034113A1 (en) Systems and user interfaces for holistic, data-driven investigation of bad actor behavior based on clustering and scoring of related data
Amani et al. Data mining applications in accounting: A review of the literature and organizing framework
Ibrahim et al. The convergence of big data and accounting: innovative research opportunities
Romanus et al. Auditor industry specialization, auditor changes, and accounting restatements
Hautsch et al. Capturing the zero: a new class of zero-augmented distributions and multiplicative error processes
US20180114128A1 (en) Method and system for composite scoring, classification, and decision making based on machine learning
DE202014011247U1 (de) Systeme zur Datengewinnung und -modellierung
Nasir et al. Developing a decision support system to detect material weaknesses in internal control
Cirillo et al. New digital technologies and firm performance in the Italian economy
CA3004681A1 (en) System and method for detecting, profiling and benchmarking intellectual property professional practices and the liability risks associated therewith
Engel et al. Home firm performance after foreign investments and divestitures
CN112700149A (zh) 一种投资组合风险评估系统、方法及计算机设备
Asker et al. Productivity volatility and the misallocation of resources in developing economies
CN113609193A (zh) 训练用于预测客户交易行为的预测模型的方法及装置
Choi et al. Exploring the deep neural network model’s potential to estimate abnormal audit fees
US7783547B1 (en) System and method for determining hedge strategy stock market forecasts
Macher et al. The Evolution of Merger Enforcement Intensity: What Do the Data Show?
Horton et al. Reputation inflation in an online marketplace
Handoyo et al. Factors influencing audit quality of banking business sector in Indonesia
CN115481909A (zh) 用于经营性机构审计的机构画像生成方法和装置
Plog et al. Sustainable News and Their Impact on Company’s Market Capitalization Does Sustainable News About a Company Have a Positive Relationship with Its Stock Price?
Almulhim et al. How to Comprehensively Evaluate Firm Performance from Operational, Financial, and Sustainability Perspectives? A Two-Stage Data Envelopment Analysis Approach
Romansyah et al. The Effect of Profitability (ROE), Capital Structure (DER) and Firm Size on Firm Value (PBV)(Case Study on Primary Consumer Goods Manufacturing Companies Listed on the Indonesia Stock Exchange 2016-2018 Period)
Rezgui et al. KPI-based decision impact evaluation system for adaptive business intelligence.
Abbas Effect Of Growth Company, Company Size, Profitability And Leverage Against Acceptance Going Concern Audit Opinion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination