CN111967980A - 一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法 - Google Patents

一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法 Download PDF

Info

Publication number
CN111967980A
CN111967980A CN202010910468.XA CN202010910468A CN111967980A CN 111967980 A CN111967980 A CN 111967980A CN 202010910468 A CN202010910468 A CN 202010910468A CN 111967980 A CN111967980 A CN 111967980A
Authority
CN
China
Prior art keywords
data
financial
maximum entropy
entropy model
energy consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010910468.XA
Other languages
English (en)
Inventor
胡炳谦
周浩
顾一峰
韩俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ieslab Energy Technology Co ltd
Original Assignee
Shanghai Ieslab Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Ieslab Energy Technology Co ltd filed Critical Shanghai Ieslab Energy Technology Co ltd
Priority to CN202010910468.XA priority Critical patent/CN111967980A/zh
Publication of CN111967980A publication Critical patent/CN111967980A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

在现代社会中,对于企业的运营分析主要是基于企业的财务报表,从企业财务风险的角度入手;该规则在银行等金融企业中有着良好的效果,但是当评级问题涉及到工业生产领域的时候,如果只从经济指标去对企业的运营能力评估,则会存有隐患;例如:一些工业生产企业并没有将资金投入到实业发展中,而是转而投向房地产等投资行业,使得财务表格表现良好;一些生产企业盲目扩张,实际产能底下,造成资金的浪费;本发明公开了一种利用企业历史财报数据和历史能耗数据,运用最大熵模型,找到工业生产企业财务和能耗数据,与生产经营状态之间的潜在联系;当新的同行业企业申请贷款时,通过训练过的最大熵模型,为金融机构授信提供有力的分析帮助。

Description

一种基于企业财报和能耗数据采用最大熵模型进行银行授信 分析的系统及方法
技术领域
本发明涉及能耗大数据应用领域,具体涉及一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法。
背景技术
结合能耗数据对生产型企业经营状况进行监测和管理在近年来的银行授信分析中越来越多的被应用,对于如何分析出的潜在的经营风险或财务数据造假越来越被相关金融机构所重视,而成为了未来金融管理系统中一个必须要解决的问题;通常来说,企业的经营状况主要是企业的产能分析,而传统产能分析依据的是账目出口,生产统计等数据,不过这些数据存在造假的风险;本发明提出的基于能耗数据采用最大熵模型进行银行授信分析的系统及方法,通过用电数据能在很大程度上可以表现社会以及企业的发展水平,首先这些能源数据是通过实时在线监测的,有着良好的可靠性,不存在造假问题;此外,用能数据与企业的经营状况息息相关,同样的企业,淡季和旺季的产能会体现在企业的能源消耗上;处于上升期的企业一定会加大生产,从而消耗更多的能源;科技含量高的企业, 通常来说能耗比会更高, 减少资源的无谓浪费。
发明内容
本发明提出了一种基于企业财报数据, 能耗数据, 采用最大熵模型的银行授信分析的系统及方法,其主要的应用在于帮助金融机构在对企业贷款时,识别授信风险,分析潜在的财务或经营造假的情况;整个过程包括了数据收集模块, 建立训练数据集,利用历史数据训练分析模块以及识别报告模块,流程如图1所示。数据收集模块,能耗数据方面通过智能电表等终端设备采集, 存储并处理原始企业用电负荷数据,并对这些数据进行分析, 整合, 校正, 填补缺失值, 以及标准化处理;财务数据方面,通过人工录入,校正,存储企业每月的财报数据;建立训练数据集和模型训练模块,对已经授信完成的企业历史财务和能耗数据进行整理,并人工标注当月经营状况,进而进行模型训练;最后在识别经营状态及报告中,当新的企业贷款申请需求产生,利用同行业企业历史的数据内在关系,为新的授信分析提供辅助决策。
附图说明
图1为本发明实施例中银行授信分析的系统模块流程图。
具体实施方式
为使得本发明的内容、目的、特征及优点能够更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护说明书的范围,整个系统运行的具体步骤如下。
步骤1.数据收集模块:对历史上曾经向金融机构申请贷款的机构的能耗数据和财报数据进行收集和存储。用电负荷数据可以采用不同的频率进行录入,在进入分析之前会求和或再分配为月份, 而财报数据通常按月份为单位。
步骤2.通过历史记录和人工分析,对每一家机构的信用进行分类:经营良好或经营较差。
步骤 3. 根据步骤1和2的结果, 建立训练数据集:
Figure 335633DEST_PATH_IMAGE001
其中
Figure 350993DEST_PATH_IMAGE002
为实例的特征向量,按月份为单位,能源数据包括:电,气,水等;财报数据 包括:主营业收入, 存货,固定资产,在建工程等, N为时间,
Figure 698054DEST_PATH_IMAGE003
,k值可以根据实际的数 据设置为任意正整数;例如:k为1,2,3,可以分别表示:经营良好,经营一般以及经营较差。
步骤 4.最大熵模型分析企业财报数据和能耗数据与经营状态:
输入:特征集
Figure 115260DEST_PATH_IMAGE004
, 为别表示1正常, 2较为异常, 3异常,输出实例x所属 的类y;
(1)建立最大熵模型:
Figure 958583DEST_PATH_IMAGE005
Figure 163037DEST_PATH_IMAGE006
Figure 77903DEST_PATH_IMAGE007
其中,
Figure 851080DEST_PATH_IMAGE008
(2)将最大熵模型转换成:
Figure 396462DEST_PATH_IMAGE009
Figure 386415DEST_PATH_IMAGE010
其中
Figure 541191DEST_PATH_IMAGE011
为最大熵模型的拉格朗日函数;
(3)求解最大熵模型的拉格朗日函数:
Figure 136251DEST_PATH_IMAGE012
首先求解
Figure 619578DEST_PATH_IMAGE013
,对
Figure 300090DEST_PATH_IMAGE014
求偏导数,
Figure 760021DEST_PATH_IMAGE015
令偏导数等于零:
Figure 239282DEST_PATH_IMAGE016
由于,
Figure 126466DEST_PATH_IMAGE017
,得到,
Figure 518440DEST_PATH_IMAGE018
Figure 782063DEST_PATH_IMAGE019
(4)采用迭代尺度算法, 求解
Figure 646988DEST_PATH_IMAGE020
中的w:
a. 对所有
Figure 908336DEST_PATH_IMAGE021
,取初始值
Figure 625757DEST_PATH_IMAGE022
b. 对每一个
Figure 397797DEST_PATH_IMAGE021
,求解
Figure 353115DEST_PATH_IMAGE023
Figure 549478DEST_PATH_IMAGE024
c.更新
Figure 488616DEST_PATH_IMAGE025
=
Figure 798768DEST_PATH_IMAGE026
,直到收敛。
步骤5.当实时数据x进入系统,根据x中每一个特征值,选取所对应
Figure 874171DEST_PATH_IMAGE027
值,求
Figure 539639DEST_PATH_IMAGE028
概率值,哪一种状态概率大,则属于哪一种状态:
Figure 402290DEST_PATH_IMAGE029
Figure 811406DEST_PATH_IMAGE030
本发明通过对企业能耗数据与财务数据的深度分析挖掘,采用最大熵模型,找到财务数据与能耗数据的潜在关系;当新的贷款申请提交时,通过训练好的模型,得到该企业的历史经营情况分类,为银行授信分析提供有效的数据支持。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

Claims (1)

1.本发明一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法其特征在于,包括:
步骤1.数据收集模块:对历史上曾经向金融机构申请贷款的机构的能耗数据和财报数据进行收集和存储;
用电负荷数据可以采用不同的频率进行录入,在进入分析之前会求和或再分配为月份, 而财报数据通常按月份为单位;
步骤2.通过历史记录和人工分析,对每一家机构的信用进行分类:经营良好或经营较差;
步骤 3.根据步骤1和2的结果, 建立训练数据集:
Figure 99770DEST_PATH_IMAGE001
其中
Figure 216631DEST_PATH_IMAGE002
为实例的特征向量,按月份为单位,能源数据包括:电,气,水等;财报数据包 括:主营业收入, 存货,固定资产,在建工程等, N为时间,
Figure 866049DEST_PATH_IMAGE003
,k值可以根据实际的数据 设置为任意正整数;例如:k为1,2,3,可以分别表示:经营良好,经营一般以及经营较差;
步骤 4.最大熵模型分析企业财报数据和能耗数据与经营状态:
输入:特征集
Figure 701150DEST_PATH_IMAGE004
, 为别表示1正常, 2较为异常, 3异常,输出实例x所属的 类y;
(1)建立最大熵模型:
Figure 710694DEST_PATH_IMAGE005
Figure 917947DEST_PATH_IMAGE006
Figure 236802DEST_PATH_IMAGE007
其中,
Figure 795084DEST_PATH_IMAGE008
(2)将最大熵模型转换成:
Figure 873899DEST_PATH_IMAGE009
Figure 965352DEST_PATH_IMAGE010
其中
Figure 815627DEST_PATH_IMAGE011
为最大熵模型的拉格朗日函数;
(3)求解最大熵模型的拉格朗日函数:
Figure 138504DEST_PATH_IMAGE012
首先求解
Figure 489851DEST_PATH_IMAGE013
,对
Figure 701389DEST_PATH_IMAGE014
求偏导数,
Figure 473298DEST_PATH_IMAGE015
令偏导数等于零:
Figure 629342DEST_PATH_IMAGE016
由于,
Figure 676058DEST_PATH_IMAGE017
,得到,
Figure 351890DEST_PATH_IMAGE018
Figure 58814DEST_PATH_IMAGE019
(4)采用迭代尺度算法, 求解
Figure 610144DEST_PATH_IMAGE020
中的w:
a. 对所有
Figure 552561DEST_PATH_IMAGE021
,取初始值
Figure 505736DEST_PATH_IMAGE022
b. 对每一个
Figure 649141DEST_PATH_IMAGE021
,求解
Figure 156608DEST_PATH_IMAGE023
Figure 653448DEST_PATH_IMAGE024
c.更新
Figure 428506DEST_PATH_IMAGE025
=
Figure 244278DEST_PATH_IMAGE026
,直到收敛;
步骤5.当实时数据x进入系统,根据x中每一个特征值,选取所对应
Figure 862210DEST_PATH_IMAGE027
值,求
Figure 523261DEST_PATH_IMAGE028
概率值,哪一种状态概率大,则属于哪一种状态:
Figure 28191DEST_PATH_IMAGE029
Figure 106875DEST_PATH_IMAGE030
CN202010910468.XA 2020-09-02 2020-09-02 一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法 Pending CN111967980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010910468.XA CN111967980A (zh) 2020-09-02 2020-09-02 一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010910468.XA CN111967980A (zh) 2020-09-02 2020-09-02 一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法

Publications (1)

Publication Number Publication Date
CN111967980A true CN111967980A (zh) 2020-11-20

Family

ID=73393189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010910468.XA Pending CN111967980A (zh) 2020-09-02 2020-09-02 一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法

Country Status (1)

Country Link
CN (1) CN111967980A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862605A (zh) * 2021-04-26 2021-05-28 广东浩迪智云技术有限公司 基于用电数据的企业经营异常提醒方法、系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389973A (zh) * 2013-07-23 2013-11-13 安阳师范学院 一种利用中文人名判定性别的方法
CN107015965A (zh) * 2017-03-24 2017-08-04 苏州希格玛科技有限公司 一种中文文本情感分析装置及方法
CN107943790A (zh) * 2017-11-23 2018-04-20 中译语通科技股份有限公司 一种基于最大熵模型和tf‑idf特征的情感分析方法
CN108876134A (zh) * 2018-06-08 2018-11-23 山东汇贸电子口岸有限公司 一种中小微企业信贷系统
CN109086340A (zh) * 2018-07-10 2018-12-25 太原理工大学 基于语义特征的评价对象识别方法
CN110033159A (zh) * 2019-02-27 2019-07-19 阿里巴巴集团控股有限公司 风险识别方法、装置及设备
CN110648013A (zh) * 2019-08-26 2020-01-03 广东工业大学 一种基于对偶型最大熵的电动汽车充电负荷预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389973A (zh) * 2013-07-23 2013-11-13 安阳师范学院 一种利用中文人名判定性别的方法
CN107015965A (zh) * 2017-03-24 2017-08-04 苏州希格玛科技有限公司 一种中文文本情感分析装置及方法
CN107943790A (zh) * 2017-11-23 2018-04-20 中译语通科技股份有限公司 一种基于最大熵模型和tf‑idf特征的情感分析方法
CN108876134A (zh) * 2018-06-08 2018-11-23 山东汇贸电子口岸有限公司 一种中小微企业信贷系统
CN109086340A (zh) * 2018-07-10 2018-12-25 太原理工大学 基于语义特征的评价对象识别方法
CN110033159A (zh) * 2019-02-27 2019-07-19 阿里巴巴集团控股有限公司 风险识别方法、装置及设备
CN110648013A (zh) * 2019-08-26 2020-01-03 广东工业大学 一种基于对偶型最大熵的电动汽车充电负荷预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱磊等: ""基于最大熵马尔科夫模型的绩效评价方法"", 《控制理论与应用》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862605A (zh) * 2021-04-26 2021-05-28 广东浩迪智云技术有限公司 基于用电数据的企业经营异常提醒方法、系统

Similar Documents

Publication Publication Date Title
CN111476660B (zh) 一种基于数据分析的智能风控系统及方法
Van Thiel et al. Artificial intelligence credit risk prediction: An empirical study of analytical artificial intelligence tools for credit risk prediction in a digital era
Durica et al. Business failure prediction using cart-based model: A case of Slovak companies.
CN109710684B (zh) 一种基于逻辑推理机的智能财务报告生成系统
Van Thiel et al. Artificial intelligent credit risk prediction: An empirical study of analytical artificial intelligence tools for credit risk prediction in a digital era
CN114841801A (zh) 一种基于用户行为特征的信贷风控方法和装置
CN112862585A (zh) 基于LightGBM决策树算法的个贷类不良资产风险评级方法
CN115238815A (zh) 异常交易数据获取方法、装置、设备、介质和程序产品
CN111861704A (zh) 风控特征生成方法及系统
CN111967980A (zh) 一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法
CN111178690A (zh) 基于风控评分卡模型的用电客户窃电风险评估方法
Tsai et al. Data pre-processing by genetic algorithms for bankruptcy prediction
CN113487118A (zh) 一种基于财务的资产配置系统和方法
CN110782140B (zh) 一种用于电费回收风险筛查的多维要素评估方法
CN111932078A (zh) 基于量测数据多态势评判的风险用户识别方法
CN116596674A (zh) 基于大数据分析的对外贸易风险评估方法
CN111861724A (zh) 一种基于企业财报数据和能耗数据采用朴素贝叶斯的金融授信分析的系统及方法
Ye et al. Financial structure, technology, and economic growth: a structural matching perspective
Chakrabarty et al. Catch me if you can: In search of accuracy, scope, and ease of fraud prediction
CN115641202A (zh) 基于知识图谱和图计算的小贷行业团体借贷风险测度方法
Al-Risheq The impact of oil prices on industrial production in developing countries
CN112614005B (zh) 企业复工状态的处理方法和装置
CN111951103A (zh) 一种基于企业财报数据和能耗数据采用感知机算法的银行授信分析的系统及方法
CN111932361A (zh) 一种基于企业财报数据和能耗数据并采用逻辑斯蒂模型的银行授信分析系统及方法
Kiefer et al. Why do models that predict failure fail?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201120