CN112434862A - 上市企业财务困境预测方法及装置 - Google Patents

上市企业财务困境预测方法及装置 Download PDF

Info

Publication number
CN112434862A
CN112434862A CN202011364423.3A CN202011364423A CN112434862A CN 112434862 A CN112434862 A CN 112434862A CN 202011364423 A CN202011364423 A CN 202011364423A CN 112434862 A CN112434862 A CN 112434862A
Authority
CN
China
Prior art keywords
enterprise
financial
index
indexes
predicament
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011364423.3A
Other languages
English (en)
Other versions
CN112434862B (zh
Inventor
蒋洪迅
江俊毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renmin University of China
Original Assignee
Renmin University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renmin University of China filed Critical Renmin University of China
Priority to CN202011364423.3A priority Critical patent/CN112434862B/zh
Publication of CN112434862A publication Critical patent/CN112434862A/zh
Application granted granted Critical
Publication of CN112434862B publication Critical patent/CN112434862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种上市企业财务困境预测方法及装置。其中,方法包括:获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;对目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取目标企业的年报挖掘指标,并对目标企业的并购重组事件信息进行特征提取,获取目标企业的并购重组指标;将目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出目标企业的财务困境预测结果。本发明实施例提供的上市企业财务困境预测方法及装置,通过考虑多维度的数据,集成了MD&A、M&A和财务指标等多方数据,避免了单方面数据源的缺漏,能获取更准确的预测结果。

Description

上市企业财务困境预测方法及装置
技术领域
本发明实施例涉及计算机技术领域,更具体地,涉及一种上市企业财务困境预测方法及装置。
背景技术
财务困境,又称财务危机或财务苦难,是指企业当前拥有的资产价值低于其负债价值(即净资产为负),或持有的现金流量不足以偿付短期债务(包括利息、应付账款等)。上市企业运营受证监会关于上市公司管理规范的约束,财务数据对外公开,比较容易判定是否陷入财务困境。
陷入财务困境的企业的确会在财务数据上呈现出“资不抵债”状况,然而单纯从上市企业财务报表上面,是不能预测企业未来是否会陷入财务困境的,因为财务数据呈现的结果而非原因。
因此,现有技术存在预测结果不准确的不足。
发明内容
本发明实施例提供一种上市企业财务困境预测方法及装置,用以解决或者至少部分地解决现有技术存在的预测结果不准确的缺陷。
第一方面,本发明实施例提供一种上市企业财务困境预测方法,包括:
获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;
对所述目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取所述目标企业的年报挖掘指标,并对所述目标企业的并购重组事件信息进行特征提取,获取所述目标企业的并购重组指标;
将所述目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出所述目标企业的财务困境预测结果;
其中,所述困境预测模型,是以样本企业的原始年报挖掘指标、原始并购重组指标和原始财务指标为样本数据,以所述样本企业是否陷入财务困境为所述样本数据对应的标签进行训练后获得的;所述年报挖掘指标、并购重组指标和财务指标,是基于所述样本数据进行特征选择后确定的。
优选地,所述对所述目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取所述目标企业的年报挖掘指标的具体步骤包括:
根据预设的词表对所述文本数据进行文本情感分析,获取所述文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量;
根据所述文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量,获取所述目标企业的年报挖掘指标。
优选地,所述对所述目标企业的并购重组事件信息进行特征提取,获取所述目标企业的并购重组指标的具体步骤包括:
根据所述目标企业的并购重组事件信息中每次并购重组的卖方、买方和交易金额,获取所述目标企业的并购重组指标。
优选地,所述将所述目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出所述目标企业的财务困境预测结果之前,包括:
对由各样本数据构成的样本数据集中的正样本进行T次随机采样,获得多个正样本子集,获取所述样本数据集中的负样本集与每一所述正样本子集的并集,作为T个训练集;
根据所述T个训练集进行特征选择,确定年报挖掘指标、并购重组指标和财务指标;
基于Boosting算法,根据各所述训练集中的年报挖掘指标、并购重组指标和财务指标,以及各所述训练集中的样本数据对应的标签,对所述困境预测模型中的各基分类器进行训练,并获取各基分类器的权重;
根据各基分类器的权重,将各基分类器集成为所述困境预测模型中的集成分类器;
其中,T为正负样本数之比的向上取整。
第二方面,本发明实施例提供一种上市企业财务困境预测装置,包括:
数据获取模块,用于获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;
特征提取模块,用于对所述目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取所述目标企业的年报挖掘指标,并对所述目标企业的并购重组事件信息进行特征提取,获取所述目标企业的并购重组指标;
困境预测模块,用于将所述目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出所述目标企业的财务困境预测结果;
其中,所述困境预测模型,是以样本企业的年报挖掘指标、并购重组指标和财务指标为样本数据,以所述样本企业是否陷入财务困境为所述样本数据对应的标签进行训练后获得的;所述年报挖掘指标、并购重组指标和财务指标,是基于所述样本数据进行特征选择后确定的。
优选地,所述特征提取模块包括第一提取单元,用于根据预设的词表对所述文本数据进行文本情感分析,获取所述文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量;根据所述文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量,获取所述目标企业的年报挖掘指标。
优选地,所述特征提取模块包括第二提取单元,用于根据所述目标企业的并购重组事件信息中每次并购重组的卖方、买方和交易金额,获取所述目标企业的并购重组指标。
优选地,上市企业财务困境预测装置,还包括:
模型训练模块,用于对由各样本数据构成的样本数据集中的正样本进行T次随机采样,获得多个正样本子集,获取所述样本数据集中的负样本集与每一所述正样本子集的并集,作为T个训练集;根据所述T个训练集进行特征选择,确定年报挖掘指标、并购重组指标和财务指标;基于Boosting算法,根据各所述训练集中的年报挖掘指标、并购重组指标和财务指标,以及各所述训练集中的样本数据对应的标签,对所述困境预测模型中的各基分类器进行训练,并获取各基分类器的权重;根据各基分类器的权重,将各基分类器集成为所述困境预测模型中的集成分类器;
其中,T为正负样本数之比的向上取整。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,执行所述程序时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的上市企业财务困境预测方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的上市企业财务困境预测方法的步骤。
本发明实施例提供的上市企业财务困境预测方法及装置,通过对上市企业并购重组的事件挖掘和企业年报中的管理层讨论与分析部分的文本挖掘,获取目标企业的年报挖掘指标和并购重组指标,根据目标企业的年报挖掘指标、并购重组指标和财务指标进行预测,通过考虑多维度的数据,集成了MD&A、M&A和财务指标等多方数据,避免了单方面数据源的缺漏,能获取更准确的预测结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例提供的上市企业财务困境预测方法的流程示意图;
图2为根据本发明实施例提供的上市企业财务困境预测装置的结构示意图;
图3为根据本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为根据本发明实施例提供的上市企业财务困境预测方法的流程示意图。如图1所示,该方法包括:步骤S101、获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标。
具体地,目标企业为上市企业,因此,目标企业的企业年报和并购重组(Mergersand Acquisitions,M&A)事件信息均属于目标企业公开披露的数据。
可以通过文本处理的方式,从公开披露的企业年报中进行截取,获得目标企业的企业年报管理层讨论与分析(Management Discussion and Analysis,MD&A)的文本数据。
步骤S102、对目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取目标企业的年报挖掘指标,并对目标企业的并购重组事件信息进行特征提取,获取目标企业的并购重组指标。
具体地,获取MD&A的文本数据之后,可以基于任一种文本情感分析的方法,对MD&A的文本数据进行分析,获取用于描述目标企业的正面信息和负面信息的参数,作为目标企业的年报挖掘指标。
文本情感分析,又称意见挖掘、倾向性分析等,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。
可以对并购重组事件信息进行特征提取,获取从交易的频率、金额或主动性等维度描述目标企业的并购重组行为的参数,作为目标企业的并购重组指标。
步骤S103、将目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出目标企业的财务困境预测结果。
其中,困境预测模型,是以样本企业的原始年报挖掘指标、原始并购重组指标和原始财务指标为样本数据,以样本企业是否陷入财务困境为样本数据对应的标签进行训练后获得的;年报挖掘指标、并购重组指标和财务指标,是基于样本数据进行特征选择后确定的。
具体地,在年报挖掘指标和并购重组指标的基础上,结合传统企业财务数据中被选择出的财务指标,将目标企业的年报挖掘指标、并购重组指标和财务指标作为训练好的困境预测模型的输入,通过困境预测模型输出目标企业的财务困境预测结果,即获得目标企业是否陷入财务困境的预测结果。
由于年报挖掘指标和并购重组指标蕴含了企业经营状况、财务状况、治理水平、信用担保、关联关系等大量信息,将上述信息作为目标企业的特征,从而能基于上述特征预测出目标企业是否陷入财务困境。
本发明实施例通过对上市企业并购重组的事件挖掘和企业年报中的管理层讨论与分析部分的文本挖掘,获取目标企业的年报挖掘指标和并购重组指标,根据目标企业的年报挖掘指标、并购重组指标和财务指标进行预测,通过考虑多维度的数据,集成了MD&A、M&A和财务指标等多方数据,避免了单方面数据源的缺漏,能获取更准确的预测结果。
基于上述任一实施例的内容,对目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取目标企业的年报挖掘指标的具体步骤包括:根据预设的词表对文本数据进行文本情感分析,获取文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量。
具体地,根据预设的词表(例如特定的财经词表或企业所在行业的专业词典)对MD&A的文本数据中正面、负面、不确定等各类特征词的划分来对文本进行分类,从而从总体上表征文本的偏向程度。
通过上述分类步骤,可以确定MD&A的文本数据中的每个词是正面词汇、负面词汇或不确定等。
根据文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量,获取目标企业的年报挖掘指标。
具体地,年报挖掘指标,至少包括管理层语调,还可以包括正面词汇的数量和/或负面词汇的数量。
管理层语调的计算公式为
Figure BDA0002805008640000081
其中,θ+表示正面词汇的数量占词汇的总数的比例,θ-表示负面词汇的数量占词汇的总数的比例;ρ表示管理层语调,取值范围为[-1,1]。
基于上述任一实施例的内容,对目标企业的并购重组事件信息进行特征提取,获取目标企业的并购重组指标的具体步骤包括:根据目标企业的并购重组事件信息中每次并购重组的卖方、买方和交易金额,获取目标企业的并购重组指标。
具体地,并购主要涉及企业股权结构的调整,核心内容是“股东准入”;重组则主要涉及企业资产、债务及业务结构的调整,核心内容是“资产业务准入”。
本发明实施例面向M&A事件,选取系列的原始并购重组指标表征企业的上述内容:
年度内并购重组(只计交易成功的)总次数NUM(即频率),用于表征企业进行并购重组的积极程度;
年度内并购重组总金额SUM,用于表征企业并购重组(资产变更)总规模;
作为买方的并购重组次数BUNUM,作为买方的交易总金额BUSUM,作为卖方的并购重组次数SENUM,作为卖方的交易总金额SESUM,以及作为标的方的并购重组事件次数BDNUM,作为标的方的交易总金额BDSUM。
通过区分交易地位,选择BUNUM、BUSUM、SENUM、SESUM、BDNUM和BDSUM,可以衡量目标企业在交易中所处的不同角色及其规模。
基于上述任一实施例的内容,将目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出目标企业的财务困境预测结果之前,包括:对由各样本数据构成的样本数据集中的正样本进行T次随机采样,获得多个正样本子集,获取样本数据集中的负样本集与每一正样本子集的并集,作为T个训练集;其中,T为正负样本数之比的向上取整。
具体地,设样本数据集中财务困境企业(少数类)集合为P,经营正常企业(多数类)集合为N,即|P|<<|N|。从N中进行随机采样选取出子集N’,使|N’|=|P|<<|N|。
因此,样本数据集为不平衡数据集。
正样本,指根据经营正常的企业获得的样本数据;负样本,指根据财务困境企业获得的样本数据。
通过对非平衡数据集进行多次采样得到多个平衡数据集分别建立弱分类模型最后加以集成,这样对所有可用样本全集进行处理,以获取所有样本的数据特征。
取T=[|N|/|P|],重复随机采样T次,得到从N中采样所得的正常企业样本子集N1,N2,…,Ni,…,NT。T个样本子集中的总样本数不小于|N|且为保证每次采样中样本企业选取的随机性,使用有放回随机采样。每个正常企业样本子集Ni与财务困境企业样本全集P构成了一个平衡的样本集,至此已构造了T个平衡的样本集{N1,P},{N2,P},…,{Ni,P},…,{NT,P}。
根据T个训练集进行特征选择,确定年报挖掘指标、并购重组指标和财务指标。
具体地,反应企业经营的指标众多,上市企业公开的全部财务指标超过100项,其中很多冗余甚至是噪声。本发明实施例将特征选择嵌入模型中,对经过采样生成的平衡数据集进行递归特征消除。
具体来说,对于每个平衡的样本集{Ni,P},构造基模型Vi进行K-1轮训练(K为原始特征数,包括原始年报挖掘指标、原始并购重组指标和原始财务指标),首轮在原始的K维特征集上训练,每个特征获得一个权重,每轮训练后从特征集中移除权值系数最小的特征,再基于新的特征集进行下一轮训练,如此往复递归直至遍历所有特征。记第j个被移除(可并列)的特征重要性得分为K-j+1,记最后的一维特征得分为1,记所有的K维特征的重要性得分分别为Ri1,Ri2,…,Rin,…,RiK,则取值范围为{1≤Rin≤K|Rin∈Z,n=1,2,...,K}取值越小表示特征越重要。对所有的T个样本对分别进行上述特征递归特征消除,可得T×K维的特征重要性得分矩阵。综合T个样本对进行特征选择,构造表征第n维特征重要性的变量
Figure BDA0002805008640000101
n=1,2,...,K。对n个RSUM值进行排序,RSUM值越小表示特征的重要性程度越高,对于模型的预测作用越大。通过对保留特征数进行优化调整可得到最佳预测效果时的特征数以及目标预测效果时的最小特征数。
基于Boosting算法,根据各训练集中的年报挖掘指标、并购重组指标和财务指标,以及各训练集中的样本数据对应的标签,对困境预测模型中的各基分类器进行训练,并获取各基分类器的权重。
具体地,Boosting提升算法训练弱分类器。
将进行特征选择后的T个平衡样本对记为{N1’,P},{N2’,P},...,{Ni’,P},…,{NT’,P}。对每个样本对利用Adaboost提升算法训练集成学习分类器H1,H2,…,Hi,…,HT。每个Hi由s个弱分类器hi1,hi2,…,hiq,…,his以及对应的权重αi1,αi2,…,αiq,…,αis构成。设m为每个平衡样本对中的企业样本数,选用的基分类学习算法为ξ,进行共Q轮迭代。
弱分类器,即困境预测模型中的基分类器。
根据对每个企业样本是否陷入财务困境预测的正确性更新样本的权重,预测正确的降低权重,预测错误的增加权重进行加以训练
Figure BDA0002805008640000102
其中,
Figure BDA0002805008640000111
鉴于将财务困境企业误判为正常企业的后果严重,对此类误判在样本权重调整系数Dq+1(x)基础上再乘以一个惩罚系数β,即
Figure BDA0002805008640000112
让财务困境企业样本误判为正常企业的代价加大,以提高模型对于财务困境风险的识别能力。
根据各基分类器的权重,将各基分类器集成为困境预测模型中的集成分类器。
具体地,通过上述步骤,可得到H的一系列基分类器h1,h2,...,hq,…,hs以及对应的权重α1,α2,…,αq,…,αs。同理,对所有的T个平衡样本对,可得到h11,…,h1s,h21,…,h2s,…,hT1,…,hTs共T×s个基分类器以及对应的权重α11,...,α1s,α21,...,α2s,...,αT1,…,αTs。将所有的基分类器分类结果按权重集成,最终得到强分类器输出为
Figure BDA0002805008640000113
强分类器,即困境预测模型中的集成分类器。
困境预测模型为一种集成学习预测模型,通过采样构造多个平衡数据集进行训练从而学习全部样本信息,利用特征递归消除减少了噪声与冗余,在训练弱分类器时加大误判惩罚,提高了困境预测模型的预警能力,最后利用boosting方法集成各弱分类器,能获取更准确的预测结果。
图2为根据本发明实施例提供的上市企业财务困境预测装置的结构示意图。基于上述任一实施例的内容,如图2所示,该装置包括数据获取模块201、特征提取模块202和困境预测模块203,其中:
数据获取模块201,用于获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;
特征提取模块202,用于对目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取目标企业的年报挖掘指标,并对目标企业的并购重组事件信息进行特征提取,获取目标企业的并购重组指标;
困境预测模块203,用于将目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出目标企业的财务困境预测结果;
其中,困境预测模型,是以样本企业的年报挖掘指标、并购重组指标和财务指标为样本数据,以样本企业是否陷入财务困境为样本数据对应的标签进行训练后获得的;年报挖掘指标、并购重组指标和财务指标,是基于样本数据进行特征选择后确定的。
具体地,数据获取模块201、特征提取模块202和困境预测模块203顺次电连接。
数据获取模块201从目标企业公开披露的数据中获取目标企业的企业年报和并购重组事件信息;通过文本处理的方式,从公开披露的企业年报中进行截取,获得目标企业的企业年报管理层讨论与分析的文本数据。
特征提取模块202可以基于任一种文本情感分析的方法,对MD&A的文本数据进行分析,获取用于描述目标企业的正面信息和负面信息的参数,作为目标企业的年报挖掘指标。
特征提取模块202还可以对并购重组事件信息进行特征提取,获取从交易的频率、金额或主动性等维度描述目标企业的并购重组行为的参数,作为目标企业的并购重组指标。
困境预测模块203将目标企业的年报挖掘指标、并购重组指标和财务指标作为训练好的困境预测模型的输入,通过困境预测模型输出目标企业的财务困境预测结果,即获得目标企业是否陷入财务困境的预测结果。
本发明实施例提供的上市企业财务困境预测装置,用于执行本发明上述各实施例提供的上市企业财务困境预测方法,该上市企业财务困境预测装置包括的各模块实现相应功能的具体方法和流程详见上述上市企业财务困境预测方法的实施例,此处不再赘述。
该上市企业财务困境预测装置用于前述各实施例的上市企业财务困境预测方法。因此,在前述各实施例中的上市企业财务困境预测方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
本发明实施例通过对上市企业并购重组的事件挖掘和企业年报中的管理层讨论与分析部分的文本挖掘,获取目标企业的年报挖掘指标和并购重组指标,根据目标企业的年报挖掘指标、并购重组指标和财务指标进行预测,通过考虑多维度的数据,集成了MD&A、M&A和财务指标等多方数据,避免了单方面数据源的缺漏,能获取更准确的预测结果。
基于上述任一实施例的内容,特征提取模块包括第一提取单元,用于根据预设的词表对文本数据进行文本情感分析,获取文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量;根据文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量,获取目标企业的年报挖掘指标。
基于上述任一实施例的内容,特征提取模块包括第二提取单元,用于根据目标企业的并购重组事件信息中每次并购重组的卖方、买方和交易金额,获取目标企业的并购重组指标。
基于上述任一实施例的内容,上市企业财务困境预测装置还包括:模型训练模块,用于对由各样本数据构成的样本数据集中的正样本进行T次随机采样,获得多个正样本子集,获取样本数据集中的负样本集与每一正样本子集的并集,作为T个训练集;根据T个训练集进行特征选择,确定年报挖掘指标、并购重组指标和财务指标;基于Boosting算法,根据各训练集中的年报挖掘指标、并购重组指标和财务指标,以及各训练集中的样本数据对应的标签,对困境预测模型中的各基分类器进行训练,并获取各基分类器的权重;根据各基分类器的权重,将各基分类器集成为困境预测模型中的集成分类器;其中,T为正负样本数之比的向上取整。
图3为根据本发明实施例提供的电子设备的实体结构示意图。基于上述实施例的内容,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302和总线303;其中,处理器301和存储器302通过总线303完成相互间的通信;处理器301用于调用存储在存储器302中并可在处理器301上运行的计算机程序指令,以执行上述各方法实施例所提供的上市企业财务困境预测方法,例如包括:获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;对目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取目标企业的年报挖掘指标,并对目标企业的并购重组事件信息进行特征提取,获取目标企业的并购重组指标;将目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出目标企业的财务困境预测结果;其中,困境预测模型,是以样本企业的原始年报挖掘指标、原始并购重组指标和原始财务指标为样本数据,以样本企业是否陷入财务困境为样本数据对应的标签进行训练后获得的;年报挖掘指标、并购重组指标和财务指标,是基于样本数据进行特征选择后确定的。
本发明另一实施例公开一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的上市企业财务困境预测方法,例如包括:获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;对目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取目标企业的年报挖掘指标,并对目标企业的并购重组事件信息进行特征提取,获取目标企业的并购重组指标;将目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出目标企业的财务困境预测结果;其中,困境预测模型,是以样本企业的原始年报挖掘指标、原始并购重组指标和原始财务指标为样本数据,以样本企业是否陷入财务困境为样本数据对应的标签进行训练后获得的;年报挖掘指标、并购重组指标和财务指标,是基于样本数据进行特征选择后确定的。
此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明另一实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的上市企业财务困境预测方法,例如包括:获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;对目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取目标企业的年报挖掘指标,并对目标企业的并购重组事件信息进行特征提取,获取目标企业的并购重组指标;将目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出目标企业的财务困境预测结果;其中,困境预测模型,是以样本企业的原始年报挖掘指标、原始并购重组指标和原始财务指标为样本数据,以样本企业是否陷入财务困境为样本数据对应的标签进行训练后获得的;年报挖掘指标、并购重组指标和财务指标,是基于样本数据进行特征选择后确定的。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种上市企业财务困境预测方法,其特征在于,包括:
获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;
对所述目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取所述目标企业的年报挖掘指标,并对所述目标企业的并购重组事件信息进行特征提取,获取所述目标企业的并购重组指标;
将所述目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出所述目标企业的财务困境预测结果;
其中,所述困境预测模型,是以样本企业的原始年报挖掘指标、原始并购重组指标和原始财务指标为样本数据,以所述样本企业是否陷入财务困境为所述样本数据对应的标签进行训练后获得的;所述年报挖掘指标、并购重组指标和财务指标,是基于所述样本数据进行特征选择后确定的。
2.根据权利要求1所述的上市企业财务困境预测方法,其特征在于,所述对所述目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取所述目标企业的年报挖掘指标的具体步骤包括:
根据预设的词表对所述文本数据进行文本情感分析,获取所述文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量;
根据所述文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量,获取所述目标企业的年报挖掘指标。
3.根据权利要求1所述的上市企业财务困境预测方法,其特征在于,所述对所述目标企业的并购重组事件信息进行特征提取,获取所述目标企业的并购重组指标的具体步骤包括:
根据所述目标企业的并购重组事件信息中每次并购重组的卖方、买方和交易金额,获取所述目标企业的并购重组指标。
4.根据权利要求1至3任一所述的上市企业财务困境预测方法,其特征在于,所述将所述目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出所述目标企业的财务困境预测结果之前,包括:
对由各样本数据构成的样本数据集中的正样本进行T次随机采样,获得多个正样本子集,获取所述样本数据集中的负样本集与每一所述正样本子集的并集,作为T个训练集;
根据所述T个训练集进行特征选择,确定年报挖掘指标、并购重组指标和财务指标;
基于Boosting算法,根据各所述训练集中的年报挖掘指标、并购重组指标和财务指标,以及各所述训练集中的样本数据对应的标签,对所述困境预测模型中的各基分类器进行训练,并获取各基分类器的权重;
根据各基分类器的权重,将各基分类器集成为所述困境预测模型中的集成分类器;
其中,T为正负样本数之比的向上取整。
5.一种上市企业财务困境预测装置,其特征在于,包括:
数据获取模块,用于获取目标企业的企业年报管理层讨论与分析的文本数据、并购重组事件信息和财务指标;
特征提取模块,用于对所述目标企业的企业年报管理层讨论与分析的文本数据进行文本情感分析,获取所述目标企业的年报挖掘指标,并对所述目标企业的并购重组事件信息进行特征提取,获取所述目标企业的并购重组指标;
困境预测模块,用于将所述目标企业的年报挖掘指标、并购重组指标和财务指标输入困境预测模型,输出所述目标企业的财务困境预测结果;
其中,所述困境预测模型,是以样本企业的年报挖掘指标、并购重组指标和财务指标为样本数据,以所述样本企业是否陷入财务困境为所述样本数据对应的标签进行训练后获得的;所述年报挖掘指标、并购重组指标和财务指标,是基于所述样本数据进行特征选择后确定的。
6.根据权利要求5所述的上市企业财务困境预测装置,其特征在于,所述特征提取模块包括第一提取单元,用于根据预设的词表对所述文本数据进行文本情感分析,获取所述文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量;根据所述文本数据中正面词汇的数量、负面词汇的数量和词汇的总数量,获取所述目标企业的年报挖掘指标。
7.根据权利要求5所述的上市企业财务困境预测装置,其特征在于,所述特征提取模块包括第二提取单元,用于根据所述目标企业的并购重组事件信息中每次并购重组的卖方、买方和交易金额,获取所述目标企业的并购重组指标。
8.根据权利要求5至7任一所述的上市企业财务困境预测装置,其特征在于,还包括:
模型训练模块,用于对由各样本数据构成的样本数据集中的正样本进行T次随机采样,获得多个正样本子集,获取所述样本数据集中的负样本集与每一所述正样本子集的并集,作为T个训练集;根据所述T个训练集进行特征选择,确定年报挖掘指标、并购重组指标和财务指标;基于Boosting算法,根据各所述训练集中的年报挖掘指标、并购重组指标和财务指标,以及各所述训练集中的样本数据对应的标签,对所述困境预测模型中的各基分类器进行训练,并获取各基分类器的权重;根据各基分类器的权重,将各基分类器集成为所述困境预测模型中的集成分类器;
其中,T为正负样本数之比的向上取整。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述的上市企业财务困境预测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至4任一项所述的上市企业财务困境预测方法的步骤。
CN202011364423.3A 2020-11-27 2020-11-27 上市企业财务困境预测方法及装置 Active CN112434862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011364423.3A CN112434862B (zh) 2020-11-27 2020-11-27 上市企业财务困境预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011364423.3A CN112434862B (zh) 2020-11-27 2020-11-27 上市企业财务困境预测方法及装置

Publications (2)

Publication Number Publication Date
CN112434862A true CN112434862A (zh) 2021-03-02
CN112434862B CN112434862B (zh) 2024-03-12

Family

ID=74698764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011364423.3A Active CN112434862B (zh) 2020-11-27 2020-11-27 上市企业财务困境预测方法及装置

Country Status (1)

Country Link
CN (1) CN112434862B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516447A (zh) * 2021-05-21 2021-10-19 陕西迅税通智能科技有限公司 基于计算机输出财税推理匹配结果的电子装置及方法
CN113537576A (zh) * 2021-06-25 2021-10-22 合肥工业大学 用于预测上市企业财务困境的方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140344128A1 (en) * 2013-05-14 2014-11-20 Rawllin International Inc. Financial distress rating system
US20160196610A1 (en) * 2015-01-07 2016-07-07 GovBrain Inc. Global financial crisis prediction and geopolitical risk analyzer
CN108763277A (zh) * 2018-04-10 2018-11-06 平安科技(深圳)有限公司 一种数据分析方法、计算机可读存储介质及终端设备
CN110348580A (zh) * 2019-06-18 2019-10-18 第四范式(北京)技术有限公司 构建gbdt模型的方法、装置及预测方法、装置
CN111292007A (zh) * 2020-02-28 2020-06-16 中国工商银行股份有限公司 供应商财务风险预测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140344128A1 (en) * 2013-05-14 2014-11-20 Rawllin International Inc. Financial distress rating system
US20160196610A1 (en) * 2015-01-07 2016-07-07 GovBrain Inc. Global financial crisis prediction and geopolitical risk analyzer
CN108763277A (zh) * 2018-04-10 2018-11-06 平安科技(深圳)有限公司 一种数据分析方法、计算机可读存储介质及终端设备
CN110348580A (zh) * 2019-06-18 2019-10-18 第四范式(北京)技术有限公司 构建gbdt模型的方法、装置及预测方法、装置
CN111292007A (zh) * 2020-02-28 2020-06-16 中国工商银行股份有限公司 供应商财务风险预测方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
庄佳;: "房地产企业财务困境预测模型研究", 经济师, no. 11 *
张芮瑛;: "基于数据挖掘的上市公司财务困境预测", 时代金融, no. 14 *
陈艺云: ""基于信息披露文本的上市公司财务困境预测:以中文年报管理层讨论与分析为样本的研究"", 《中国管理科学》, vol. 27, no. 7, pages 222 - 224 *
韩建光;惠晓峰;孙洁;: "基于多特征子集组合分类器的企业财务困境预测", 系统管理学报, no. 04, pages 423 - 424 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516447A (zh) * 2021-05-21 2021-10-19 陕西迅税通智能科技有限公司 基于计算机输出财税推理匹配结果的电子装置及方法
CN113516447B (zh) * 2021-05-21 2024-04-23 陕西迅税通智能科技有限公司 基于计算机输出财税推理匹配结果的电子装置及方法
CN113537576A (zh) * 2021-06-25 2021-10-22 合肥工业大学 用于预测上市企业财务困境的方法及系统

Also Published As

Publication number Publication date
CN112434862B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和系统
CN107025596B (zh) 一种风险评估方法和系统
CN111507831A (zh) 信贷风险自动评估方法和装置
CN112102073A (zh) 信贷风险控制方法及系统、电子设备及可读存储介质
CN113095927B (zh) 一种反洗钱可疑交易识别方法及设备
CN111583012B (zh) 融合文本信息的信用债发债主体违约风险评估方法
CN112434862B (zh) 上市企业财务困境预测方法及装置
CN112419029B (zh) 类金融机构风险监控方法、风险模拟系统及存储介质
CN111783829A (zh) 一种基于多标签学习的财务异常检测方法及装置
CN114663002A (zh) 一种自动化匹配绩效考核指标的方法及设备
Ferdiansyah et al. The Application of Support Vector Machine Method to Analyze the Sentiments of Netizens on Social Media Regarding the Accessibility of Disabilities in Public Spaces
EP4044094A1 (en) System and method for determining and managing reputation of entities and industries through use of media data
CN111626855A (zh) 债券信用利差预测方法及系统
CN114519508A (zh) 基于时序深度学习和法律文书信息的信用风险评估方法
Barboza et al. New metrics and approaches for predicting bankruptcy
CN115829722A (zh) 信用风险评分模型的训练方法及信用风险评分方法
CN113656692B (zh) 基于知识迁移算法的产品推荐方法、装置、设备及介质
JP7303243B2 (ja) 試験問題予測システム及び試験問題予測方法
Roelands et al. Classifying businesses by economic activity using web-based text mining
CN114626940A (zh) 数据分析方法、装置及电子设备
CN112732908A (zh) 试题新颖度评估方法、装置、电子设备和存储介质
Nguyen et al. A model for detecting accounting frauds by using machine learning
Pradana et al. Sentiment Analysis of Nanovest Investment Application Using Naive Bayes Algorithm
Engel et al. Robust explanations for deep neural networks via pseudo neural tangent kernel surrogate models
CN111913940B (zh) 一种温度会员标签预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant