CN113537576A - 用于预测上市企业财务困境的方法及系统 - Google Patents
用于预测上市企业财务困境的方法及系统 Download PDFInfo
- Publication number
- CN113537576A CN113537576A CN202110711109.6A CN202110711109A CN113537576A CN 113537576 A CN113537576 A CN 113537576A CN 202110711109 A CN202110711109 A CN 202110711109A CN 113537576 A CN113537576 A CN 113537576A
- Authority
- CN
- China
- Prior art keywords
- intonation
- financial
- time period
- preset time
- listed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004458 analytical method Methods 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 21
- 230000009429 distress Effects 0.000 claims abstract description 18
- 238000003860 storage Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 229910019250 POS3 Inorganic materials 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明实施例提供一种用于预测上市企业财务困境的方法及系统,属于上市企业的财务困境预测领域。所述方法包括:获取历史上市企业的财务数据和非财务数据以及上市企业历史的财务困境状况;从财务数据中获取第一类指标以及第二类指标;从非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调;将第一类指标、第二类指标、股吧评论语调、年度报告语调和管理层讨论与分析语调关联以形成历史数据集;采用历史数据集训练预设的CatBoost模型;获取当前上市企业的财务数据和非财务数据;将当前上市企业的财务数据和非财务数据输入CatBoost模型中以确定上市企业的财务困境状况。该方法及系统能够精准地对上市企业的财务困境状况作出预测。
Description
技术领域
本发明涉及上市企业的财务困境预测领域,具体地涉及一种用于预测上市企业财务困境的方法及系统。
背景技术
财务困境预测是当前企业管理中的一个重点问题之一,当前的财务困境预测主要以来自于企业财务报告中的会计信息和管理层讨论与分析为基础,预测模型主要为神经网络、支持向量机、判别分析等单一分类器。
但当前,上市企业年度报告造假频出,年度报告等文本信息存在滞后性,单一分类器面对实际应用的复杂性和数据的多样性不够有效,因此无法对上市企业的财务困境作出精准地预测。
发明内容
本发明实施例的目的是提供一种用于预测上市企业财务困境的方法及系统,该方法及系统能够精准地对上市企业的财务困境状况作出预测。
为了实现上述目的,本发明实施例提供一种用于预测上市企业财务困境的方法,包括:
获取历史上市企业的财务数据和非财务数据以及所述上市企业历史的财务困境状况;
从所述财务数据中获取用于表示所述上市企业的偿债能力、盈利能力、成长能力、经营能力以及现金流量的财务比率的第一类指标以及用于表示所述上市企业的治理与监管能力的第二类指标;
从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调;
将所述第一类指标、所述第二类指标、股吧评论语调、年度报告语调和管理层讨论与分析语调关联以形成历史数据集;
采用所述历史数据集训练预设的CatBoost模型;
获取当前上市企业的财务数据和非财务数据;
将当前上市企业的财务数据和非财务数据输入所述CatBoost模型中以确定所述上市企业的财务困境状况。
可选地,所述从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调包括:
根据公式(1)计算所述股吧评论语调,
其中,TONE1为所述股吧评论语调,POS1为股票论坛中在第一预设时间段内的正面言论的帖子的数量,NEG1为股票论坛中在第一预设时间段内的负面言论的帖子的数量。
可选地,所述从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调包括:
根据公式(2)计算所述年度报告语调,
其中,TONE2为所述年度报告语调,POS2为上市企业在第二预设时间段内的年度报告中积极词汇的数量,NEG2为上市企业在所述第二预设时间段内的年度报告中消极词汇的数量。
可选地,所述从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调包括:
根据公式(3)计算所述管理层讨论与分析语调,
其中,TONE3为所述管理层讨论与分析语调,POS3为上市企业在第三预设时间段内的管理层讨论与分析的文本中积极词汇的数量,NEG3为上市企业在所述第三预设时间段内的管理层讨论与分析的文本中消极词汇的数量。
可选地,所述从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调包括:
预设多个所述第一预设时间段、第二预设时间段和/或第三预设时间段;
所述将所述第一类指标、所述第二类指标、股吧评论语调、年度报告语调和管理层讨论与分析语调关联以形成历史数据集包括:
针对所述第一预设时间段、第二预设时间段和第三预设时间段的每种组合,分别确定所述CatBoost模型的训练迭代次数以及最大预测精度;
选取训练迭代次数最小且最大预测精度最大的所述第一预设时间段、第二预设时间段和第三预设时间段的组合以确定所述第一预设时间段、第二预设时间段和第三预设时间段。
可选地,所述从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调包括:
采用预设的语言识别算法识别所述股票论坛中的正面言论的帖子和负面言论的帖子、所述年度报告中的积极词汇和消极词汇以及管理层讨论与分析的文本中的积极词汇和消极词汇。
可选地,所述第一时间段为所述财务困境状况所在时间段的前两年的12月。
可选地,所述第二预设时间段和所述第三预设时间段为所述财务困境状况所在时间段的前两年。
另一方面,本发明还提供一种用于预测上市企业财务困境的系统,所述系统包括处理器,所述处理器用于被机器读取以使得所述机器执行如上述任一所述的方法。
再一方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有指令,所述指令用于被机器读取以使的所述机器执行如上述任一所述方法。
通过上述技术方案,本发明提供的用于预测上市企业财务困境的方法及系统通过对上市企业的财务数据和非财务数据进行筛选和处理,再将处理后的数据采用CatBoost模型进行训练和预测,克服了现有技术中因单一采用财务数据而导致的预测精度下降的技术问题,提高了上市企业财务困境预测的精准度。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是根据本发明的一个实施方式的用于预测上市企业财务困境的方法的流程图;
图2是根据本发明的一个实施方式的用于预测上市企业财务困境的方法的部分流程图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
如图1所示是根据本发明的一个实施方式的用于预测上市企业财务困境的方法的流程图。在该图1中,该方法可以包括:
在步骤S10中,获取历史上市企业的财务数据和非财务数据以及上市企业历史的财务困境状况;
在步骤S11中,从财务数据中获取用于表示上市企业的偿债能力、盈利能力、成长能力、经营能力以及现金流量的财务比率的第一类指标以及用于表示上市企业的治理与监管能力的第二类指标;
在步骤S12中,从非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调;
在步骤S13中,将第一类指标、第二类指标、股吧评论语调、年度报告语调和管理层讨论与分析语调关联以形成历史数据集;
在步骤S14中,采用历史数据集训练预设的CatBoost模型;
在步骤S15中,获取当前上市企业的财务数据和非财务数据;
在步骤S16中,将当前上市企业的财务数据和非财务数据输入CatBoost模型中以确定上市企业的财务困境状况。
在现有技术中,由于常规的预测上市的财务困难情况的方法均是基于上市企业的财务数据,并且采用基于单一特征的神经网络模型来预测。在这样的背景下,一方面由于上市企业的财务数据常常会造假、错误等问题出现,这就会导致获取的数据集难以保证足够高的准确性;另一方面,单一特征的神经网络模型由于其执行预测操作时基于单一的数据集,即财务数据,这也很实现高精准度地预测。
为了克服上述技术缺陷,在如图1所示出的方法中,步骤S10至步骤S13主要用于获取训练和测试用的数据集。进一步地,在获取该数据集时,为了克服现有技术中财务数据的造假、错误等原因导致的数据集不准确的问题,该方法采用同时获取财务数据和非财务数据的方式,通过多种可能反应上市企业财务困境的因素来建立数据集,从而提高了数据集的准确性。至于上述财务数据和非财务数据的具体形式,则可以是本领域人员所知的多个内容。具体地,对于财务数据,则可以是包括但不限于反映企业偿债能力、盈利能力、成长能力、经营能力和现金流量的财务比率,其文本形式可以是例如资产负债表、流量表以及利润表等(即:用于表示上市企业的偿债能力、盈利能力、成长能力、经营能力以及现金流量的财务比率的第一类指标);或是反应企业治理与监管能力的财务指标,其文本形式可以是例如大股东持股比例、董事会持股比例、独立董事比例等(即:用于表示上市企业的治理与监管能力的第二类指标)。对于非财务数据,则可以是包括股吧评论、年度报告以及管理层讨论与分析的结果等。在获取该非财务数据时,对于股吧评论,可以是通过网络爬取工具在股票论坛中爬取关于与上市公司相关的各种发帖信息;对于年度报告以及管理层讨论与分析的结果,则可以是直接在上市企业的官方网站中下载。
在现有技术中,之所以没有采用非财务数据来预测上市公司的财务困境情况,是因为非财务数据是难以量化的,其所包含的情感信息较多,且神经网络本身无法处理如此庞大的文字信息,因此只能够采用较为简单财务数据来进行预测。但是,在本发明提供的方法中,发明人考虑到这一点,因此在步骤S12中,从非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调。股吧评论语调、年度报告语调以及管理层讨论与分析语调是三个语义信息量化的结果,相较于常规的非财务数据而言,其数据的维度大大降低,因此在训练和预测的过程中,能够大大提高算法的运行效率。至于计算该股吧评论语调、年度报告语调以及管理层讨论与分析语调的具体过程,虽然可以是本领域人员所知的多种方法。但是:
在本发明的一个优选示例中,计算股吧评论语调具体方法可以是例如先通过LM(Loughran and McDonald)词典(或者是其他预设的语言识别算法)来确定股票论坛中的每个帖子的内容是正面言论还是负面言论从而确定出包含正面言论的帖子和负面言论的帖子,再根据公式(1)计算该股吧评论语调,
其中,TONE1为股吧评论语调,POS1为股票论坛中在第一预设时间段内的正面言论的帖子的数量,NEG1为股票论坛中在第一预设时间段内的负面言论的帖子的数量;
在本发明的一个优选示例中,计算年度报告语调的方法可以是例如先通过LM词典确定年度报告中积极词汇的数量和消极词汇的数量,然后根据公式(2)计算年度报告语调,
其中,TONE2为年度报告语调,POS2为上市企业在第二预设时间段内的年度报告中积极词汇的数量,NEG2为上市企业在第二预设时间段内的年度报告中消极词汇的数量;
在本发明的一个优选示例中,类似地,计算管理层讨论与分析语调则可以是先通过LM词典确定管理层讨论与分析的文本中积极词汇的数量和消极词汇的数量,再根据公式(3)计算管理层讨论与分析语调,
其中,TONE3为管理层讨论与分析语调,POS3为上市企业在第三预设时间段内的管理层讨论与分析的文本中积极词汇的数量,NEG3为上市企业在第三预设时间段内的管理层讨论与分析的文本中消极词汇的数量。
对于上述第一预设时间段、第二预设时间段以及第三预设时间段,虽然其具体的设置方式可以是本领域人员所知的多种组合。但是,发明人在模型训练的过程中发现,不同时间段的选取,对于模型训练的迭代次数和预测精度会有较大的影响。以股吧评论语调为例,如果将该第一预设时间段设置在被预测时间的前六个月,模型训练的迭代次数会增加很多,而预测的精度也会相对下降;而如果将第一预设时间段设置在被预测时间的前一个月,模型训练的迭代次数会下降得相当多,并且预测的精度也会大大提高;但是,这也并不意味着第一预设时间段设置得与被预测时间越靠近,迭代次数就会越少,预测的精度也会越高;事实上,如果将第一预设时间段设置为被预测时间的前一周,则迭代次数又会大大提高,同时预测的精度也会有所下降。其余的年度报告语调以及管理层讨论与分析语调也存在同样的问题。
基于上述技术问题,在本发明的一个实施方式中,为了进一步确定更加准确且合理的第一预设时间段、第二预设时间段以及第三预设时间段,该方法可以进一步包括如图2中所示出的方法。在该图2中,该方法可以包括:
在步骤S20中,预设多个第一预设时间段、第二预设时间段和/或第三预设时间段;
在步骤S21中,针对第一预设时间段、第二预设时间段和第三预设时间段的每种组合,分别确定CatBoost模型的训练迭代次数以及最大预测精度;
在步骤S22中,选取训练迭代次数最小且最大预测精度最大的第一预设时间段、第二预设时间段和第三预设时间段的组合以确定第一预设时间段、第二预设时间段和第三预设时间段。
在该如图2中所示出的方法中,通过步骤S20生成多个第一预设时间段、第二预设时间段和/或第三预设时间段的组合,再分别采用相对轻量级(数据量小于常规的数据集)的数据集对CatBoost模型进行训练,再观察每个组合所对应的训练迭代次数以及最大预测精度,最终在步骤S22中,选择训练迭代次数最小以及最大预测精度最大的组合来作为本发明的第一预设时间段、第二预设时间段以及第三预设时间段。经过多次实验对比,发明人发现,第一预设时间段的优选值可以为财务困境状况所在时间段的前两年的12月(也即被预测时间的前一个月),而第二预设时间段、第三预设时间段的优选值则均为财务困境状况所在时间段的前两年。
在数据集的选择完成后,则可以开始执行对模型的训练。就现有技术而言,常规的预测模型例如LR(Logistic Regression,逻辑回归)、DT(Decision Tree,决策树)、SVM(Support Vector Machine,支持向量机)、XGBoost(Extreme Gradient Boosting,极端梯度提升)、ANN(Artificial Neural Network,人工神经网络)均可以用于预测该上市企业的财务预测状况。但是,通过采用同样的数据集来对这几种网络进行训练,发明人发现,CatBoost模型相较于这些模型,其训练迭代次数以及预测精度都远远高于这些模型,因此在本发明的优选示例中,该模型可以选择CatBoost模型。
具体地,CatBoost模型是一种新的基于梯度提升的决策树模型,由俄罗斯的搜索巨头Yandex在2017年提出。梯度提升是一种强大的机器学习技术,其可以解决具有噪声数据、异构特征和复杂依赖关系的问题。与其他的梯度提升决策树算法相比(GBDT),CatBoost模型主要具有以下几个优点:
首先,该算法采取了一种有效策略,不需要任何明确的预处理就可以将类别转换为数字,即可以直接使用类别型特征进行建模。而传统的算法在建模前,需要使用标签编码、独热编码等方法对类别型特征进行处理。CatBoost算法(模型)采用的策略具体如下:
1、对输入的样本集合随机排序,并生成多组随机序列;
2、给定一个序列,针对每个例子,对于相同类别的例子计算其平均样本值;
3、将所有的分类特征值根据以下公式转化为数值结果。
记σ=(σ1,…,σn)为一个类别的序列,那么对应的分类特征值则可以表示为公式(4),
其中,p为前一个值,a则可以为前一个值对应的权重。通过该公式(4)可以降低从低频类别获得的噪声。
第二,CatBoost模型可以将不同类别型特征的组合作为新的特征,以获得高阶依赖(high-order dependencies)。在为当前树构造新的分割点时,CatBoost模型会采用贪婪的策略考虑组合。对于树的第一次分割,不考虑任何组合。对于下一个分割,CatBoost模型可以将当前树的所有组合、类别型特征与数据集中的所有类别型特征相结合,并将新的组合类别型特征动态地转换为数值型特征。CatBoost模型还可以通过以下方式生成数值型特征和类别型特征的组合:树中选定的所有分割点都被视为具有两个值的类别型特征,并像类别型特征一样地被进行组合考虑。
第三,CatBoost模型可以克服梯度偏差。在GBDT中,每次迭代中产生一个弱学习者,每个学习者基于前一个学习者的梯度被训练,所有学习者的分类结果的累积提供了输出。但这导致估计梯度在特征空间的任何域中的分布与该域中梯度的真实分布相比发生了偏移,从而导致过拟合。为了解决这一问题,CatBoost模型对经典的梯度提升算法进行了一些改进,使用了有序增压方法。该方法可以克服梯度偏差引起的过拟合,进一步增强模型的泛化能力。
另一方面,本发明还提供一种用于预测上市企业财务困境的系统,所述系统包括处理器,所述处理器用于被机器读取以使得所述机器执行如上述任一所述的方法。
再一方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有指令,所述指令用于被机器读取以使的所述机器执行如上述任一所述方法。
通过上述技术方案,本发明提供的用于预测上市企业财务困境的方法及系统通过对上市企业的财务数据和非财务数据进行筛选和处理,再将处理后的数据采用CatBoost模型进行训练和预测,克服了现有技术中因单一采用财务数据而导致的预测精度下降的技术问题,提高了上市企业财务困境预测的精准度。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种用于预测上市企业财务困境的方法,其特征在于,所述方法包括:
获取历史上市企业的财务数据和非财务数据以及所述上市企业历史的财务困境状况;
从所述财务数据中获取用于表示所述上市企业的偿债能力、盈利能力、成长能力、经营能力以及现金流量的财务比率的第一类指标以及用于表示所述上市企业的治理与监管能力的第二类指标;
从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调;
将所述第一类指标、所述第二类指标、股吧评论语调、年度报告语调和管理层讨论与分析语调关联以形成历史数据集;
采用所述历史数据集训练预设的CatBoost模型;
获取当前上市企业的财务数据和非财务数据;
将当前上市企业的财务数据和非财务数据输入所述CatBoost模型中以确定所述上市企业的财务困境状况。
5.根据权利要求4所述的方法,其特征在于,所述从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调包括:
预设多个所述第一预设时间段、第二预设时间段和/或第三预设时间段;
所述将所述第一类指标、所述第二类指标、股吧评论语调、年度报告语调和管理层讨论与分析语调关联以形成历史数据集包括:
针对所述第一预设时间段、第二预设时间段和第三预设时间段的每种组合,分别确定所述CatBoost模型的训练迭代次数以及最大预测精度;
选取训练迭代次数最小且最大预测精度最大的所述第一预设时间段、第二预设时间段和第三预设时间段的组合以确定所述第一预设时间段、第二预设时间段和第三预设时间段。
6.根据权利要求4所述的方法,其特征在于,所述从所述非财务数据中获取股吧评论语调、年度报告语调和管理层讨论与分析语调包括:
采用预设的语言识别算法识别所述股票论坛中的正面言论的帖子和负面言论的帖子、所述年度报告中的积极词汇和消极词汇以及管理层讨论与分析的文本中的积极词汇和消极词汇。
7.根据权利要求2所述的方法,其特征在于,所述第一时间段为所述财务困境状况所在时间段的前两年的12月。
8.根据权利要求3所述的方法,其特征在于,所述第二预设时间段和所述第三预设时间段为所述财务困境状况所在时间段的前两年。
9.一种用于预测上市企业财务困境的系统,其特征在于,所述系统包括处理器,所述处理器用于被机器读取以使得所述机器执行如权利要求1至8任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,所述指令用于被机器读取以使的所述机器执行如权利要求1至8任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110711109.6A CN113537576A (zh) | 2021-06-25 | 2021-06-25 | 用于预测上市企业财务困境的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110711109.6A CN113537576A (zh) | 2021-06-25 | 2021-06-25 | 用于预测上市企业财务困境的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113537576A true CN113537576A (zh) | 2021-10-22 |
Family
ID=78096765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110711109.6A Pending CN113537576A (zh) | 2021-06-25 | 2021-06-25 | 用于预测上市企业财务困境的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113537576A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110246577A (zh) * | 2019-05-31 | 2019-09-17 | 深圳江行联加智能科技有限公司 | 一种基于人工智能辅助妊娠期糖尿病遗传风险预测的方法 |
CN110414716A (zh) * | 2019-07-03 | 2019-11-05 | 北京科技大学 | 一种基于LightGBM的企业失信概率预测方法及系统 |
CN110969285A (zh) * | 2019-10-29 | 2020-04-07 | 京东方科技集团股份有限公司 | 预测模型训练方法、预测方法、装置、设备及介质 |
CN111242449A (zh) * | 2020-01-07 | 2020-06-05 | 杭州策知通科技有限公司 | 一种企业情报流失预测方法 |
CN111612323A (zh) * | 2020-05-15 | 2020-09-01 | 国网河北省电力有限公司电力科学研究院 | 一种基于大数据模型的电力征信评估方法 |
KR20200111518A (ko) * | 2019-03-19 | 2020-09-29 | 주식회사 포스코아이씨티 | 상거래데이터를 이용한 ai기반의 평가모델을 포함하는 기업의 채무상환능력 평가시스템 |
KR20200115369A (ko) * | 2019-03-29 | 2020-10-07 | 조진삼 | 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템 |
CN111832101A (zh) * | 2020-06-18 | 2020-10-27 | 湖北博华自动化系统工程有限公司 | 一种水泥强度预测模型的构建方法及水泥强度预测方法 |
CN112348571A (zh) * | 2020-10-21 | 2021-02-09 | 四川长虹电器股份有限公司 | 基于销售预测系统的组合模型销售预测方法 |
CN112434862A (zh) * | 2020-11-27 | 2021-03-02 | 中国人民大学 | 上市企业财务困境预测方法及装置 |
CN112613978A (zh) * | 2020-12-18 | 2021-04-06 | 中国工商银行股份有限公司 | 银行资本充足率的预测方法、装置、电子设备及介质 |
CN112785056A (zh) * | 2021-01-22 | 2021-05-11 | 杭州市电力设计院有限公司 | 一种基于CatBoost和LSTM模型融合的短期负荷预测方法 |
-
2021
- 2021-06-25 CN CN202110711109.6A patent/CN113537576A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200111518A (ko) * | 2019-03-19 | 2020-09-29 | 주식회사 포스코아이씨티 | 상거래데이터를 이용한 ai기반의 평가모델을 포함하는 기업의 채무상환능력 평가시스템 |
KR20200115369A (ko) * | 2019-03-29 | 2020-10-07 | 조진삼 | 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템 |
CN110246577A (zh) * | 2019-05-31 | 2019-09-17 | 深圳江行联加智能科技有限公司 | 一种基于人工智能辅助妊娠期糖尿病遗传风险预测的方法 |
CN110414716A (zh) * | 2019-07-03 | 2019-11-05 | 北京科技大学 | 一种基于LightGBM的企业失信概率预测方法及系统 |
CN110969285A (zh) * | 2019-10-29 | 2020-04-07 | 京东方科技集团股份有限公司 | 预测模型训练方法、预测方法、装置、设备及介质 |
CN111242449A (zh) * | 2020-01-07 | 2020-06-05 | 杭州策知通科技有限公司 | 一种企业情报流失预测方法 |
CN111612323A (zh) * | 2020-05-15 | 2020-09-01 | 国网河北省电力有限公司电力科学研究院 | 一种基于大数据模型的电力征信评估方法 |
CN111832101A (zh) * | 2020-06-18 | 2020-10-27 | 湖北博华自动化系统工程有限公司 | 一种水泥强度预测模型的构建方法及水泥强度预测方法 |
CN112348571A (zh) * | 2020-10-21 | 2021-02-09 | 四川长虹电器股份有限公司 | 基于销售预测系统的组合模型销售预测方法 |
CN112434862A (zh) * | 2020-11-27 | 2021-03-02 | 中国人民大学 | 上市企业财务困境预测方法及装置 |
CN112613978A (zh) * | 2020-12-18 | 2021-04-06 | 中国工商银行股份有限公司 | 银行资本充足率的预测方法、装置、电子设备及介质 |
CN112785056A (zh) * | 2021-01-22 | 2021-05-11 | 杭州市电力设计院有限公司 | 一种基于CatBoost和LSTM模型融合的短期负荷预测方法 |
Non-Patent Citations (1)
Title |
---|
BEN ET AL.: "CatBoost model and artificial intelligence techniques for corporate failure prediction", TECHNOLOGICAL FORECASTING AND SOCIAL CHANGE, vol. 166, pages 120658 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11113653B2 (en) | Artificial intelligence and machine learning based incident management | |
Tang et al. | Incorporating textual and management factors into financial distress prediction: A comparative study of machine learning methods | |
CA3090128A1 (en) | System and method for machine learning architecture for enterprise capitalization | |
US20210303970A1 (en) | Processing data using multiple neural networks | |
CN110490304B (zh) | 一种数据处理方法及设备 | |
Fu et al. | A sentiment-aware trading volume prediction model for P2P market using LSTM | |
CN114358014A (zh) | 基于自然语言的工单智能诊断方法、装置、设备及介质 | |
US20220261818A1 (en) | System and method for determining and managing reputation of entities and industries through use of media data | |
Aminimehr et al. | A comprehensive study of market prediction from efficient market hypothesis up to late intelligent market prediction approaches | |
CN112434862B (zh) | 上市企业财务困境预测方法及装置 | |
CN113220885A (zh) | 一种文本处理方法和系统 | |
CN110458581B (zh) | 商户业务周转异常的识别方法及装置 | |
Gupta et al. | Integrating CRM and ERP Insights for Optimized Product Development Using CNN-LSTM Hybrid Models | |
Le et al. | Applying LSTM to predict firm performance based on annual reports: an empirical study from the vietnam stock market | |
CN113537576A (zh) | 用于预测上市企业财务困境的方法及系统 | |
Li et al. | A deep learning approach of financial distress recognition combining text | |
KR102596740B1 (ko) | 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법 | |
Korobkin et al. | The formation of metrics of innovation potential and prospects | |
Kulikovskikh et al. | Quotes forecasting method based on news analysis as part of an internet cloud service | |
Kaur et al. | Prediction of stock prices of blue-chip companies using machine learning algorithms | |
CN111008874B (zh) | 技术趋势预测方法、系统及存储介质 | |
Ashofteh | Big data for credit risk analysis: Efficient machine learning models using pyspark | |
Sawale et al. | Stock Market Forecasting Using Metaheuristic LSTM Approach with Sentiment Analysis | |
Toai et al. | Predicting VN-Index Value by KNN Algorithm of Machine Learning | |
US20240143906A1 (en) | Character level embeddings for spreadsheet data extraction using machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |