CN113850523A - 基于数据补全的esg指数确定方法及相关产品 - Google Patents
基于数据补全的esg指数确定方法及相关产品 Download PDFInfo
- Publication number
- CN113850523A CN113850523A CN202111156647.XA CN202111156647A CN113850523A CN 113850523 A CN113850523 A CN 113850523A CN 202111156647 A CN202111156647 A CN 202111156647A CN 113850523 A CN113850523 A CN 113850523A
- Authority
- CN
- China
- Prior art keywords
- data
- evaluated
- enterprise
- esg
- under
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 44
- 230000008569 process Effects 0.000 claims description 52
- 230000015654 memory Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 claims description 12
- 230000000295 complement effect Effects 0.000 claims description 10
- 238000013112 stability test Methods 0.000 claims description 6
- 238000010219 correlation analysis Methods 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000011156 evaluation Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 8
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/12—Simultaneous equations, e.g. systems of linear equations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及数据处理技术领域,具体涉及一种基于数据补全的ESG指数确定方法及相关产品。该方法包括:根据多个时刻下第一待评价企业在第一ESG指标下的已有数据,确定第一待评价企业在第一ESG指标下的数据缺失度;当数据缺失度小于第一阈值时,根据第一待评价企业的已有数据,对第一待评价企业的缺失数据进行补全;当数据缺失度大于或者等于第一阈值时,根据多个待评价企业的已有数据,以及多个时刻下第一待评价企业在多个财务指标下的财务数据,对第一待评价企业的缺失数据进行补全;根据第一时刻在多个ESG指标下的已有数据和补全数据,确定第一待评价企业在第一时刻的ESG指数。本申请实施例有利于提高数据补全精度。
Description
技术领域
本申请涉及数据处理领域,具体涉及一种基于数据补全的ESG指数确定方法及相关产品。
背景技术
企业的ESG指数是对企业的环境(environment,简称:E)、社会(society,简称:S)、治理(government,简称:G)方面的综合评分。国际和国内在对企业ESG表现进行评分方面已经积累了一些成功的经验,国际上知名的评级机构比如MSCI、FTSE等都建立了各自的评分标准,并对国际上知名的企业进行了ESG指数评价。
中国在评分企业ESG表现的工作仍然处于起步阶段,国家对于企业数据的披露尚未形成强制机制。因此,企业对数据的披露质量虽然逐年提高,但仍然稀疏,尤其是时间越早越稀疏。这种情况对于评分企业的ESG表现是很大的挑战。
目前,在对企业进行ESG评价时,若某个指标下的披露数据缺失,则会采用行业内的平均值作为该企业在该指标下的披露数据,这种补全数据的方式准确率低,导致基于补全后的数据确定出的ESG评分制定出的决策精度比较低。
发明内容
本申请实施例提供了一种基于数据补全的ESG指数确定方法及相关产品,提高对ESG数据的补全精度,进而提高确定出的ESG指数的精度。
第一方面,本申请实施例提供一种基于数据补全的ESG指数确定方法,包括:
根据多个时刻下第一待评价企业在第一ESG指标下的已有数据,确定所述第一待评价企业在所述第一ESG指标下的数据缺失度,其中,所述第一待评价企业为多个待评价企业中的任意一个,所述第一ESG指标为多个ESG指标中的任意一个;
当所述数据缺失度小于第一阈值时,根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据;
当所述数据缺失度大于或者等于所述第一阈值时,根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,得到所述补全数据;
根据第一时刻在所述多个ESG指标下的已有数据和补全数据,确定所述第一待评价企业在所述第一时刻的ESG指数,所述第一时刻为所述多个时刻中的任意一个。
第二方面,本申请实施例提供一种ESG指数确定装置,包括:
获取单元,用于获取多个时刻下第一待评价企业在第一ESG指标下的已有数据;
处理单元,用于根据所述多个时刻下所述第一待评价企业在所述第一ESG指标下的已有数据,确定所述第一待评价企业在所述第一ESG指标下的数据缺失度,其中,所述第一待评价企业为多个待评价企业中的任意一个,所述第一ESG指标为多个ESG指标中的任意一个;
当所述数据缺失度小于第一阈值时,根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据;
当所述数据缺失度大于或者等于所述第一阈值时,根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,得到所述补全数据;
根据第一时刻在所述多个ESG指标下的已有数据和补全数据,确定所述第一待评价企业在所述第一时刻的ESG指数,所述第一时刻为所述多个时刻中的任意一个。
第三方面,本申请实施例提供一种电子设备,包括:处理器,所述处理器与存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
第五方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
实施本申请实施例,具有如下有益效果:
可以看出,在本申请实施例中,在对任意一个企业在任意个ESG指标下的数据进行补全时,先获取该企业在该ESG指标的数据缺失度,当数据缺失度较小时,则可以利用该企业在该ESG指标下的数据的变化趋势对该ESG指标下的缺失数据进行补全,使补全精度较高;当数据缺失度较大时,无法准确的获取到该企业在该ESG指标下的数据的变化趋势,针对于此,对该ESG指标进行细分,当该ESG指标是与行业相关的ESG指标时,则利用同行业的待评价企业对该企业在该ESG指标下的数据进行补全,使补全精度较高;当该ESG指标是与财务相关的ESG指标时,则利用该企业本身的财务数据对该企业在该ESG指标下的数据进行补全,使补全精度较高。综合来看,针对不同的情况,个性化的采用最适配的数据补全方式进行数据补全,从而使补全后的ESGA数据的精度较高,这样,后续利用补全后的数据确定该企业的ESG指数时,可以使确定出的ESG指数的精度比较高,进而提高对企业的评价精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于数据补全的ESG指数确定方法的流程示意图;
图2为本申请实施例提供的一种在第一ESG指标下缺失数据的示意图;
图3为本申请实施例提供的一种获取在第一ESG指标下的第一候选数据的示意图;
图4为本申请实施例提供的一种构建线性方程的示意图;
图5为本申请实施例提供的一种获取在第一ESG指标下的第二候选数据的示意图;
图6为本申请实施例提供的一种ESG指数确定装置的功能单元组成框图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
首先说明,在获取多个待评价企业在多个时刻以及多个ESG指标下的数据时,并不是每个待评价企业在每个时刻都公开了每个个ESG指标下的数据,这样也就导致某些企业在某些时刻以及某些ESG指标下存在数据缺失失。针对这种缺失情况,本申请中整体上可以将所有企业的缺失数据一次性补全完整。
参阅图1,图1为本申请实施例提供的一种基于数据补全的ESG指数确定方法。该方法应用于ESG指数确定装置。该方法包括以下步骤内容:
101:根据多个时刻下第一待评价企业在第一ESG指标下的已有数据,确定所述第一待评价企业在所述第一ESG指标下的数据缺失度。
其中,该多个时刻可以为多个历史时刻,比如,多个时刻为前N个月,或者,前N年,等等其他值。
其中,第一待评价企业为多个待评价企业中的任意一个,所述第一ESG指标为多个ESG指标中的任意一个。其中,多个ESG指标为ESG三个维度下的所有评价指标;或者,多个ESG指标为ESG三个维度中任意一个维度下的评价指标;或者,多个ESG指标为ESG三个维度下的所有评价指标中的部分。
示例性的,第一评价企业在第一ESG指标下的数据缺失度,可以根据第一ESG指标下的总数据量和缺失的数据量确定。例如,获取5个时刻下第一待评价企业在第一ESG指标下的数据,但是由于数据披露不充分,只获取到了3个时刻下的数据,则该第一待评价企业在该第一ESG指标下的数据缺失度为40%。
应说明,本申请中将获取到的数据称为已有数据,未获取到的数据称为缺失数据。
应说明,由于是获取多个时刻下的数据,第一待评价企业在某个ESG指标下可能有一个或多个时刻的数据获取不到,则第一待评价企业在某个ESG指标下可能在一个或多个时刻下缺失数据。
102:当所述数据缺失度小于第一阈值时,根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据。
其中,第一阈值可以为10%、20%或者其他值。
示例性的,当数据缺失度小于第一阈值时,则可根据第一待评价企业在第一ESG指标下的已有数据,对第一ESG指标下的缺失数据进行补全,也就是用该多个时刻下获取到的数据对未获取到的数据进行补全,得到第一待评价企业的补全数据。
具体的,对第一待评价企业在第一ESG指标下的已有数据进行平稳处理,得到平稳数据序列;比如,对第一待评价企业在第一ESG指标下的已有数据按照时间先后顺序组成初始数据序列;然后,对初始数据序列进行一阶差分处理,并对一阶差分处理进行稳定性检验,当稳定性检验失败时,对初始数据序列进行二阶差分处理,直至对初始数据序列进行N阶差分处理时,通过稳定性检验,则将N阶差分处理结果作为平稳数据序列,以及得到差分次数N,N为大于或者等于1的整数。然后,对平稳数据序列进行自回归分析,得到自相关系数和自相关图ACF;对平稳数据序列进行偏相关分析,得到偏相关系数和偏相关图PACF;最后,基于自相关图ACF和偏相关图PACF,确定自回归项数p和滑动平均项数q;最后,根据自回归项数p、滑动平均项数q以及使初始数据序列成为平稳序列所做的差分次数N,构建差分整合移动平均自回归(Autoregressive Integrated Moving Average model,ARIMA)模型,最后,基于该ARIMA模型,预测出缺失数据,从而对第一待评价企业的缺失数据进行补全。
应说明,若第一待评价企业在第一ESG指标下,存在两个或多个缺失数据,比如,分别在t1时刻和t2时刻存在缺失数据,t2时刻晚于t1时刻,则先将位于t1时刻之前的数据进行上述处理,得到与该t1时刻对应的ARIMA模型,基于该ARIMA模型对t1时刻的数据进行补全,这个时候第一待评价企业在t1时刻就存在数据了;则可以按照上述的处理方式,再次确定与t2时刻对应的ARIMA模型,基于该ARIMA模型再对t2时刻下的数据进行补全。
可以看出,当数据缺失度较小时,通过第一待评价企业在第一ESG指标下的已有数据对缺失数据进行补全,即利用自己第一待评价企业在ESG指标下的数据变化趋势进行数据补全,从而可以提高数据补全的精度。
103:当所述数据缺失度大于或者等于所述第一阈值时,根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,得到所述补全数据。
示例性的,当数据缺失度大于或者等于时,也就是在第一ESG指标下的数据缺失较多时,这个时候第一ESG指标下的数据变化趋势难以判断,所以,再使用自己指标下的已有数据进行补全,则难以精确的补全出缺失数据。这种情况下,可以用其他待评价企业的数据综合补全该第一待评价企业的缺失数据。
下面具体介绍进行数据补全的过程。
首先说明,基于不同待评价企业披露数据的特殊性,当第一待评价企业在某个历史时刻以及在某个ESG指标下缺失数据时,其他待评价企业在该历史时刻以及该ESG指标下并不一定缺失数据。并且,即使某个待评价企业在该ESG指标缺失数据,由于步骤102中的数据补充过程,也可能将该待评价企业在该ESG指标的缺失数据补全。总的来说,当第一评价企业在某个ESG指标下存在缺失数据时,其他待评价企业不一定在该ESG指标下缺失数据,其中,该其他企业为该多个待评价企业中除该第一评价企业之外的待评价企业。
本申请中以对第一待评价企业在第一ESG指标下的缺失数据进行补全为例进行说明,则第一待评价企业在其他ESG指标下的缺失数据的补全过程与此类似不再叙述,并且其他待评价企业的数据补全过程也与此类似,也不再叙述。进一步的,本申请中以第一待评价企业在第一时刻,以及第一ESG指标下缺失数据,即对第一时刻下的缺失数据进行补全具体说明。
示例性的,对第一ESG指标进行关键词识别,得到第一ESG指标的业务属性,其中,第一ESG指标的业务属性包括行业属性或财务属性。
示例性的,当第一ESG指标的业务属性为行业属性时,则确定该多个待评价企业中与该第一评价企业属于相同行业的目标待评价企业,即目标待评价企业的行业属性和第一待评价企业的行业属性相同,其中,该目标待评价企业的数量为一个或多个;然后,基于多个时刻下该目标待评价企业以及第一待评价企业在第一ESG指标下的数据,对该第一待评价企业在该ESG指标下的缺失数据进行补全。
示例性的,根据所述多个时刻下所述第一待评价企业在所述第一ESG指标下的已有数据,以及所述多个时刻下所述目标待评价企业在所述第一ESG指标下的已有数据,对所述第一待评价企业在所述第一ESG指标下的缺失数据进行多次插补,得到第一待评价企业在第一时刻下的补全数据。
具体的,将其他时刻下第一待评价企业在第一ESG指标下的已有数据平均值作为第一时刻下第一待评价企业在第一ESG指标下的第一候选数据,其中,其他时刻为多个时刻中除第一时刻之外的时刻。
如图2所示,第一评价指标为X1,多个时刻分别为t1、t2、t3、t4和t5,假设第一待评价企业在t5时刻缺失数据(第一时刻),第二待评价企业(一个目标待评价企业)在t1时刻缺失数据,第三待评价企业(目标待评价企业)在t2时刻缺失数据。可以看出,第一待评价企业在第一时刻缺失数据,其他待评价企业在第一时刻并不缺失数据,然而其他待评价企业在其他时刻存在缺失数据。然后,如图3所示,针对每个待评价企业在第一ESG指标下已有的数据,获取平均值,将平均值作为每个待评价的缺失数据的第一候选数据。如图3所示可以分别得到各个第一候选数据为:
应理解,通过图3示出的补全之后,多个时刻下每个待评价企业在第一ESG指标下都有了数据,则可以根据其他时刻下第一待评价企业在第一ESG指标下的数据,以及其他时刻下目标待评价企业在第一ESG指标下的第一参考数据,构建第一待评价企业与目标待评价企业在第一ESG指标下的线性方程,其中,目标待评价企业的第一参考数据包括目标待评价企业的已有数据或第一候选数据。如图3所述,对第二待评价企业来说,其第一参考数据包括分别在t2时刻、t3时刻以及t4时刻下的已有数据,以及在t1时刻下的第一候选数据;最后,将第一时刻下目标待评价企业在第一ESG指标下的数据代入到该线性方程中,得到第一时刻下第一待评价企业在第一ESG指标下的第二候选数据。
举例来说,如图4所示,可将第一企业在第一评价指标下的数据先移除;然后,构建第一待评价企业在第一ESG指标下相对于目标待评价企业下的线性方程,即Y1=β0+β2X2+...+βpXp,如图4所示,将第一待评价企业在第一ESG指标下的数据作为方程的输出Y,将目标待评价企业在在第一ESG指标下的数据作为方程的变量代入到上述方程中,可以得到一个方程组,然后求解方程组,可得到方程中的未知参数,即将参数回归到方程中,则可以得到上述的线性方程。然后,基于构建出的线性方程,得到第一时刻下第一待评价企业在第一ESG指标下的第二候选数据。
如图5所示,将目标待评价企业在第一时刻下的第一参考数据代入到线性方程中得到第一待评价企业在t5时刻下的第二候选数据同样的,与获取第一时刻下第一待评价企业在第一ESG指标下的第二候选数据类似,可以分别得到第二待评价企业在t1时刻下的第二候选数据得到第三待评价企业在t2时刻下的第二候选数据
进一步的,根据其他时刻下第一待评价企业在第一ESG指标下的已有数据,以及其他时刻下目标待评价企业在第一ESG指标下的第二参考数据,执行多次插补过程,得到第一时刻下第一待评价企业在第一ESG指标下的补全数据。其中,目标待评价企业在第一ESG指标下的第二参考数据包括目标企业在其他时刻下的已有数据(即未缺失的数据)或者,补全得到的第二候选数据。如图5所示,比如,对于第二待评价企业来说,其在t1时刻的第二参考数据为补全得到的第二候选数据以及t2时刻下的第二参考数据为已有数据b2,即未缺失的数据,即第二待评价企业自己披露的在t2时刻下的数据。
具体的,针对第i次插补过程来说,根据其他时刻下第一待评价企业在所述第一ESG指标下的数据,以及所述其他时刻下所述目标待评价企业在所述第一ESG指标下的第i参考数据,构建所述第一待评价企业与所述目标待评价企业在所述第一ESG指标下,且与第i次插补过程对应的线性方程,其中,所述第i参考数据为所述目标待评价企业在所述第一ESG指标下的已有数据或者第i-1次插补过程得到的候选数据。应说明,由于,第i插补过程中目标待评价企业的某些数据是第i-1次插补过程中预测出的候选数据,因此,第i次插补过程构造出的线性方程与第i-1次插补过程构造出的线性方程不同。因此,将所述第一时刻下所述目标待评价企业在所述第一ESG指标下的第i参考数据输入到与第i次插补过程对应的线性方程,得到所述第一时刻下所述第一待评价企业在所述第一ESG指标下,且与所述第i次插补过程对应的候选数据。同样的,也得到了目标待评价企业与第i次插补过程对应的候选数据;然后,获取各个待评价企业所述第i次插补过程对应的候选数据,与所述第i-1次插补过程得到的候选数据之间的差值的平方和,其中,所述各个待评价企业包括所述第一待评价企业和所述目标待评价企业。即对于各个待评价企业来说,如果一开始存在缺失数据,则需要计算第i次和第i-1次插补过程得到的候选数据之间的差值的平方;最后,将所有存在缺失数据的待评价企业的平方进行求和,得到第i次插补过程与所述第i-1次插补过程之间的平方和。应说明,若i=1时,则第i-1次插补得到的候选数据,即上述的第二候选数据。
示例性的,平方和可以通过公式(1)表示:
进一步地,若所述平方和小于第二阈值(即补全出的数据相对比较稳定时)或者i大于第三阈值(即插补次数达到了第三阈值),则将所述第一时刻下所述第一待评价企业在所述第一ESG指标下,且与所述第i次插补过程对应的候选数据作为所述第一时刻下所述第一待评价企业在所述第一ESG指标下的补全数据,从而使第一待待评价企业在第一时刻下,以及在多个ESG指标下都有数据。
在本申请的一个实施方式中,当第一ESG指标的业务属性为财务属性时,即该第一ESG指标为与财务相关的指标,比如,ESG指标为奖金发放比例;则可以获取多个财务指标中与第一ESG指标相关的财务指标。即预先设定各个与财务相关的ESG指标与财务指标的映射关系,基于该映射关系,以及第一ESG指标,可从多个财务指标中获取与第一ESG指标相关的目标财务指标;然后,根据多个时刻下第一待评价企业在第一ESG指标下的数据,以及多个时刻下第一待评价企业在目标财务指标下的财务数据进行多次插补,以对第一待评价企业在第一ESG指标下的缺失数据进行补全,得到第一时刻下第一待评价企业的补全数据。应说明,第一待评价企业的财务数据的披露是公开的,不存在数据缺失,即第一待评价企业在多个时刻下的财务数据均是完整的,不存在缺失。因此,只需要对第一待评价企业在第一ESG指标下的缺失数据进行补全即可。但是,由于第一待评价企业可能多个时刻下缺失数据,因此还是需要多次插补过程将多个时刻下缺失的数据进行补全。
具体的,将目标财务指标按照上述图2的方式,也作为第一ESG指标,只不过该财务指标下不存在缺失数据;然后,按照上述的补全方式,进行多次插补,对第一待评价企业在第一ESG指标下的缺失数据进行补全,不再叙述。
104:根据第一时刻在所述多个ESG指标下的已有数据和补全数据,确定所述第一待评价企业在所述第一时刻的ESG指数,所述第一时刻为所述多个时刻中的任意一个。
示例性的,基于步骤102~103的数据补全之后,对第一时刻下的缺失数据进行补全,得到了补全数据,再结合第一时刻原本就存在的数据,即已有数据;因此第一时刻下第一待评价企业在多个ESG指标下都存在数据,不再有缺失数据;因此,可以基于预设的每个ESG指标对应的指数,确定第一待评价企业在第一时刻的ESG指数,即可以确定出第一待评价企业在任意一个时刻下的ESG指数。
可以看出,在本申请实施例中,在对任意一个企业在任意个ESG指标下的数据进行补全时,先获取该企业在该ESG指标的数据缺失度,当数据缺失度较小时,则可以利用该企业在该ESG指标下的数据的变化趋势对该ESG指标下的缺失数据进行补全,使补全精度较高;当数据缺失度较大时,无法准确的获取到该企业在该ESG指标下的数据的变化趋势,针对于此,对该ESG指标进行细分,当该ESG指标是与行业相关的ESG指标时,则利用同行业的待评价企业对该企业在该ESG指标下的数据进行补全,使补全精度较高;当该ESG指标是与财务相关的ESG指标时,则利用该企业本身的财务数据对该企业在该ESG指标下的数据进行补全,使补全精度较高。综合来看,针对不同的情况,个性化的采用最适配的数据补全方式进行数据补全,从而使补全后的ESGA数据的精度较高,这样,后续利用补全后的数据确定该企业的ESG指数时,可以使确定出的ESG指数的精度比较高,进而提高对企业的评价精度。
参阅图6,图6本申请实施例提供的一种ESG指数确定装置的功能单元组成框图。ESG指数确定装置600包括:获取单元601和处理单元602;
获取单元601,用于获取多个时刻下第一待评价企业在第一ESG指标下的已有数据;
处理单元602,用于根据所述多个时刻下所述第一待评价企业在所述第一ESG指标下的已有数据,确定所述第一待评价企业在所述第一ESG指标下的数据缺失度,其中,所述第一待评价企业为多个待评价企业中的任意一个,所述第一ESG指标为多个ESG指标中的任意一个;
当所述数据缺失度小于第一阈值时,根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据;
当所述数据缺失度大于或者等于所述第一阈值时,根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,得到所述补全数据;
根据第一时刻在所述多个ESG指标下的已有数据和补全数据,确定所述第一待评价企业在所述第一时刻的ESG指数,所述第一时刻为所述多个时刻中的任意一个。
在一些可能的实施方式中,在根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全方面,处理单元602,具体用于:
对所述第一ESG指标进行关键词识别,确定所述第一ESG指标的业务属性,其中,所述第一ESG指标的业务属性包括行业属性或财务属性;
根据所述第一ESG指标的业务属性,以及所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在所述多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全。
在一些可能的实施方式中,在根据所述第一ESG指标的业务属性,以及所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在所述多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全方面,处理单元602,具体用于:
当所述第一ESG指标的业务属性为行业属性时,从所述多个待评价企业中选出目标待评价企业,其中,所述目标待评价企业与所述第一待评价企业的行业属性相同;
根据所述第一待评价企业的已有数据,以及所述目标待评价企业的已有数据,对所述第一待评价企业的缺失数据进行多次插补,得到所述第一待评价企业在所述第一时刻下的补全数据;
当所述第一ESG指标的业务属性为财务属性时,确定所述多个财务指标中与所述第一ESG指标相关的目标财务指标;
根据所述第一待评价企业在的已有数据,以及所述第一待评价企业在所述目标财务指标下的财务数据,对所述第一待评价企业的缺失数据进行多次插补,以对所述第一待评价企业的缺失数据进行补全。
在一些可能的实施方式中,在根据所述第一待评价企业的已有数据,以及所述目标待评价企业的已有数据,对所述第一待评价企业的缺失数据进行多次插补,得到所述第一待评价企业在所述第一时刻下的补全数据方面,处理单元602,具体用于:
将其他时刻下所述第一待评价企业的已有数据的平均值,作为所述第一时刻下所述第一待评价企业的第一候选数据,其中,所述其他时刻为所述多个时刻中除所述第一时刻之外的时刻;
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业在所述第一ESG指标下的第一参考数据,构建所述第一待评价企业与所述目标待评价企业在所述第一ESG指标下的线性方程;
将所述第一时刻下所述目标待评价企业在所述第一ESG指标下的第一参考数据输入到所述线性方程,得到所述第一时刻下所述第一待评价企业的第二候选数据,其中,所述第一参考数据为所述目标待评价企业在所述第一ESG指标下的已有数据或者第一候选数据;
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业的第二参考数据执行多次插补过程,得到所述第一时刻下所述第一待评价企业的补全数据,所述第二参考数据包括所述目标待评价企业在所述第一ESG指标下的已有数据或者第二候选数据。
在一些可能的实施方式中,在根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业的第二参考数据执行多次插补过程,得到所述第一时刻下所述第一待评价企业的补全数据方面,处理单元602,具体用于:
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业在所述第一ESG指标下的第i参考数据,构建所述第一待评价企业与所述目标待评价企业在所述第一ESG指标下,且与第i次插补过程对应的线性方程,其中,所述第i参考数据为所述目标待评价企业在所述第一ESG指标下的已有数据或者第i-1次插补过程得到的候选数据;
将所述目标待评价企业的第i参考数据输入到与第i次插补过程对应的线性方程,得到所述第一待评价企业与所述第i次插补过程对应的候选数据;
获取各个待评价企业所述第i次插补过程得到的候选数据,与所述第i-1次插补过程得到的候选数据之间的差值的平方和,其中,所述各个待评价企业包括所述第一待评价企业和所述目标待评价企业;
若所述平方和小于第二阈值或者i大于第三阈值,则将所述第一待评价企业与所述第i次插补过程对应的候选数据作为所述第一时刻下所述第一待评价企业的补全数据。
在一些可能的实施方式中,在根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据方面,处理单元602,具体用于:
对所述第一待评价企业的已有数据进行差分处理,得到平稳数据序列,以及得到所述平稳数据序列时的差分次数;
对所述平稳数据序列进行自回归分析,得到自相关系数和自相关图;
对所述平稳数据序列进行偏相关分析,得到偏相关系数和偏相关图;
根据所述自相关图和所述偏相关图,分别确定自回归项数和滑动平均项数;
根据所述差分次数、所述自相关系数、所述偏相关系数、所述自回归项数和所述滑动平均项数,构建预测模型;
根据所述预测模型,对所述第一待评价企业的缺失数据进行补全。
在一些可能的实施方式中,在对所述第一待评价企业的已有数据进行差分处理,得到平稳数据序列,以及得到所述平稳数据序列时的差分次数方面,处理单元602,具体用于:
将所述第一待评价企业的已有数据按照时间先后顺序组成初始数据序列;
对所述初始数据序列进行一阶差分处理,并对一阶差分处理结果进行稳定性检验;
当稳定性检验失败时,对所述初始数据序列进行二阶差分处理,直至对所述初始数据序列进行N阶差分处理时,通过稳定性检验,则将所述N阶差分处理结果作为所述平稳数据序列,以及得到所述差分次数为N,N为大于或者等于1的整数。
参阅图7,图7为本申请实施例提供的一种电子设备的结构示意图。如图7所示,电子设备700包括收发器701、处理器702和存储器703。它们之间通过总线704连接。存储器703用于存储计算机程序和数据,并可以将存储器703存储的数据传输给处理器702。
处理器702用于读取存储器703中的计算机程序执行以下操作:
根据所述多个时刻下所述第一待评价企业在所述第一ESG指标下的已有数据,确定所述第一待评价企业在所述第一ESG指标下的数据缺失度,其中,所述第一待评价企业为多个待评价企业中的任意一个,所述第一ESG指标为多个ESG指标中的任意一个;
当所述数据缺失度小于第一阈值时,根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据;
当所述数据缺失度大于或者等于所述第一阈值时,根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,得到所述补全数据;
根据第一时刻在所述多个ESG指标下的已有数据和补全数据,确定所述第一待评价企业在所述第一时刻的ESG指数,所述第一时刻为所述多个时刻中的任意一个。
在一些可能的实施方式中,在根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全方面,处理器702具体用于执行以下操作:
对所述第一ESG指标进行关键词识别,确定所述第一ESG指标的业务属性,其中,所述第一ESG指标的业务属性包括行业属性或财务属性;
根据所述第一ESG指标的业务属性,以及所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在所述多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全。
在一些可能的实施方式中,在根据所述第一ESG指标的业务属性,以及所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在所述多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全方面,处理器702具体用于执行以下操作:
当所述第一ESG指标的业务属性为行业属性时,从所述多个待评价企业中选出目标待评价企业,其中,所述目标待评价企业与所述第一待评价企业的行业属性相同;
根据所述第一待评价企业的已有数据,以及所述目标待评价企业的已有数据,对所述第一待评价企业的缺失数据进行多次插补,得到所述第一待评价企业在所述第一时刻下的补全数据;
当所述第一ESG指标的业务属性为财务属性时,确定所述多个财务指标中与所述第一ESG指标相关的目标财务指标;
根据所述第一待评价企业在的已有数据,以及所述第一待评价企业在所述目标财务指标下的财务数据,对所述第一待评价企业的缺失数据进行多次插补,以对所述第一待评价企业的缺失数据进行补全。
在一些可能的实施方式中,在根据所述第一待评价企业的已有数据,以及所述目标待评价企业的已有数据,对所述第一待评价企业的缺失数据进行多次插补,得到所述第一待评价企业在所述第一时刻下的补全数据方面,处理器702具体用于执行以下操作:
将其他时刻下所述第一待评价企业的已有数据的平均值,作为所述第一时刻下所述第一待评价企业的第一候选数据,其中,所述其他时刻为所述多个时刻中除所述第一时刻之外的时刻;
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业在所述第一ESG指标下的第一参考数据,构建所述第一待评价企业与所述目标待评价企业在所述第一ESG指标下的线性方程;
将所述第一时刻下所述目标待评价企业在所述第一ESG指标下的第一参考数据输入到所述线性方程,得到所述第一时刻下所述第一待评价企业的第二候选数据,其中,所述第一参考数据为所述目标待评价企业在所述第一ESG指标下的已有数据或者第一候选数据;
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业的第二参考数据执行多次插补过程,得到所述第一时刻下所述第一待评价企业的补全数据,所述第二参考数据包括所述目标待评价企业在所述第一ESG指标下的已有数据或者第二候选数据。
在一些可能的实施方式中,在根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业的第二参考数据执行多次插补过程,得到所述第一时刻下所述第一待评价企业的补全数据方面,处理器702具体用于执行以下操作:
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业在所述第一ESG指标下的第i参考数据,构建所述第一待评价企业与所述目标待评价企业在所述第一ESG指标下,且与第i次插补过程对应的线性方程,其中,所述第i参考数据为所述目标待评价企业在所述第一ESG指标下的已有数据或者第i-1次插补过程得到的候选数据;
将所述目标待评价企业的第i参考数据输入到与第i次插补过程对应的线性方程,得到所述第一待评价企业与所述第i次插补过程对应的候选数据;
获取各个待评价企业所述第i次插补过程得到的候选数据,与所述第i-1次插补过程得到的候选数据之间的差值的平方和,其中,所述各个待评价企业包括所述第一待评价企业和所述目标待评价企业;
若所述平方和小于第二阈值或者i大于第三阈值,则将所述第一待评价企业与所述第i次插补过程对应的候选数据作为所述第一时刻下所述第一待评价企业的补全数据。
在一些可能的实施方式中,在根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据方面,处理器702具体用于执行以下操作:
对所述第一待评价企业的已有数据进行差分处理,得到平稳数据序列,以及得到所述平稳数据序列时的差分次数;
对所述平稳数据序列进行自回归分析,得到自相关系数和自相关图;
对所述平稳数据序列进行偏相关分析,得到偏相关系数和偏相关图;
根据所述自相关图和所述偏相关图,分别确定自回归项数和滑动平均项数;
根据所述差分次数、所述自相关系数、所述偏相关系数、所述自回归项数和所述滑动平均项数,构建预测模型;
根据所述预测模型,对所述第一待评价企业的缺失数据进行补全。
在一些可能的实施方式中,在对所述第一待评价企业的已有数据进行差分处理,得到平稳数据序列,以及得到所述平稳数据序列时的差分次数方面,处理器702具体用于执行以下操作:
将所述第一待评价企业的已有数据按照时间先后顺序组成初始数据序列;
对所述初始数据序列进行一阶差分处理,并对一阶差分处理结果进行稳定性检验;
当稳定性检验失败时,对所述初始数据序列进行二阶差分处理,直至对所述初始数据序列进行N阶差分处理时,通过稳定性检验,则将所述N阶差分处理结果作为所述平稳数据序列,以及得到所述差分次数为N,N为大于或者等于1的整数。
具体地,上述收发器701可为图6所述的实施例的ESG指数确定装置600的获取单元601,上述处理器702可以为图6所述的实施例的ESG指数确定装置600的处理单元602。
应理解,本申请中的电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(MobileInternet Devices,简称:MID)或穿戴式设备等。上述电子设备仅是举例,而非穷举,包含但不限于上述电子设备。在实际应用中,上述电子设备还可以包括:智能车载终端、计算机设备等等。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种基于数据补全的ESG指数确定方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种基于数据补全的ESG指数确定方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于数据补全的ESG指数确定方法,其特征在于,包括:
根据多个时刻下第一待评价企业在第一ESG指标下的已有数据,确定所述第一待评价企业在所述第一ESG指标下的数据缺失度,其中,所述第一待评价企业为多个待评价企业中的任意一个,所述第一ESG指标为多个ESG指标中的任意一个;
当所述数据缺失度小于第一阈值时,根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据;
当所述数据缺失度大于或者等于所述第一阈值时,根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,得到所述补全数据;
根据第一时刻在所述多个ESG指标下的已有数据和补全数据,确定所述第一待评价企业在所述第一时刻的ESG指数,所述第一时刻为所述多个时刻中的任意一个。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,包括:
对所述第一ESG指标进行关键词识别,确定所述第一ESG指标的业务属性,其中,所述第一ESG指标的业务属性包括行业属性或财务属性;
根据所述第一ESG指标的业务属性,以及所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在所述多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一ESG指标的业务属性,以及所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在所述多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,包括:
当所述第一ESG指标的业务属性为行业属性时,从所述多个待评价企业中选出目标待评价企业,其中,所述目标待评价企业与所述第一待评价企业的行业属性相同;
根据所述第一待评价企业的已有数据,以及所述目标待评价企业的已有数据,对所述第一待评价企业的缺失数据进行多次插补,得到所述第一待评价企业在所述第一时刻下的补全数据;
当所述第一ESG指标的业务属性为财务属性时,确定所述多个财务指标中与所述第一ESG指标相关的目标财务指标;
根据所述第一待评价企业在的已有数据,以及所述第一待评价企业在所述目标财务指标下的财务数据,对所述第一待评价企业的缺失数据进行多次插补,以对所述第一待评价企业的缺失数据进行补全。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一待评价企业的已有数据,以及所述目标待评价企业的已有数据,对所述第一待评价企业的缺失数据进行多次插补,得到所述第一待评价企业在所述第一时刻下的补全数据,包括:
将其他时刻下所述第一待评价企业的已有数据的平均值,作为所述第一时刻下所述第一待评价企业的第一候选数据,其中,所述其他时刻为所述多个时刻中除所述第一时刻之外的时刻;
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业在所述第一ESG指标下的第一参考数据,构建所述第一待评价企业与所述目标待评价企业在所述第一ESG指标下的线性方程;
将所述第一时刻下所述目标待评价企业在所述第一ESG指标下的第一参考数据输入到所述线性方程,得到所述第一时刻下所述第一待评价企业的第二候选数据,其中,所述第一参考数据为所述目标待评价企业在所述第一ESG指标下的已有数据或者第一候选数据;
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业的第二参考数据执行多次插补过程,得到所述第一时刻下所述第一待评价企业的补全数据,所述第二参考数据包括所述目标待评价企业在所述第一ESG指标下的已有数据或者第二候选数据。
5.根据权利要求4所述的方法,其特征在于,所述根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业的第二参考数据执行多次插补过程,得到所述第一时刻下所述第一待评价企业的补全数据,包括:
根据所述其他时刻下所述第一待评价企业的已有数据,以及所述其他时刻下所述目标待评价企业在所述第一ESG指标下的第i参考数据,构建所述第一待评价企业与所述目标待评价企业在所述第一ESG指标下,且与第i次插补过程对应的线性方程,其中,所述第i参考数据为所述目标待评价企业在所述第一ESG指标下的已有数据或者第i-1次插补过程得到的候选数据;
将所述目标待评价企业的第i参考数据输入到与第i次插补过程对应的线性方程,得到所述第一待评价企业与所述第i次插补过程对应的候选数据;
获取各个待评价企业所述第i次插补过程得到的候选数据,与所述第i-1次插补过程得到的候选数据之间的差值的平方和,其中,所述各个待评价企业包括所述第一待评价企业和所述目标待评价企业;
若所述平方和小于第二阈值或者i大于第三阈值,则将所述第一待评价企业与所述第i次插补过程对应的候选数据作为所述第一时刻下所述第一待评价企业的补全数据。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据,包括:
对所述第一待评价企业的已有数据进行差分处理,得到平稳数据序列,以及得到所述平稳数据序列时的差分次数;
对所述平稳数据序列进行自回归分析,得到自相关系数和自相关图;
对所述平稳数据序列进行偏相关分析,得到偏相关系数和偏相关图;
根据所述自相关图和所述偏相关图,分别确定自回归项数和滑动平均项数;
根据所述差分次数、所述自相关系数、所述偏相关系数、所述自回归项数和所述滑动平均项数,构建预测模型;
根据所述预测模型,对所述第一待评价企业的缺失数据进行补全。
7.根据权利要求6所述的方法,其特征在于,所述对所述第一待评价企业的已有数据进行差分处理,得到平稳数据序列,以及得到所述平稳数据序列时的差分次数,包括:
将所述第一待评价企业的已有数据按照时间先后顺序组成初始数据序列;
对所述初始数据序列进行一阶差分处理,并对一阶差分处理结果进行稳定性检验;
当稳定性检验失败时,对所述初始数据序列进行二阶差分处理,直至对所述初始数据序列进行N阶差分处理时,通过稳定性检验,则将所述N阶差分处理结果作为所述平稳数据序列,以及得到所述差分次数为N,N为大于或者等于1的整数。
8.一种ESG指数确定装置,其特征在于,包括:
获取单元,用于获取多个时刻下第一待评价企业在第一ESG指标下的已有数据;
处理单元,用于根据所述多个时刻下所述第一待评价企业在所述第一ESG指标下的已有数据,确定所述第一待评价企业在所述第一ESG指标下的数据缺失度,其中,所述第一待评价企业为多个待评价企业中的任意一个,所述第一ESG指标为多个ESG指标中的任意一个;
当所述数据缺失度小于第一阈值时,根据所述第一待评价企业的已有数据,对所述第一待评价企业的缺失数据进行补全,得到补全数据;
当所述数据缺失度大于或者等于所述第一阈值时,根据所述多个待评价企业的已有数据,以及所述多个时刻下所述第一待评价企业在多个财务指标下的财务数据,对所述第一待评价企业的缺失数据进行补全,得到所述补全数据;
根据第一时刻在所述多个ESG指标下的已有数据和补全数据,确定所述第一待评价企业在所述第一时刻的ESG指数,所述第一时刻为所述多个时刻中的任意一个。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111156647.XA CN113850523A (zh) | 2021-09-29 | 2021-09-29 | 基于数据补全的esg指数确定方法及相关产品 |
PCT/CN2022/071181 WO2023050649A1 (zh) | 2021-09-29 | 2022-01-11 | 基于数据补全的esg指数确定方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111156647.XA CN113850523A (zh) | 2021-09-29 | 2021-09-29 | 基于数据补全的esg指数确定方法及相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113850523A true CN113850523A (zh) | 2021-12-28 |
Family
ID=78977271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111156647.XA Pending CN113850523A (zh) | 2021-09-29 | 2021-09-29 | 基于数据补全的esg指数确定方法及相关产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113850523A (zh) |
WO (1) | WO2023050649A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023050649A1 (zh) * | 2021-09-29 | 2023-04-06 | 平安科技(深圳)有限公司 | 基于数据补全的esg指数确定方法及相关产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160117774A1 (en) * | 2014-10-24 | 2016-04-28 | ENSOGO Analytics LLC | Environment, social and governance rating system |
CN107220769A (zh) * | 2017-05-26 | 2017-09-29 | 北京汇通金财信息科技有限公司 | 一种企业信用风险评估方法及系统 |
CN113240272A (zh) * | 2021-05-12 | 2021-08-10 | 平安科技(深圳)有限公司 | 企业esg指数确定方法及相关产品 |
CN113313362A (zh) * | 2021-05-12 | 2021-08-27 | 平安科技(深圳)有限公司 | 基于数据补全的企业esg指数确定方法及相关产品 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8818919B2 (en) * | 2011-08-05 | 2014-08-26 | International Business Machines Corporation | Multiple imputation of missing data in multi-dimensional retail sales data sets via tensor factorization |
CA2846594A1 (en) * | 2011-08-26 | 2013-03-07 | Majid Sarrafzadeh | Systems and methods for missing data imputation |
CN107038330B (zh) * | 2016-10-27 | 2020-09-08 | 北京郁金香伙伴科技有限公司 | 一种数据缺失的补偿方法和装置 |
WO2019075599A1 (zh) * | 2017-10-16 | 2019-04-25 | 深圳乐信软件技术有限公司 | 数据填补方法和装置 |
US11010365B2 (en) * | 2018-03-29 | 2021-05-18 | International Business Machines Corporation | Missing value imputation using adaptive ordering and clustering analysis |
JP6667865B1 (ja) * | 2019-11-19 | 2020-03-18 | 国立大学法人一橋大学 | 会計情報処理装置、会計情報処理方法及び会計情報処理プログラム |
CN113850523A (zh) * | 2021-09-29 | 2021-12-28 | 平安科技(深圳)有限公司 | 基于数据补全的esg指数确定方法及相关产品 |
-
2021
- 2021-09-29 CN CN202111156647.XA patent/CN113850523A/zh active Pending
-
2022
- 2022-01-11 WO PCT/CN2022/071181 patent/WO2023050649A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160117774A1 (en) * | 2014-10-24 | 2016-04-28 | ENSOGO Analytics LLC | Environment, social and governance rating system |
CN107220769A (zh) * | 2017-05-26 | 2017-09-29 | 北京汇通金财信息科技有限公司 | 一种企业信用风险评估方法及系统 |
CN113240272A (zh) * | 2021-05-12 | 2021-08-10 | 平安科技(深圳)有限公司 | 企业esg指数确定方法及相关产品 |
CN113313362A (zh) * | 2021-05-12 | 2021-08-27 | 平安科技(深圳)有限公司 | 基于数据补全的企业esg指数确定方法及相关产品 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023050649A1 (zh) * | 2021-09-29 | 2023-04-06 | 平安科技(深圳)有限公司 | 基于数据补全的esg指数确定方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
WO2023050649A1 (zh) | 2023-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6771751B2 (ja) | リスク評価方法およびシステム | |
CN107193876B (zh) | 一种基于最近邻knn算法的缺失数据填补方法 | |
CN109299258A (zh) | 一种舆情事件检测方法、装置及设备 | |
CN111461164B (zh) | 样本数据集的扩容方法及模型的训练方法 | |
CN112801773A (zh) | 企业风险预警方法、装置、设备及存储介质 | |
CN108153735B (zh) | 一种近义词的获取方法及系统 | |
CN111724084A (zh) | 数据资产的价值显示方法、装置、设备及存储介质 | |
CN114443958A (zh) | 一种推荐方法、推荐系统及推荐系统训练方法 | |
CN116362823A (zh) | 用于行为稀疏场景的推荐模型训练方法、推荐方法及装置 | |
CN117112909A (zh) | 应用于云数字业务的大数据推荐方法及大数据挖掘系统 | |
CN113850523A (zh) | 基于数据补全的esg指数确定方法及相关产品 | |
CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
CN112990583A (zh) | 一种数据预测模型的入模特征确定方法及设备 | |
CN110968835A (zh) | 一种近似分位数计算方法及装置 | |
CN103425579A (zh) | 基于势函数的移动终端系统安全测评方法 | |
CN116451081A (zh) | 数据漂移的检测方法、装置、终端及存储介质 | |
CN113361956B (zh) | 资源生产方的资源质量评价方法、装置、设备及存储介质 | |
CN114861800A (zh) | 模型训练方法、概率确定方法、装置、设备、介质及产品 | |
CN111783453B (zh) | 文本的情感信息处理方法及装置 | |
CN110633971A (zh) | 资损估计方法以及装置 | |
CN114647739A (zh) | 实体链指方法、装置、电子设备及存储介质 | |
CN110795537A (zh) | 一种确定目标商品的改进策略的方法、装置、设备和介质 | |
CN112381620A (zh) | 产品推荐方法、装置、电子设备及计算机可读存储介质 | |
CN111737554A (zh) | 评分模型训练方法、电子书评分方法及装置 | |
CN115495503A (zh) | 数据处理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40062893 Country of ref document: HK |