CN117876137A - 财务状况确定方法、装置及计算设备 - Google Patents

财务状况确定方法、装置及计算设备 Download PDF

Info

Publication number
CN117876137A
CN117876137A CN202410054745.XA CN202410054745A CN117876137A CN 117876137 A CN117876137 A CN 117876137A CN 202410054745 A CN202410054745 A CN 202410054745A CN 117876137 A CN117876137 A CN 117876137A
Authority
CN
China
Prior art keywords
chart
financial
feature
value
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410054745.XA
Other languages
English (en)
Inventor
赵晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China International Financial Ltd By Share Ltd
Original Assignee
China International Financial Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China International Financial Ltd By Share Ltd filed Critical China International Financial Ltd By Share Ltd
Priority to CN202410054745.XA priority Critical patent/CN117876137A/zh
Publication of CN117876137A publication Critical patent/CN117876137A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了一种财务状况确定方法和装置。在该方法中,首先获取财务对照组和目标财务图表。然后对对照财务图表执行图表特征提取步骤组以提取对照财务图表的图表特征。然后,对目标财务图表执行图表特征提取步骤组以提取目标财务图表的图表特征。然后,比较对照财务图表的图表特征和目标财务图表的图表特征,确定对照财务图表的图表特征和目标财务图表的图表特征之间的相似度。最后,响应于相似度大于或等于目标阈值,确定目标财务图表对应的财务状况与对照财务图表对应的财务状况相同。通过本申请的实施例,可以实现准确、快速、鲁棒性强、自动化程度高的企业财务状况确定方法。

Description

财务状况确定方法、装置及计算设备
技术领域
本申请涉及计算机技术领域,特别涉及一种财务状况确定方法和装置、计算设备、计算机可读存储介质及计算机程序产品。
背景技术
企业的财务信息通常以财务数据(例如编制企业财务报表等)的形式进行记录。为了方便进行财务分析,通常会将企业的数据制成财务图表。然后,财务人员将结合行业经验,根据财务图表确定企业的财务状况,例如写下企业的财务状况是正面的还是负面的。然而,在实际应用中,这一方法存在诸多限制。首先,企业的财务图表通常数量繁多且复杂,根据财务图表分析企业的财务状况依赖于企业财务人员的行业知识和经验,其时效性和准确性往往并不能保证。其次,关注企业财务状况的往往并不止企业自己,还存在第三方实体(例如作为监管方的政府部门或作为投资者的银行、财团等)。而第三方实体对于企业财务人员写下的企业财务状况通常持审慎的态度,因此也需要能根据企业的财务图表快速、准确地确定企业的财务状况。
发明内容
申请人认识到,如何进行快速、准确、批量化地确定企业财务状况,是本领域亟待解决的问题。鉴于此,本申请提供了一种财务状况确定方法和装置、计算设备、计算机可读存储介质及计算机程序产品,期望缓解或克服上面提到的部分或全部缺陷以及其他可能的缺陷。
根据本申请的一个方面,提供了一种财务状况确定方法,该方法包括:获取财务对照组和目标财务图表,财务对照组包括对照财务图表以及其对应的财务状况,目标财务图表的横坐标轴和对照财务图表的横坐标轴表征相同类型的财务信息,目标财务图表的纵坐标轴和对照财务图表的纵坐标轴表征相同类型的财务信息;对对照财务图表执行图表特征提取步骤组以提取对照财务图表的图表特征,图表特征用于表征财务图表的图表信息;对目标财务图表执行图表特征提取步骤组以提取目标财务图表的图表特征;比较对照财务图表的图表特征和目标财务图表的图表特征,确定对照财务图表的图表特征和目标财务图表的图表特征之间的相似度;以及,响应于相似度大于或等于目标阈值,确定目标财务图表对应的财务状况与对照财务图表对应的财务状况相同;其中,图表特征提取步骤组包括以下步骤:利用第一卷积核依次对图表的多个部分的相邻像素点进行卷积运算,以得到分别与部分相邻像素点对应的卷积运算结果;确定图表对应的特征图,特征图包含多个元素点,每个元素点与图表的部分相邻像素点对应,元素点的值是部分相邻像素点的卷积运算结果;基于图表对应的特征图确定图表的图表特征。
根据本申请的另一方面,提供了一种财务状况确定装置,该财务状况确定装置包括:获取模块,其被配置成获取财务对照组和目标财务图表,财务对照组包括对照财务图表以及其对应的财务状况,目标财务图表的横坐标轴和对照财务图表的横坐标轴表征相同类型的财务信息,目标财务图表的纵坐标轴和对照财务图表的纵坐标轴表征相同类型的财务信息;提取模块,其被配置成对对照财务图表执行图表特征提取步骤组以提取对照财务图表的图表特征,图表特征用于表征财务图表的图表信息;以及,提取模块被进一步配置成对目标财务图表执行图表特征提取步骤组以提取目标财务图表的图表特征;比较模块,其被配置成比较对照财务图表的图表特征和目标财务图表的图表特征,确定对照财务图表的图表特征和目标财务图表的图表特征之间的相似度;以及,确定模块,其被配置成响应于相似度大于或等于目标阈值,确定目标财务图表对应的财务状况与对照财务图表对应的财务状况相同;其中,图表特征提取步骤组包括以下步骤:利用第一卷积核依次对图表的多个部分的相邻像素点进行卷积运算,以得到分别与部分相邻像素点对应的卷积运算结果;确定图表对应的特征图,特征图包含多个元素点,每个元素点与图表的部分相邻像素点对应,元素点的值是部分相邻像素点的卷积运算结果;基于图表对应的特征图确定图表的图表特征。
在根据本申请的一些实施例的财务状况确定装置中,基于图表对应的特征图确定图表的图表特征包括:从图表的特征图中提取第一特征,第一特征用于表征特征图的元素点的离散程度;至少基于第一类特征确定图表的图表特征。
在根据本申请的一些实施例的财务状况确定装置中,从图表的特征图中提取第一特征包括:确定特征图对应的元素序列,元素序列包含特征图的所有元素,且元素序列组以预定顺序将元素进行排列,元素在特征图中的位置和在元素序列中的位置之间满足等式:
k=N×(i-1)+j
其中,i、j分别表示元素在特征图中位于第i行、第j列,k表示元素在元素序列中排第k个,N是特征图中每行元素的数量;针对元素序列的每个元素,确定其第一离散值,一个元素的第一离散值是一个元素的值与一个元素在元素序列的后一个元素的值之间的差值;针对元素序列的每个元素,确定其第二离散值,一个元素的第二离散值是一个元素在元素序列的前一个元素的值与一个元素在元素序列的后一个元素的值之间的差值再除以二;针对元素序列的每个元素,确定其综合离散值,一个元素的综合离散值是一个元素的第一离散值和第二离散值的平均值;以及,确定特征图的第一特征,第一特征是元素序列的所有元素的综合离散值的平均数。
在根据本申请的一些实施例的财务状况确定装置中,基于图表对应的特征图确定图表的图表特征进一步包括:从图表的特征图中提取第二特征,第二特征用于表征特征图的边缘信息;至少基于第一特征确定图表的图表特征包括:至少基于第一特征和第二特征确定图表的图表特征。
在根据本申请的一些实施例的财务状况确定装置中,从图表的特征图中提取第二特征包括:针对特征图的每个元素,确定其横向变化值,一个元素的横向变化值等于其在特征图的横轴方向上的下一个元素的值与上一个元素的值之间的差值;针对特征图的每个元素,确定其纵向变化值,一个元素的纵向变化值等于其在特征图的纵轴方向上的下一个元素的值与上一个元素的值之间的差值;根据特征图的所有元素的横向变化值和纵向变化值确定特征图的第二特征。
在根据本申请的一些实施例的财务状况确定装置中,基于图表对应的特征图确定图表的图表特征进一步包括:从图表的特征图中提取第三特征,第三特征用于表征图表的异常点信息;至少基于第一特征和第二特征确定图表的图表特征包括:至少基于第一特征、第二特征和第三特征确定图表的图表特征。
在根据本申请的一些实施例的财务状况确定装置中,从图表的特征图中提取第三特征包括:确定特征图对应的元素集,元素集包含特征图中的所有元素点;确定元素集中每个元素的异常分数,异常分数用于表征元素是异常点的可能性;将元素集中所有元素的异常分数的平均数确定为特征图的第三特征。
在根据本申请的一些实施例的财务状况确定装置中,确定元素集中每个元素的异常分数包括:确定初始数值区间,初始数值区间是一个连续的数值区间,且元素集的每个元素的元素值都处于初始数值区间内;对初始数值区间进行N次分段,得到M个目标子数值段,每个目标子数值段仅能包含一个元素值,每个目标子数值段具有一个分段标签和对应的元素值,分段标签的值表明从初始数值区间得到该目标子数值段所经过的分段次数;将每个元素值与能包含元素值的目标子数值段的分段标签相关联;根据与元素值关联的分段标签确定每个元素值的异常分数,异常分数和分段标签满足等式:
c(n)=2H(n-1)-2(n-1)/n
H(k)=lnk+ξ
其中,p表示元素点,n是元素集中的元素点的总数,Q是元素点关联的分段标签,s是元素点的异常分数,ξ是欧拉常数。
在根据本申请的一些实施例的财务状况确定装置中,基于图表对应的特征图确定图表的图表特征进一步包括:从图表的特征图中提取第四特征,第四特征用于表征图表的分布信息;至少基于第一特征、第二特征和第三特征确定图表的图表特征包括:至少基于第一特征、第二特征、第三特征和第四特征确定图表的图表特征。
在根据本申请的一些实施例的财务状况确定装置中,从图表的特征图中提取第四特征包括:确定特征图的峰度值,峰度值满足等式:
其中,n是元素集中的元素点的总数,i是小于或等于n的正整数,pi表示第i个元素点的元素值,表示所有元素点的元素值的平均数,K是峰度值;
确定所述特征图的偏态系数,所述偏态系数满足等式:
其中,P是偏态系数,xi是第i个元素点在特征图中的横坐标,表示所有元素点的横坐标的平均数,σ是所有元素点的横坐标的均方差;根据特征图的峰度值和偏态系数确定特征图的第四特征。
在根据本申请的一些实施例的财务状况确定装置中,至少基于第一特征、第二特征、第三特征和第四特征确定图表的图表特征包括:获取第一权重、第二权重、第三权重和第四权重;确定图表的图表特征,图表特征满足等式:
T=α1×t12×t23×t34×t4
其中,T是图表特征,α1、α2、α3、α4分别是第一权重、第二权重、第三权重和第四权重,t1、t2、t3、t4分别是第一特征、第二特征、第三特征和第四特征。
根据本申请的另一方面,提供了一种计算设备,包括:存储器,其被配置成存储计算机可执行指令;以及处理器,其被配置成当计算机可执行指令被处理器执行时执行根据本申请一些实施例的财务状况确定方法的步骤。
根据本申请的另一方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,计算机可执行指令在被执行时实现根据本申请一些实施例的财务状况确定方法的步骤。
根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本申请一些实施例的财务状况确定方法的步骤。
在根据本申请一些实施例的财务状况确定方法和装置中,首先以相同的步骤(即图表特征提取步骤组)分别从对照财务图表和目标财务图表提取图表特征。由于提取图表特征的步骤相同,因此所提取的图表特征具有可比性。然后,财务状况确定方法对对照财务图表的图表特征和目标财务图表的图表特征进行对比,确定它们的相似度。响应于相似度大于或等于目标阈值,确定目标财务图表和对照财务图表对应的财务状况相同。以及,图表特征提取步骤组通过卷积确定图表的特征图,然后从特征图中提取图表特征。这避免了直接比较图表,使得得到的图表特征在包含图表的横纵坐标的关联关系的情况下,摈弃了图表的大部分与财务信息不相关的信息,提升了图表特征的表征能力。由于不需要直接比较财务图表的像素点,避免了被财务图表的冗余信息所干扰,例如被财务图表的样式(柱状图、折线图、条形图等)所影响。可见,通过财务状况确定方法,可以实现准确、快速、鲁棒性强、自动化程度高的企业财务状况确定方法。
根据下文描述的实施例,本申请的这些和其它优点将变得清楚,并且参考下文描述的实施例来阐明本申请的这些和其它优点。
附图说明
现在将更详细并且参考附图来描述本申请的实施例,其中:
图1A示出了根据本申请的一些实施例的财务图表的示意图;
图1B示出了根据本申请的一些实施例的财务图表的示意图;
图1C示出了根据本申请的一些实施例的财务图表的示意图;
图1D示出了根据本申请的一些实施例的财务图表的示意图;
图1E示出了根据本申请的一些实施例的财务图表的示意图;
图2示出了根据本申请的一些实施例的财务状况确定方法的示例性应用场景;
图3示出了根据本申请的一些实施例的财务状况确定方法的示例性流程图;
图4示出了根据本申请的一些实施例的确定图表特征的示意图;
图5示出了根据本申请的一些实施例的确定多个财务图表对应的财务状况的示例性流程图;
图6示出了根据本申请的一些实施例的财务状况确定装置的示例性结构框图;以及,
图7示出了一个示例系统,其包括代表可以实现本文描述的各种方法的一个或多个系统和/或设备的示例计算设备。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本申请将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组件、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的推广信息和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本申请概念的教示。如本文中所使用,术语“和/或”及类似术语包括相关联的列出项目中的任一个、多个和全部的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本申请所必须的,因此不能用于限制本申请的保护范围。
在详细介绍本申请的实施例之前,首先对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
财务图表:财务图表以图像的形式表示一个或几个财务类型数据的变化趋势。通常而言,财务图表是一个包含横纵坐标轴的图像,其横坐标轴和纵坐标轴分别表征一类或几类财务信息。例如,财务图表中一个点的横坐标可以指示财务时间,纵坐标可以指示企业收入等。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。
深度学习(DL,Deep Learning):深度学习是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,Artificial Intelligence)。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理、多媒体学习、语音、推荐和个性化技术,以及其他相关领域都取得了很多成果。
图1A-1E示出了企业财务图表的示意图。如图1A-1E所示,企业财务表报通常用于表现企业某些财务信息的变化,它可以以条形图、树状图、折线图等形式进行绘制。当分析人员(例如企业内部的审计人员或企业外部的监管人员等)需要确定企业的财务状况时,通常需要借助分析人员自身的行业经验、财务知识等从财务图表中分析出财务信息,并据此确定企业的财务状况。因此,在面对大量的财务图表需要分析时,分析人员往往不堪重负,且效率不高。可见,本领域需要一种能自动根据企业的财务图表确定企业的财务状况的方法和装置,来实现快速、高效和精确地确定企业的财务状况。为此,本申请提出了一种财务状况确定方法。
图2示出了根据本申请的一些实施例的财务状况确定方法的示例性应用场景200。应用场景200中可以包括服务器210、终端设备220、服务器230。服务器210、终端设备220和服务器230通过网络240通信耦合在一起。网络240例如可以是广域网(WAN)、局域网(LAN)、无线网络、公用电话网、内联网以及本领域的技术人员熟知的任何其它类型的网络。
作为示例,财务状况确定方法可以主要在服务器210上运行。在服务器210上,首先获取财务对照组和目标财务图表。财务对照组和目标财务图表可以存储在服务器210上,也可以从终端设备220或服务器230获取,或者通过网络240从其他设备获得。然后对对照财务图表执行图表特征提取步骤组以提取对照财务图表的图表特征。然后,对目标财务图表执行图表特征提取步骤组以提取目标财务图表的图表特征。然后,比较对照财务图表的图表特征和目标财务图表的图表特征,确定对照财务图表的图表特征和目标财务图表的图表特征之间的相似度。最后,响应于相似度大于或等于目标阈值,确定目标财务图表对应的财务状况与对照财务图表对应的财务状况相同。。
作为示例,财务状况确定方法也可以主要在终端设备220或服务器230上运行。应当指出,服务器210、终端设备220以及服务器230均可以包含能够持久存储信息的介质和/或设备,和/或有形的存储装置。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或以适用于存储信息(诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据)的方法或技术实现的存储设备之类的硬件。本领域普通技术人员所理解的,服务器210的实例可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。服务器210可以通过终端设备220将待确定的数据分配策略呈现给开发人员,并与开发人员进行交互,实现可视化确定开发策略。
终端设备220可以是任何类型的移动计算设备,包括移动计算机(例如,个人数字助理(PDA)、膝上型计算机、笔记本计算机、平板计算机、上网本等)、移动电话(例如,蜂窝电话、智能手机等)、可穿戴式计算设备(例如智能手表、头戴式设备,包括智能眼镜等)或其他类型的移动设备。在一些实施例中,终端设备220、终端设备230也可以是固定式计算设备,例如台式计算机、游戏机、智能电视等。此外,应用场景200包括多个终端设备220的情况下,该多个终端设备220可以是相同或不同类型的计算设备。
如图2所示,终端设备220可以包括显示屏以及可以经由显示屏与终端用户交互的终端应用。终端应用可以为本地应用程序、网页(Web)应用程序或者作为轻量化应用的小程序(LiteApp,例如手机小程序、微信小程序)。在终端应用为需要安装的本地应用程序的情况下,可以将终端应用安装在终端设备220中。在终端应用为Web应用程序的情况下,可以通过浏览器访问终端应用。在终端应用为小程序的情况下,可以通过搜索终端应用的相关信息(如终端应用的名称等)、扫描终端应用的图形码(如条形码、二维码等)等方式来在用户终端220上直接打开终端应用,而无需安装终端应用。
在一些实施例中,上述的应用场景200可以是由服务器230构成的分布式系统,该分布式系统例如可以构成区块链系统。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能等。
平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。
图3示出了根据本申请的一些实施例的财务状况确定方法300的示例性流程图。如图3所示,方法300包括步骤S310、步骤S320、步骤S330、步骤S340和步骤S350。
在步骤S310,获取财务对照组和目标财务图表。财务对照组包括对照财务图表以及其对应的财务状况。目标财务图表的横坐标轴和对照财务图表的横坐标轴表征相同类型的财务信息,且目标财务图表的纵坐标轴和对照财务图表的纵坐标轴表征相同类型的财务信息。例如,当目标财务图表是图1B或图1C时,可以选择图1A为对照财务图表,因为它们的纵坐标表征的财务信息的类型相同(都是收入信息),横坐标表征的财务信息的类型相同(都是时间信息)。
在步骤S320,对对照财务图表执行图表特征提取步骤组以提取对照财务图表的图表特征,图表特征用于表征财务图表的图表信息。例如,利用图表特征提取步骤组从图1A提取图1A的图表特征。这里的图表特征,是指能表征财务图表所表现出来的横纵坐标变化关系的特征,由于财务图表的横纵坐标分别表征不同类型的财务信息,因此图表特征能表征企业的两种财务信息之间的变化关系。
在步骤S330,对目标财务图表执行图表特征提取步骤组以提取目标财务图表的图表特征。例如,利用图表特征提取步骤组从图1B提取图1B的图表特征或从图1C提取图1C的图表特征。需要指出的是,在步骤S320和步骤S330中执行的图表特征提取步骤组是相同的步骤组,从而保证对照财务图表的图表特征和目标财务图表的图表特征对企业财务信息的学习模式和尺度相同,从而具有可比性。
在步骤S340,比较对照财务图表的图表特征和目标财务图表的图表特征,确定对照财务图表的图表特征和目标财务图表的图表特征之间的相似度。作为示例,相似度可以以二者中数值较小的一个占数值较大的一个的比例来表征。例如,对照财务图表的图表特征是0.984,目标财务图表的图表特征是1.136,则相似度可以以0.984/1.136=0.866来表示。
在步骤S350,响应于相似度大于或等于目标阈值,确定目标财务图表对应的财务状况与对照财务图表对应的财务状况相同。例如,目标阈值被设置为0.7,当相似度大于或等于0.7时,确定目标财务图表对应的财务状况与对照财务图表对应的财务状况相同,此时如果对照财务图表对应的财务状况是正面的,则确定目标财务图表对应的财务状况也是正面的。
作为示例,图表特征提取步骤组包括以下步骤:利用第一卷积核依次对图表的多个部分的相邻像素点进行卷积运算,以得到分别与部分相邻像素点对应的卷积运算结果;确定图表对应的特征图,特征图包含多个元素点,每个元素点与图表的部分相邻像素点对应,元素点的值是部分相邻像素点的卷积运算结果;基于图表对应的特征图确定图表的图表特征。通过确定图表的特征图,然后从图表的特征图中提取图表特征,来表征财务图表所表达的横纵坐标之间的关联关系,实现提取财务图表的财务信息的目的,避免了冗余信息对确定财务状况的干扰。例如,如果直接比较图1A和图1B,(即把它们当作普通图像进行比较,例如直接比较像素点的分布等)可能会因为它们都是条形图而直接判断为相似,而图1C由于是折线图而被认为与图1A不相似。这种判断显然是不合需求的,因为它只考虑了图像的像素,而没有考虑财务图表的横纵坐标所表达出来的相互关系,因此不能有效提取财务图表背后蕴含的两种财务类型信息之间的关联。
因此,方法300首先以相同的步骤(即图表特征提取步骤组)分别从对照财务图表和目标财务图表提取图表特征。由于提取图表特征的步骤相同,因此所提取的图表特征具有可比性。然后,方法300对对照财务图表的图表特征和目标财务图表的图表特征进行对比,确定它们的相似度。响应于相似度大于或等于目标阈值,确定目标财务图表和对照财务图表对应的财务状况相同。以及,图表特征提取步骤组通过卷积确定图表的特征图,然后从特征图中提取图表特征。这避免了直接比较图表,使得得到的图表特征在包含图表的横纵坐标的关联关系的情况下,摈弃了图表的大部分与财务信息不相关的信息,提升了图表特征的表征能力。由于不需要直接比较财务图表的像素点,避免了被财务图表的冗余信息所干扰,例如被财务图表的样式(柱状图、折线图、条形图等)所影响。可见,通过方法300,可以实现准确、快速、鲁棒性强、自动化程度高的企业财务状况确定方法。
在一些实施例中,利用第一卷积核依次对图表的多个部分的相邻像素点进行卷积运算,以得到分别与部分相邻像素点对应的卷积运算结果可以利用如下步骤。
在卷积实际计算之前,定义卷积:
其中,h表示第一卷积核,f是图表的像素矩阵,g是卷积运算结果,即特征图。将上面的等式进行展开,即得到如下等式:
具体地,在进行卷积运算时,进行如下操作:在图表f上滑动第一卷积核h,使其中心对应于特征图g中位置为(i,j)的元素;利用上式求和,得到特征图g中位置为(i,j)的元素的值;然后,不断执行上述步骤,直到得到特征图g中所有位置的元素的值。
利用卷积核进行计算,可以提取图表的深度信息,例如图表的曲线走势、灰度分布等。卷积计算图片的意义可以看作对某个局部的加权求和,因为是对应局部感知,它的原理是在观察某个物体时我们既不能观察每个像素也不能一次观察整体,而是先从局部开始认识,即利用卷积。在本实施例中,通过确定图表的特征图,然后从图表的特征图中提取图表特征,来表征财务图表所表达的横纵坐标之间的关联关系,实现提取财务图表的财务信息的目的,避免了冗余信息对确定财务状况的干扰。
在一些实施例中,基于图表对应的特征图确定图表的图表特征包括:从图表的特征图中提取第一特征,第一特征用于表征特征图的元素点的离散程度;至少基于第一类特征确定图表的图表特征。例如,可以将第一类特征作为图表的图表特征。
在一些实施例中,从图表的特征图中提取第一特征包括:确定特征图对应的元素序列,元素序列包含特征图的所有元素,且元素序列组以预定顺序将元素进行排列;针对元素序列的每个元素,确定其第一离散值,一个元素的第一离散值是一个元素的值与该一个元素在元素序列的后一个元素的值之间的差值;针对元素序列的每个元素,确定其第二离散值,一个元素的第二离散值是该一个元素在元素序列的前一个元素的值与该一个元素在元素序列的后一个元素的值之间的差值再除以二;针对元素序列的每个元素,确定其综合离散值,一个元素的综合离散值是该一个元素的第一离散值和第二离散值的平均值;以及,确定特征图的第一特征,第一特征是元素序列的所有元素的综合离散值的平均数。作为示例,元素在特征图中的位置和在元素序列中的位置之间满足等式:
k=N×(i-1)+j
其中,i、j分别表示元素在特征图中位于第i行、第j列,k表示元素在元素序列中排第k个,N是特征图中每行元素的数量。
例如,特征图g包含100×200个元素(即100行、200列),g(5,4)表示g中第5行、第4列的元素,它在元素序列中对应的位置是200×(5-1)+4=804。
作为示例,离散程度可以利用前向差分或中心差分确定。前向差分满足等式:
Ii=Li+1-Li
中心差分满足等式:
其中,Li表示序列中第i个元素,Ii表示Li的前向差分值,I′i表示Li的中心差分值。作为示例,可以将前向差分值确定为一个元素的第一离散值,将中心差分值确定为一个元素的第二离散值,将前向差分值和中心差分值的平均数确定为综合离散值。
在一些实施例中,基于图表对应的特征图确定图表的图表特征进一步包括:从图表的特征图中提取第二特征,第二特征用于表征特征图的边缘信息。以及,至少基于第一特征确定图表的图表特征包括:至少基于第一特征和第二特征确定图表的图表特征。例如,获取第一权重和第二权重,将第一权重和第一特征相乘,将第二权重和第二特征相乘,最后将上述乘积进行叠加,将叠加结果确定为图表的图表特征。
作为示例,第二特征可以根据图表的变化梯度来确定。例如,通过分析特征图中每个元素与相邻元素相比的变化量,来确定图表的变化梯度。由于特征图的元素具有横向和纵向两个方向上的相邻元素,因此可以利用第二卷积核对图表的特征图进行卷积来确定图表的变化梯度。作为示例,图表的变化梯度满足等式:
其中,g(x,y)表示特征图中第x行第y列的元素,表示特征图中第x行第y列的元素的变化梯度值。
因此,通过结合变化梯度值,可以分析图表中同相邻元素的变化量,从而确定并表征图表的边缘信息。这些边缘信息将包含图表轮廓边缘灰度变化信息和层次感信息等。作为示例,可以将特征图中所有元素的变化梯度的平均值确定为特征图的变化梯度,然后根据特征图的变化梯度确定图表的第二特征。例如,以特征图的第二梯度的向量的长度作为图表的第二特征,或者以特征图的第二梯度的向量的所有维度的向量元素的平均值作为图表的第二特征。
在一些实施例中,从图表的特征图中提取第二特征包括:针对特征图的每个元素,确定其横向变化值,一个元素的横向变化值等于其在特征图的横轴方向上的下一个元素的值与上一个元素的值之间的差值;针对特征图的每个元素,确定其纵向变化值,一个元素的纵向变化值等于其在特征图的纵轴方向上的下一个元素的值与上一个元素的值之间的差值;根据特征图的所有元素的横向变化值和纵向变化值确定特征图的第二特征。作为示例,根据特征图的所有元素的横向变化值和纵向变化值确定特征图的第二特征包括:确定特征图的所有元素的横向变化值的平均数和所有元素的纵向变化值的平均数,以这两个平均数建立二维的梯度向量;将二维的梯度向量投影到一个一维平面,得到一个一维数据以作为第二特征。投影的过程可以使用另一个二维向量与该二维的梯度向量进行点积。
在一些实施例中,基于图表对应的特征图确定图表的图表特征进一步包括:从图表的特征图中提取第三特征,第三特征用于表征图表的异常点信息。以及,至少基于第一特征和第二特征确定图表的图表特征包括:至少基于第一特征、第二特征和第三特征确定图表的图表特征。例如,获取第一权重、第二权重和第三权重,将第一权重和第一特征相乘,将第二权重和第二特征相乘,将第三权重和第三特征相乘,最后将上述乘积进行叠加,将叠加结果确定为图表的图表特征。作为示例,可以利用“孤立森林”等算法对特征图中的各个元素点进行打分,打出的分数代表该元素点相对于特征图的大部分元素点是离群点的概率。
在一些实施例中,从图表的特征图中提取第三特征包括:确定特征图对应的元素集,元素集包含特征图中的所有元素点;确定元素集中每个元素的异常分数,异常分数用于表征元素是异常点的可能性;将元素集中元素的异常分数的平均数确定为特征图的第三特征。
在一些实施例中,确定元素集中每个元素的异常分数包括:确定初始数值区间,初始数值区间是一个连续的数值区间,且元素集的每个元素的元素值都处于初始数值区间内;对初始数值区间进行N次分段,得到M个目标子数值段,每个目标子数值段仅能包含一个元素值,每个目标子数值段具有一个分段标签和对应的元素值,分段标签的值表明从初始数值区间得到该目标子数值段所经过的分段次数;将每个元素值与能包含元素值的目标子数值段的分段标签相关联;根据与元素值关联的分段标签确定每个元素值的异常分数。作为示例,异常分数和分段标签满足等式:
c(n)=2H(n-1)-2(n-1)/n
H(k)=lnk+ξ
其中,p表示一个元素点,n是元素集中的元素点的总数,Q是元素点关联的分段标签,s是元素点的异常分数,ξ是欧拉常数,E表示对多轮求得的分段标签的值取平均数。例如,对元素集进行m轮操作。在每一轮操作中,都对元素集中的每一个点确定其分段标签。最后在对元素集中的每个点打分时,计算每个点在这m轮操作中的平均值,即E(Q(p)),其中,m、n都是自然数。从而以上计算得出:异常分数越接近1,其是异常点的可能性越高;如果所有分数都在0.5附近,那么数据集中不包含明显的异常样本。因此,第三特征充分表现了特征图中元素点的离群信息,当图表特征至少基于第三特征时,将能更加充分地表征财务信息中的离群样本。
在一些实施例中,基于图表对应的特征图确定图表的图表特征进一步包括:从图表的特征图中提取第四特征,第四特征用于表征图表的分布信息。以及,至少基于第一特征、第二特征和第三特征确定图表的图表特征包括:至少基于第一特征、第二特征、第三特征和第四特征确定图表的图表特征。
作为示例,分布信息可以涵盖图表的形状和趋势信息。例如,可以结合图表的峰度信息和偏态分布信息。峰度值用于衡量数据分布的平坦度(flatness)。尾部大的数据分布,其峰度值较大。偏态分布信息用于表征图表的分布方式,例如整体是左偏还是右偏。
在一些实施例中,从图表的特征图中提取第四特征包括:确定特征图的峰度值和偏态系数,然后根据特征图的峰度值和偏态系数确定特征图的第四特征。峰度值满足等式:
其中,n是元素集中的元素点的总数,i是小于或等于n的正整数,pi表示第i个元素点的元素值,表示所有元素点的元素值的平均数,K是峰度值。由于正态分布的峰度系数为0,若峰度系数的值明显不等于0,则分布比正态分布更平或更尖。当K>0时为尖峰分布,数据的分布更集中;当K<0时为扁平分布,数据的分布更分散。
偏态分布(Skewness)指图表中图形的分布的对称性,偏态系数则是描述分布偏离对称性程度的一个系数。作为示例,偏态系数可以包含简单偏态系数或加权偏态系数。简单偏态系数满足等式:
其中,P是偏态系数,xi是第i个元素点在特征图中的横坐标,表示所有元素点的横坐标的平均数,σ是所有元素点的横坐标的均方差。加权偏态系数满足等式:
其中,U是所有元素点的横坐标和纵坐标的均值。
当偏态系数大于0时,表明图表中图形的重尾在右侧,此时称该分布为右偏(正偏态);当偏态系数小于0时,表明图表中图形的重尾在左侧,此时称该分布为左偏(负偏态)。
可见,第四特征能够表征图表中图形的分布信息。结合第四特征确定的图表特征,能够更好地表征图表中横纵坐标所代表的类型的财务信息之间的关系。
在一些实施例中,至少基于第一特征、第二特征、第三特征和第四特征确定图表的图表特征包括:获取第一权重、第二权重、第三权重和第四权重;确定图表的图表特征,图表特征满足等式:
T=α1×t12×t23×t34×t4
其中,T是图表特征,α1、α2、α3、α4分别是第一权重、第二权重、第三权重和第四权重,t1、t2、t3、t4分别是第一特征、第二特征、第三特征和第四特征。作为示例,第一权重、第二权重、第三权重和第四权重可以通过实验的方式提前确定,也可以在测试中进行微调。针对不同的业务场景,可以选用不同的第一权重、第二权重、第三权重和第四权重。由于第一特征、第二特征、第三特征和第四特征所表征的图表的信息类型各异,因此可以根据业务场景来调节第一权重、第二权重、第三权重和第四权重,从而实现更有效第表征财务图表所蕴含的财务信息。
图4示出了根据本申请的一些实施例的确定图表特征的示意图。如图4所示,首先获取图表的像素矩阵,然后利用第一卷积核对像素矩阵进行卷积,得到图表的特征图。然后,利用上述任一实施例中的方法从图表的特征图中获取第一特征、第二特征、第三特征和第四特征。最后,根据第一特征、第二特征、第三特征和第四特征确定图表的图表特征。可见,根据本实施例的方法,可以实现以同样的标准自动化地确定图表的图表特征,用于表征图表中蕴含的财务信息。
图5示出了根据本申请的一些实施例的确定多个财务图表对应的财务状况的示例性流程图。如图5所示,在步骤S510,获取财务对照组,财务对照组包含对照财务图表和对应的财务状况。例如,对照财务图表是一个条形图、柱状图或折线图。在步骤S520,对对照财务图表执行图表特征提取步骤组以提取对照财务图表的图表特征。例如,执行如图4所示的方法从对照财务图表中提取对照财务图表的图表特征。在步骤S530,针对多个目标财务图表中的每个,确定其财务图表对应的财务状况。例如,针对多个目标财务图表中的每个都执行如图4所示的方法从目标财务图表中提取目标财务图表的图表特征。然后,将多个目标财务图表中的每个的图表特征与对照财务图表的图表特征进行对比,确定它们的相似度,响应于相似度大于或等于预定阈值则认为该目标财务图表对应的财务状况与对照财务图表对应的财务状况相同;响应于相似度小于预定阈值则认为该目标财务图表对应的财务状况与对照财务图表对应的财务状况不同。需要指出的是,对照财务图表和目标财务图表的横纵坐标分别相对应,相对应是指表征同一类型的财务信息。例如,图1A的财务图表被选座对照财务图表,图1B和图1C的财务图表作为目标财务图表。图1D的财务图表被选座对照财务图表,图1E的财务图表作为目标财务图表。根据图5所示的实施例,可以快速、准确和高效地自动确定财务图表对应的财务状况,克服了现有技术中依赖人工、效率不高且准确性不稳定的缺点。通过对图5所示出的实施例进行测试时,得出如下实验数据:每秒钟处理超过180张财务图表,得出的财务状况的正确率超过70%。这无疑大大超过了人工处理速度,其正确率也在接受范围内。本申请的各个实施例可以用于海量公司的财务状况的确定。例如,针对十万家企业的十万份财务报表,可以快速得出这十万家企业的财务状况。以及,本申请的各个实施例可以用于企业的财务状况真实性的验证。例如,企业对外通报的财务状况是正面的,但是利用本申请的实施例对其财务报表进行分析,自动得出的财务状况是负面的,则表明企业所宣称的财务状况可能并不属实。以及,本申请的各个实施例可以用于企业的财务报表真实性的验证。例如,针对一家企业的一百份财务报表,经过本申请的方法可以确定其中70份表明企业的财务状况是正面的,其中30份表明企业的财务状况是负面的,这表明企业的财务报表可能存在虚假的地方。
图6示出了根据本申请的一些实施例的财务状况确定装置600的示例性结构框图。如图6所示,装置600包括获取模块610、提取模块620、比较模块630和确定模块640。
获取模块610被配置成获取财务对照组和目标财务图表。财务对照组包括对照财务图表以及其对应的财务状况。目标财务图表的横坐标轴和对照财务图表的横坐标轴表征相同类型的财务信息,且目标财务图表的纵坐标轴和对照财务图表的纵坐标轴表征相同类型的财务信息。例如,当目标财务图表是图1B或图1C时,可以选择图1A为对照财务图表,因为它们的纵坐标表征的财务信息的类型相同(都是收入信息),横坐标表征的财务信息的类型相同(都是时间信息)。
提取模块620被配置成对对照财务图表执行图表特征提取步骤组以提取对照财务图表的图表特征,图表特征用于表征财务图表的图表信息。例如,利用图表特征提取步骤组从图1A提取图1A的图表特征。这里的图表特征,是指能表征财务图表所表现出来的横纵坐标变化关系的特征,由于财务图表的横纵坐标分别表征不同类型的财务信息,因此图表特征能表征企业的两种财务信息之间的变化关系。
比较模块630被配置成对目标财务图表执行图表特征提取步骤组以提取目标财务图表的图表特征。例如,利用图表特征提取步骤组从图1B提取图1B的图表特征或从图1C提取图1C的图表特征。需要指出的是,在步骤S320和步骤S330中执行的图表特征提取步骤组是相同的步骤组,从而保证对照财务图表的图表特征和目标财务图表的图表特征对企业财务信息的学习模式和尺度相同,从而具有可比性。
确定模块640被配置成比较对照财务图表的图表特征和目标财务图表的图表特征,确定对照财务图表的图表特征和目标财务图表的图表特征之间的相似度。作为示例,相似度可以以二者中数值较小的一个占数值较大的一个的比例来表征。例如,对照财务图表的图表特征是0.984,目标财务图表的图表特征是1.136,则相似度可以以0.984/1.136=0.866来表示。以及,确定模块640被进一步配置成响应于相似度大于或等于目标阈值,确定目标财务图表对应的财务状况与对照财务图表对应的财务状况相同。例如,目标阈值被设置为0.7,当相似度大于或等于0.7时,确定目标财务图表对应的财务状况与对照财务图表对应的财务状况相同,此时如果对照财务图表对应的财务状况是正面的,则确定目标财务图表对应的财务状况也是正面的。
作为示例,图表特征提取步骤组包括以下步骤:利用第一卷积核依次对图表的多个部分的相邻像素点进行卷积运算,以得到分别与部分相邻像素点对应的卷积运算结果;确定图表对应的特征图,特征图包含多个元素点,每个元素点与图表的部分相邻像素点对应,元素点的值是部分相邻像素点的卷积运算结果;基于图表对应的特征图确定图表的图表特征。通过确定图表的特征图,然后从图表的特征图中提取图表特征,来表征财务图表所表达的横纵坐标之间的关联关系,实现提取财务图表的财务信息的目的,避免了冗余信息对确定财务状况的干扰。例如,如果直接比较图1A和图1B,(即把它们当作普通图像进行比较,例如直接比较像素点的分布等)可能会因为它们都是条形图而直接判断为相似,而图1C由于是折线图而被认为与图1A不相似。这种判断显然是不合需求的,因为它只考虑了图像的像素,而没有考虑财务图表的横纵坐标所表达出来的相互关系,因此不能有效提取财务图表背后蕴含的两种财务类型信息之间的关联。
因此,财务状况确定装置600首先以相同的步骤(即图表特征提取步骤组)分别从对照财务图表和目标财务图表提取图表特征。由于提取图表特征的步骤相同,因此所提取的图表特征具有可比性。然后,财务状况确定装置600对对照财务图表的图表特征和目标财务图表的图表特征进行对比,确定它们的相似度。响应于相似度大于或等于目标阈值,确定目标财务图表和对照财务图表对应的财务状况相同。以及,图表特征提取步骤组通过卷积确定图表的特征图,然后从特征图中提取图表特征。这避免了直接比较图表,使得得到的图表特征在包含图表的横纵坐标的关联关系的情况下,摈弃了图表的大部分与财务信息不相关的信息,提升了图表特征的表征能力。由于不需要直接比较财务图表的像素点,避免了被财务图表的冗余信息所干扰,例如被财务图表的样式(柱状图、折线图、条形图等)所影响。可见,通过财务状况确定装置600,可以实现准确、快速、鲁棒性强、自动化程度高的企业财务状况确定方法。
图7图示了示例系统700,其包括代表可以实现本文描述的各种方法的一个或多个系统和/或设备的示例计算设备710。计算设备710可以是例如服务提供商的服务器、与服务器相关联的设备、片上系统、和/或任何其它合适的计算设备或计算系统。上面参照图6描述的财务状况确定装置600可以采取计算设备710的形式。替换地,财务状况确定装置600可以以应用716的形式被实现为计算机程序。
如图示的示例计算设备710包括彼此通信耦合的处理系统711、一个或多个计算机可读介质712以及一个或多个I/O接口713。尽管未示出,但是计算设备710还可以包括系统总线或其他数据和命令传送系统,其将各种组件彼此耦合。系统总线可以包括不同总线结构的任何一个或组合,总线结构诸如存储器总线或存储器控制器、外围总线、通用串行总线、和/或利用各种总线架构中的任何一种的处理器或局部总线。还构思了各种其他示例,诸如控制和数据线。
处理系统711代表使用硬件执行一个或多个操作的功能。因此,处理系统711被图示为包括可被配置成处理器、功能块等的硬件元件714。这可以包括在硬件中实现为专用集成电路或使用一个或多个半导体形成的其它逻辑器件。硬件元件714不受其形成的材料或其中采用的处理机构的限制。例如,处理器可以由(多个)半导体和/或晶体管(例如,电子集成电路(IC))组成。在这样的上下文中,处理器可执行指令可以是电子可执行指令。
计算机可读介质712被图示为包括存储器/存储装置716。存储器/存储装置716表示与一个或多个计算机可读介质相关联的存储器/存储容量。存储器/存储装置716可以包括易失性介质(诸如随机存取存储器(RAM))和/或非易失性介质(诸如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储装置716可以包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移动介质(例如,闪存、可移动硬盘驱动器、光盘等)。计算机可读介质712可以以下面进一步描述的各种其他方式进行配置。
一个或多个I/O接口713代表允许用户使用各种输入设备向计算设备710输入命令和信息并且可选地还允许使用各种输出设备将信息呈现给用户和/或其他组件或设备的功能。输入设备的示例包括键盘、光标控制设备(例如,鼠标)、麦克风(例如,用于语音输入)、扫描仪、触摸功能(例如,被配置成检测物理触摸的容性或其他传感器)、相机(例如,可以采用可见或不可见的波长(诸如红外频率)将不涉及触摸的运动检测为手势)等等。输出设备的示例包括显示设备、扬声器、打印机、网卡、触觉响应设备等。因此,计算设备710可以以下面进一步描述的各种方式进行配置以支持用户交互。
计算设备710还包括应用716。应用716可以例如是用于财务状况确定装置600的软件实例,并且与计算设备710中的其他元件相组合地实现本文描述的技术。
本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算设备执行上述各种可选实现方式中提供的财务状况确定方法。
本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。一般地,这些模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元素、组件、数据结构等。本文所使用的术语“模块”,“功能”和“组件”一般表示软件、固件、硬件或其组合。本文描述的技术的特征是与平台无关的,意味着这些技术可以在具有各种处理器的各种计算平台上实现。以及,本申请实施例中,术语“模块”或“单元”是指有预定功能的计算机程序或计算机程序的一部分,并与其他相关部分一起工作以实现预定目标,并且可以通过使用软件、硬件(如处理电路或存储器)或其组合来全部或部分实现。同样的,一个处理器(或多个处理器或存储器)可以用来实现一个或多个模块或单元。此外,每个模块或单元都可以是包含该模块或单元功能的整体模块或单元的一部分。
所描述的模块和技术的实现可以存储在某种形式的计算机可读介质上或者跨某种形式的计算机可读介质传输。计算机可读介质可以包括可由计算设备710访问的各种介质。作为示例而非限制,计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。
与单纯的信号传输、载波或信号本身相反,“计算机可读存储介质”是指能够持久存储信息的介质和/或设备,和/或有形的存储装置。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或以适用于存储信息(诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据)的方法或技术实现的存储设备之类的硬件。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字通用盘(DVD)或其他光学存储装置、硬盘、盒式磁带、磁带,磁盘存储装置或其他磁存储设备,或其他存储设备、有形介质或适于存储期望信息并可以由计算机访问的制品。
“计算机可读信号介质”是指被配置成诸如经由网络将指令发送到计算设备710的硬件的信号承载介质。信号介质典型地可以将计算机可读指令、数据结构、程序模块或其他数据体现在诸如载波、数据信号或其它传输机制的调制数据信号中。信号介质还包括任何信息传递介质。术语“调制数据信号”是指这样的信号,该信号的特征中的一个或多个被设置或改变,从而将信息编码到该信号中。作为示例而非限制,通信介质包括诸如有线网络或直接连线的有线介质以及诸如声、RF、红外和其它无线介质的无线介质。
如前,硬件元件714和计算机可读介质712代表以硬件形式实现的指令、模块、可编程器件逻辑和/或固定器件逻辑,其在一些实施例中可以用于实现本文描述的技术的至少一些方面。硬件元件可以包括集成电路或片上系统、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)以及硅中的其它实现或其他硬件设备的组件。在这种上下文中,硬件元件可以作为执行由硬件元件所体现的指令、模块和/或逻辑所定义的程序任务的处理设备,以及用于存储用于执行的指令的硬件设备,例如,先前描述的计算机可读存储介质。
前述的组合也可以用于实现本文的各种技术和模块。因此,可以将软件、硬件或程序模块和其它程序模块实现为在某种形式的计算机可读存储介质上和/或由一个或多个硬件元件714体现的一个或多个指令和/或逻辑。计算设备710可以被配置成实现与软件和/或硬件模块相对应的特定指令和/或功能。因此,例如通过使用处理系统的计算机可读存储介质和/或硬件元件714,可以至少部分地以硬件来实现将模块实现为可由计算设备710作为软件执行的模块。指令和/或功能可以由一个或多个制品(例如,一个或多个计算设备710和/或处理系统711)可执行/可操作以实现本文所述的技术、模块和示例。
在各种实施方式中,计算设备710可以采用各种不同的配置。例如,计算设备710可以被实现为包括个人计算机、台式计算机、多屏幕计算机、膝上型计算机、上网本等的计算机类设备。计算设备710还可以被实现为包括诸如移动电话、便携式音乐播放器、便携式游戏设备、平板计算机、多屏幕计算机等移动设备的移动装置类设备。计算设备710还可以实现为电视类设备,其包括具有或连接到休闲观看环境中的一般地较大屏幕的设备。这些设备包括电视、机顶盒、游戏机等。
本文描述的技术可以由计算设备710的这些各种配置来支持,并且不限于本文所描述的技术的具体示例。功能还可以通过使用分布式系统、诸如通过如下所述的平台722而在“云”720上全部或部分地实现。
云720包括和/或代表用于资源724的平台722。平台722抽象云720的硬件(例如,服务器)和软件资源的底层功能。资源724可以包括在远离计算设备710的服务器上执行计算机处理时可以使用的应用和/或数据。资源724还可以包括通过因特网和/或通过诸如蜂窝或Wi-Fi网络的订户网络提供的服务。
平台722可以抽象资源和功能以将计算设备710与其他计算设备连接。平台722还可以用于抽象资源的分级以提供遇到的对于经由平台722实现的资源724的需求的相应水平的分级。因此,在互连设备实施例中,本文描述的功能的实现可以分布在整个系统700内。例如,功能可以部分地在计算设备710上以及通过抽象云720的功能的平台722来实现。
应当理解,为清楚起见,参考不同的功能单元对本申请的实施例进行了描述。然而,将明显的是,在不偏离本申请的情况下,每个功能单元的功能性可以被实施在单个单元中、实施在多个单元中或作为其它功能单元的一部分被实施。例如,被说明成由单个单元执行的功能性可以由多个不同的单元来执行。因此,对特定功能单元的参考仅被视为对用于提供所描述的功能性的适当单元的参考,而不是表明严格的逻辑或物理结构或组织。因此,本申请可以被实施在单个单元中,或者可以在物理上和功能上被分布在不同的单元和电路之间。
尽管已经结合一些实施例描述了本申请,但是其不旨在被限于在本文中所阐述的特定形式。相反,本申请的范围仅由所附权利要求来限制。附加地,尽管单独的特征可以被包括在不同的权利要求中,但是这些可以可能地被有利地组合,并且包括在不同权利要求中不暗示特征的组合不是可行的和/或有利的。特征在权利要求中的次序不暗示特征必须以其工作的任何特定次序。此外,在权利要求中,词“包括”不排除其它元件,并且术语“一”或“一个”不排除多个。权利要求中的附图标记仅作为明确的例子被提供,不应该被解释为以任何方式限制权利要求的范围。
可以理解的是,在本申请的具体实施方式中,涉及到软件的测试用例等相关的数据。当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

Claims (15)

1.一种财务状况确定方法,其特征在于,所述方法包括:
获取财务对照组和目标财务图表,所述财务对照组包括对照财务图表以及其对应的财务状况,所述目标财务图表的横坐标轴和所述对照财务图表的横坐标轴表征相同类型的财务信息,所述目标财务图表的纵坐标轴和所述对照财务图表的纵坐标轴表征相同类型的财务信息;
对所述对照财务图表执行图表特征提取步骤组以提取所述对照财务图表的图表特征,图表特征用于表征财务图表的图表信息;
对所述目标财务图表执行图表特征提取步骤组以提取所述目标财务图表的图表特征;
比较所述对照财务图表的图表特征和所述目标财务图表的图表特征,确定所述对照财务图表的图表特征和所述目标财务图表的图表特征之间的相似度;以及,
响应于所述相似度大于或等于目标阈值,确定所述目标财务图表对应的财务状况与所述对照财务图表对应的财务状况相同;
其中,所述图表特征提取步骤组包括以下步骤:
利用第一卷积核依次对图表的多个部分的相邻像素点进行卷积运算,以得到分别与部分相邻像素点对应的卷积运算结果;
确定所述图表对应的特征图,所述特征图包含多个元素点,每个元素点与图表的部分相邻像素点对应,所述元素点的值是所述部分相邻像素点的卷积运算结果;
基于所述图表对应的特征图确定所述图表的图表特征。
2.根据权利要求1所述的方法,其特征在于,所述基于所述图表对应的特征图确定所述图表的图表特征包括:
从所述图表的特征图中提取第一特征,所述第一特征用于表征所述特征图的元素点的离散程度;
至少基于所述第一类特征确定所述图表的图表特征。
3.根据权利要求2所述的方法,其特征在于,所述从所述图表的特征图中提取第一特征包括:
确定所述特征图对应的元素序列,所述元素序列包含所述特征图的所有元素,且所述元素序列组以预定顺序将元素进行排列,所述元素在所述特征图中的位置和在元素序列中的位置之间满足等式:
k=N×(i-1)+j
其中,i、j分别表示所述元素在所述特征图中位于第i行、第j列,k表示所述元素在所述元素序列中排第k个,N是所述特征图中每行元素的数量;
针对所述元素序列的每个元素,确定其第一离散值,一个元素的第一离散值是所述一个元素的值与所述一个元素在所述元素序列的后一个元素的值之间的差值;
针对所述元素序列的每个元素,确定其第二离散值,一个元素的第二离散值是所述一个元素在所述元素序列的前一个元素的值与所述一个元素在所述元素序列的后一个元素的值之间的差值再除以二;
针对所述元素序列的每个元素,确定其综合离散值,一个元素的综合离散值是所述一个元素的第一离散值和第二离散值的平均值;以及,
确定所述特征图的第一特征,所述第一特征是所述元素序列的所有元素的综合离散值的平均数。
4.根据权利要求2所述的方法,其特征在于,所述基于所述图表对应的特征图确定所述图表的图表特征进一步包括:从所述图表的特征图中提取第二特征,所述第二特征用于表征所述特征图的边缘信息;
所述至少基于所述第一特征确定所述图表的图表特征包括:至少基于所述第一特征和所述第二特征确定所述图表的图表特征。
5.根据权利要求4所述的方法,其特征在于,所述从所述图表的特征图中提取第二特征包括:
针对所述特征图的每个元素,确定其横向变化值,一个元素的横向变化值等于其在特征图的横轴方向上的下一个元素的值与上一个元素的值之间的差值;
针对所述特征图的每个元素,确定其纵向变化值,一个元素的纵向变化值等于其在特征图的纵轴方向上的下一个元素的值与上一个元素的值之间的差值;
根据所述特征图的所有元素的横向变化值和纵向变化值确定所述特征图的第二特征。
6.根据权利要求4所述的方法,其特征在于,所述基于所述图表对应的特征图确定所述图表的图表特征进一步包括:从所述图表的特征图中提取第三特征,所述第三特征用于表征图表的异常点信息;
所述至少基于所述第一特征和所述第二特征确定所述图表的图表特征包括:至少基于所述第一特征、所述第二特征和所述第三特征确定所述图表的图表特征。
7.根据权利要求6所述的方法,其特征在于,所述从所述图表的特征图中提取第三特征包括:
确定所述特征图对应的元素集,所述元素集包含所述特征图中的所有元素点;
确定元素集中每个元素的异常分数,所述异常分数用于表征元素是异常点的可能性;
将元素集中所有元素的异常分数的平均数确定为所述特征图的第三特征。
8.根据权利要求7所述的方法,其特征在于,所述确定元素集中每个元素的异常分数包括:
确定初始数值区间,所述初始数值区间是一个连续的数值区间,且所述元素集的每个元素的元素值都处于所述初始数值区间内;
对所述初始数值区间进行N次分段,得到M个目标子数值段,每个目标子数值段仅能包含一个元素值,每个目标子数值段具有一个分段标签和对应的元素值,分段标签的值表明从初始数值区间得到该目标子数值段所经过的分段次数;
将每个元素值与能包含所述元素值的目标子数值段的分段标签相关联;
根据与元素值关联的分段标签确定每个元素值的异常分数,所述异常分数和分段标签满足等式:
c(n)=2H(n-1)-2(n-1)/n
H(k)=lnk+ξ
其中,p表示元素点,n是元素集中的元素点的总数,Q是元素点关联的分段标签,s是元素点的异常分数,ξ是欧拉常数。
9.根据权利要求7所述的方法,其特征在于,所述基于所述图表对应的特征图确定所述图表的图表特征进一步包括:从所述图表的特征图中提取第四特征,所述第四特征用于表征图表的分布信息;
所述至少基于所述第一特征、所述第二特征和所述第三特征确定所述图表的图表特征包括:至少基于所述第一特征、所述第二特征、所述第三特征和所述第四特征确定所述图表的图表特征。
10.根据权利要求9所述的方法,其特征在于,所述从所述图表的特征图中提取第四特征包括:
确定所述特征图的峰度值,所述峰度值满足等式:
其中,n是元素集中的元素点的总数,i是小于或等于n的正整数,pi表示第i个元素点的元素值,表示所有元素点的元素值的平均数,K是峰度值;
确定所述特征图的偏态系数,所述偏态系数满足等式:
其中,P是偏态系数,xi是第i个元素点在特征图中的横坐标,表示所有元素点的横坐标的平均数,σ是所有元素点的横坐标的均方差;
根据所述特征图的峰度值和偏态系数确定所述特征图的第四特征。
11.根据权利要求9所述的方法,其特征在于,所述至少基于所述第一特征、所述第二特征、所述第三特征和所述第四特征确定所述图表的图表特征包括:
获取第一权重、第二权重、第三权重和第四权重;
确定所述图表的图表特征,所述图表特征满足等式:
T=α1×t12×t23×t34×t4
其中,T是图表特征,α1、α2、α3、α4分别是第一权重、第二权重、第三权重和第四权重,t1、t2、t3、t4分别是第一特征、第二特征、第三特征和第四特征。
12.一种财务状况确定装置,其特征在于,所述财务状况确定装置包括:
获取模块,其被配置成获取财务对照组和目标财务图表,所述财务对照组包括对照财务图表以及其对应的财务状况,所述目标财务图表的横坐标轴和所述对照财务图表的横坐标轴表征相同类型的财务信息,所述目标财务图表的纵坐标轴和所述对照财务图表的纵坐标轴表征相同类型的财务信息;
提取模块,其被配置成对所述对照财务图表执行图表特征提取步骤组以提取所述对照财务图表的图表特征,图表特征用于表征财务图表的图表信息;以及,所述提取模块被进一步配置成对所述目标财务图表执行图表特征提取步骤组以提取所述目标财务图表的图表特征;
比较模块,其被配置成比较所述对照财务图表的图表特征和所述目标财务图表的图表特征,确定所述对照财务图表的图表特征和所述目标财务图表的图表特征之间的相似度;以及,
确定模块,其被配置成响应于所述相似度大于或等于目标阈值,确定所述目标财务图表对应的财务状况与所述对照财务图表对应的财务状况相同;
其中,所述图表特征提取步骤组包括以下步骤:
利用第一卷积核依次对图表的多个部分的相邻像素点进行卷积运算,以得到分别与部分相邻像素点对应的卷积运算结果;
确定所述图表对应的特征图,所述特征图包含多个元素点,每个元素点与图表的部分相邻像素点对应,所述元素点的值是所述部分相邻像素点的卷积运算结果;
基于所述图表对应的特征图确定所述图表的图表特征。
13.一种计算设备,包括:
存储器,其被配置成存储计算机可执行指令;以及
处理器,其被配置成当所述计算机可执行指令被所述处理器执行时执行根据权利要求1-11中任一项所述的方法。
14.一种计算机可读存储介质,其存储有计算机可执行指令,所述计算机可执行指令在被执行时实现根据权利要求1-11中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至11中任一项所述的方法的步骤。
CN202410054745.XA 2024-01-15 2024-01-15 财务状况确定方法、装置及计算设备 Pending CN117876137A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410054745.XA CN117876137A (zh) 2024-01-15 2024-01-15 财务状况确定方法、装置及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410054745.XA CN117876137A (zh) 2024-01-15 2024-01-15 财务状况确定方法、装置及计算设备

Publications (1)

Publication Number Publication Date
CN117876137A true CN117876137A (zh) 2024-04-12

Family

ID=90591582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410054745.XA Pending CN117876137A (zh) 2024-01-15 2024-01-15 财务状况确定方法、装置及计算设备

Country Status (1)

Country Link
CN (1) CN117876137A (zh)

Similar Documents

Publication Publication Date Title
US11475143B2 (en) Sensitive data classification
CN110443692B (zh) 企业信贷审核方法、装置、设备及计算机可读存储介质
US11190562B2 (en) Generic event stream processing for machine learning
CN105426356B (zh) 一种目标信息识别方法和装置
CN112863683B (zh) 基于人工智能的病历质控方法、装置、计算机设备及存储介质
Singh et al. A study of moment based features on handwritten digit recognition
CN112861662B (zh) 基于人脸和交互文本的目标对象行为预测方法及相关设备
Zhang et al. To be forgotten or to be fair: Unveiling fairness implications of machine unlearning methods
CN114282258A (zh) 截屏数据脱敏方法、装置、计算机设备及存储介质
US11398101B2 (en) Item validation and image evaluation system
US11755958B1 (en) Systems and methods for detecting cryptocurrency wallet artifacts in a file system
CN112149413A (zh) 基于神经网络识别互联网网站所属业态的方法、装置以及计算机可读存储介质
CN113259369B (zh) 一种基于机器学习成员推断攻击的数据集认证方法及系统
WO2022142032A1 (zh) 手写签名校验方法、装置、计算机设备及存储介质
CN117876137A (zh) 财务状况确定方法、装置及计算设备
Luo et al. Research on Face Local Attribute Detection Method Based on Improved SSD Network Structure
Svabova et al. Analysis of Predictors in Bankruptcy Prediction Models for Slovak Companies
CN117910648A (zh) 企业违约预测方法、装置及计算设备
CN116433387A (zh) 风险预测方法、装置、计算设备及可读存储介质
CN117421669A (zh) 扫描验真网页识别方法、装置、计算机设备和存储介质
CN117541885A (zh) 样本数据处理方法、装置、存储介质和系统
CN115705412A (zh) 对象识别方法、装置、计算设备和存储介质
CN117541884A (zh) 样本数据处理方法、装置、存储介质和系统
CN117370817A (zh) 数据处理方法、装置、设备、介质和程序产品
CN117056628A (zh) 一种数据展示方法、装置、设备及其存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination