CN116245670B - 基于双标签模型处理财税数据的方法、装置、介质和设备 - Google Patents
基于双标签模型处理财税数据的方法、装置、介质和设备 Download PDFInfo
- Publication number
- CN116245670B CN116245670B CN202310530162.5A CN202310530162A CN116245670B CN 116245670 B CN116245670 B CN 116245670B CN 202310530162 A CN202310530162 A CN 202310530162A CN 116245670 B CN116245670 B CN 116245670B
- Authority
- CN
- China
- Prior art keywords
- data
- financial
- enterprise
- tax
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/123—Tax preparation or submission
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种基于双标签模型处理财税数据的方法、装置、介质和设备,其中的方法包括:获取税务数据,所述税务数据包括第一特征;获取财务数据,所述财务数据带有第二特征从动态的所述财务数据中提取动态标签;基于所述固定标签和所述动态标签,通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,并通过对所述动态标签进行分解得到所述输入的特定企业相匹配的企业模型标签;将所述企业模型标签输入所述双标签预测模型,并接收从所述双标签预测模型中输出的财税数据分析结果。本发明能够从发票流和数据流的角度实现各类涉税数据和财务数据的互联互通、关联匹配、比对分析和风险推送。
Description
技术领域
本发明涉及信息审计技术领域,尤其涉及一种基于双标签模型处理财税数据的方法、装置、介质和设备。
背景技术
财源建设工程是以推动高质量发展为主题,以改革创新为基本动力,以政务数据融合共享应用为抓手,以技术支撑业务协同,使用财税政策和市场手段,引导产业高质量发展,提升产业税收贡献,优化财源结构,增强财政收入内生动力。
中国系统数据创新BU联合部委行业部,基于客户在财源税源建设上的难点、痛点,利用全栈大数据专业技术、AI中台、知识图谱和财源税源分析指标体系,构建财税综合治理新模式,助力财源涵养、税源增收。
而传统企业财务还停留在记账算账的初期阶段,传统审计也还停留在查账核帐、事后算账的阶段。即使是计算机辅助审计,如各单位的会计电算化系统,其也仅仅是将审计过程中的凭证、信息等数据化,且仅涉及到单个企业的历史数据,造成信息孤岛,咨询服务都是一次性的,每次都需重新了解各企业的情况,且无法对相关企业间的数据、行业动数据等进行统筹利用。为了应对越来越严峻的市场挑战,亟待通过技术手段对企业财务的海量数据进行挖掘和分析运用,增强企业的数据利用效率及市场竞争力,而且,目前业内对企业财源数据的处理,无法与根据以“数”强财相关政策要求相结合,对于如何厘清财源税源,从相关财源数据中得到纳税人缴费人的精细化财税数据分析,是目前业内亟需解决的问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明的目的在于提出一种基于双标签模型处理财税数据的方法、装置、介质和设备,以解决目前对企业财税相关信息不对称导致的税源流失问题。
基于上述目的,本发明提供了一种基于双标签模型处理财税数据的方法,所述方法包括:
获取税务数据,所述税务数据包括第一特征,所述第一特征为与所述税务数据所属部门属性相关的部门特征,且根据所述第一特征,从所述税务数据中提取固定标签;
获取财务数据,所述财务数据带有第二特征,所述第二特征为与所述财务数据所属企业的企业属性相关的企业特征,所属企业不同时,所述第二特征是动态变化的,所述财务数据也是动态变化的,且根据动态变化的所述第二特征,从动态的所述财务数据中提取动态标签;
基于所述固定标签和所述动态标签,通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,并通过对所述动态标签进行分解得到所述输入的特定企业相匹配的企业模型标签;
将所述企业模型标签输入所述双标签预测模型,并接收从所述双标签预测模型中输出的财税数据分析结果,所述财税数据分析结果包括:
以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果。
结合上述说明本发明另一可能的实施方式中,述的基于双标签模型处理财税数据的方法,其特征在于,所述方法还包括:
基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练,以得到若干个双标签预测模型;
在所述服务器以线上服务的方式部署所述若干个双标签预测模型;
此时,所述通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,包括:当接收到输入的特定企业时,根据该特定企业带有第一特征和第二特征的双标签,从所述线上服务获取对应的双标签预测模型,将所述输入的特定企业的带有第二特征的财务数据输入到所述双标签预测模型,以得到与所述输入的特定企业发票流为主导的财务分析结果。
结合上述说明本发明另一可能的实施方式中,所述方法还包括:
根据所述第一特征,查询与所述第一特征相对应的部门政策,将所述部门政策输入到所述若干个双标签预测模型中;
当接收到输入的特定企业时,获取所述部门政策中的减税降费计算方式,在将所述企业模型标签输入到对应的双标签预测模型时,结合所述减税降费计算方式,输出所述财税数据分析结果。
结合上述说明本发明另一可能的实施方式中,所述方法还包括:
所述基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练之前,还包括:
利用现有的税率标注数据对双标签预测模型进行预训练,并通过预训练解算出所述双标签预测模型的权重参数。
结合上述说明本发明另一可能的实施方式中,所述方法还包括:
将所述财税数据分析结果以符合用户定制化需求的可视化方式输出。
结合上述说明本发明另一可能的实施方式中,所述方法还包括:
通过大数据系统采集与财务数据和税务数据相关的辅助动态数据,结合所述特定企业输入的静态财税数据,分别从发票流和数据流进行分析,以得到所述特定企业的财税数据分析结果。
结合上述说明本发明另一可能的实施方式中,所述第一特征基于税务文本的结构化信息抽取得到。
第二方面,本发明还提供了一种基于双标签模型处理财税数据的装置,所述装置包括:
第一特征模块,用于获取税务数据,所述税务数据包括第一特征,所述第一特征为与所述税务数据所属部门属性相关的部门特征,且根据所述第一特征,从所述税务数据中提取固定标签;
第二特征模块,用于获取财务数据,所述财务数据带有第二特征,所述第二特征为与所述财务数据所属企业的企业属性相关的企业特征,所属企业不同时,所述第二特征是动态变化的,所述财务数据也是动态变化的,且根据动态变化的所述第二特征,从动态的所述财务数据中提取动态标签;
分解模块,用于基于所述固定标签和所述动态标签,通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,并通过对所述动态标签进行分解得到所述输入的特定企业相匹配的企业模型标签;
输出模块,用于将所述企业模型标签输入所述双标签预测模型,并接收从所述双标签预测模型中输出的财税数据分析结果,所述财税数据分析结果包括:
以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果。
第三方面,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上所述的基于双标签模型处理财税数据的方法。
第四方面,本发明还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机上述的基于双标签模型处理财税数据的方法。
从上面所述可以看出,本发明提供的基于双标签模型处理财税数据的方法、装置、设备和介质,从财税数据中提取出政府下属部门的部门特征和企业特征,预建立若干个双标签预测模型,从不同的数据流对企业财税画像进行刻画,实现了各类涉税数据的互联互通、关联匹配、比对分析和风险推送,从而增补税收部门对纳税人资金流计算评估手段,使关地方上的财税收入稳步增加,提高征管工作效率。
附图说明
为了更清楚地说明本发明或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于双标签模型处理财税数据的方法的基本流程示意图;
图2为本发明实施例基于双标签模型处理财税数据的方法的数据流向基本流程示意图;
图3为本发明实施例基于双标签模型处理财税数据的方法的模型部署示意图;
图4为本发明实施例基于双标签模型处理财税数据的装置的基本构成示意图;
图5为本发明示例性实施例的电子设备的基本结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本发明涉及一种基于双标签模型处理财税数据的方法,其主要运用于需要对财税数据进行评估的场景中,其基本思想是:将财税数据分为政府下属部门的部门特征和企业特征,通过其对应的固定标签和动态标签方建立若干个双标签预测模型,例如“工商-酒店预测模型”“消防-服装店预测模型”“税务-民宿预测模型”等,能够从不同的维度对部门及企业的财税数据进行画像,实现了各类涉税数据的互联互通、关联匹配、比对分析和风险推送,能够查找“跑、冒、滴、漏”的税费源,强力增加税收收入,并且能够通过数字展示税收详细,全面对财税数据进行分析。
并且,由于企业类型的财务数据与部门类型的税务数据之间建立了双标签的相互依赖关系,并进而转化形成了特定类型的双标签预测模型,专门针对于某一种企业类型的财务数据,依靠从部门得到的发票流的计算方式,结合从企业得到的数据流的计算方式,二者综合评估,实现从多维度进行财税分析,可以从根本上解决由于部门政策不对称导致的财税流失问题。
本实施例可适用于带有双标签预测模型的服务器以进行多维度财税数据的处理的情况中,该方法可以由服务器的控制装置来执行,其中该装置可以由智能多分类多标签模型的软件和/或硬件来实现,一般地可集成于服务器中,或者终端中的中心控制模块来控制,针对于本发明的方法,本发明还建立了部门和企业之间的数据共享平台,依托部门的行政数据资源,对该部门下属的所有类型的企业的报表数据进行分析,以得到双标签预测模型的双流分析效果,如图1所示,为本发明的基于双标签模型处理财税数据的方法的基本流程示意图,所述方法具体包括如下步骤:
在步骤110中,获取税务数据,所述税务数据包括第一特征,所述第一特征为与所述税务数据所属部门属性相关的部门特征,且根据所述第一特征,从所述税务数据中提取固定标签;
财税数据的来源类别差异很大,结合图2所示,为本发明示例性实施例的方法的常见流程示意图,其包括了两个数据流类型的数据的流向示意,例如常见的三大类税务数据类型的数据流向,以及企业类型的账务数据流程,其中的税务类型涉及的部门类型可能包括:行政部门类型、税务部门类型和非直属部门类型,其中的行政部门类型可能包括各类局级单位,每一级的局级单位其统计的财税数据类型均可能有所不同,例如自然资源局涉及的税务数据为定义的资源税、土地增值税、环境保护税,税务部门类型涉及的财税数据类型可能为进出口税、契税及房产税等;非直属部门涉及的财税数据类型可能包括被定义的水务类、燃气类、烟草类的税务数据。
针对于不同类型的财税数据,分别设定对应的第一采集终端对其进行采集,并将其归类为税务数据,该税务数据带有第一特征,该第一特征为其部门属性,对应地,在本发明示例性实施例的一种可行的实施方式中资源税、土地增值税、环境保护税所对应的数据表现形式可为.zysbl1、.tdzzsbl1、.hjbhsbl1;进出口税、契税、房产税的表现形式可为.jcksbl2、.qsbl2、.fcsbl2;水务类、燃气类、烟草类对应的税务数据的表现形式可为swbl3、.rqbl3、.ycbl3;其中的“bl1”、“bl2”、“bl3”等为第一特征,体现的是部门特性,而“bl3”后面的数据“3”表示所属部门属性下的财税数据类别或序号,例如环保部门、公安部门、消防部门等,从所述第一特征中可提取“bl”作为第一财务数据的固定标签。
本发明示例性实施例的实施方式中,对于设定的第一采集终端的具体表现形式并不做限定,以其能够获取对应属性的财税数据即可,例如内置爬取程序的硬件载体。
在步骤120中,获取财务数据,所述财务数据带有第二特征,所述第二特征为与所述财务数据所属企业的企业属性相关的企业特征,所属企业不同时,所述第二特征是动态变化的,所述财务数据也是动态变化的,且根据动态变化的所述第二特征,从动态的所述财务数据中提取动态标签;
所述财务数据是与企业类型相关的企业相应属性的财务数据,根据企业性质的不同,所述财务数据的种类亦会出现变化,当表现为数据形态时,当将不同企业类型的财务数据进行归集并统一处理时,此时的财务数据所体现出的第二特征是动态变化的,虽然是动态变化的,但其动态范围是可预知的,具体如下:
本发明示例性实施例的一种可行的实施方式中,结合图2所示,例如住宿类型企业涉及的财税数据类型可能包括营业税、个人所得税、企业所得税及消费税等,此时其营业税、个人所得税、企业所得税及消费税的表现形式可为.yyszs1、.grsds zs1、.qysdszs1、.xfs zs1,此时其第二特征可以为“zs1”。
本发明示例性实施例的另一种可行的实施方式中,例如采矿类型企业涉及的财税数据类型可能包括许可信息、环评信息等,此时其许可信息、环评信息的表现形式可为.xkzs2、.hp zs2,此时其第二特征可以为“zs2”。
本发明示例性实施例的再一种可行的实施方式中,例如文娱类型企业涉及的财税数据类型可能包括场所信息、土地使用信息等,此时其场所信息、土地使用信息的数据表现形式可为.csxxzs3、.tdsyzs3,此时其第二特征可以为“zs3”。
设定的第二采集终端,可与相关部门合作,获取该部门的数据系统的数据接口,通过该种接入方式,以从中获取带有第二特征的财务数据。
不同企业的财税数据是变化的,同一企业在不同时段内表现出的财税数据也是变化的,因此,体现在数据上,其提取出的第二特征是动态的,不同类型的企业的财税数据完全不同,因此需要对其标签作出区别,示例性的,上述的动态标签可以为“zs1” 、“zs2” 、“zs3”…。
本发明示例性实施例的实施方式中,对于设定的第二采集终端的具体表现形式并不做限定,以其能够获取对应属性的财税数据即可,例如内置爬取程序的硬件载体。
在步骤130中,基于所述固定标签和所述动态标签,通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,并通过对所述动态标签进行分解得到所述输入的特定企业相匹配的企业模型标签;
服务器预设的辅助分配策略,用于根据所述相互依赖关系对企业所对应的部门定性,以从多个双标签预测模型中查找并确定最准确且适用的双标签预测模型,并通过向服务器请求的方式由服务器进行辅助分配。
当面对大量的企业数据时,所述动态标签是动态的,当面对单一企业的财税数据时,所述动态标签则可以分解得到与输入的特定企业相匹配的企业模型标签,例如从动态标签 “zs1” 、“zs2” 、“zs3”与输入的特定企业类型为酒店,则可以从中选取“zs2”作为该酒店的企业模型标签。
本发明示例性实施例的一种可行的实施方式中,在一定的硬件载体中,与服务器建立通讯连接,后从服务器获取预设的辅助分配策略,并在与硬件载体连接的终端中获取输入的特定企业相匹配的双标签预测模型,并通过双标签预测模型对所述特定企业的财税数据进行分析,这一过程包括:
所述双标签预测模型,对所述固定标签和所述动态标签之间建立相互依赖关系,这种相互依赖关系通常是并通过这种相互依赖关系进行建模,以灵活地获取对所述标签空间中的拓扑结构,并将拓扑结构的关系表示为所述相互依赖关系的词嵌入向量,当采用卷积神经网络将词嵌入向量映射到一组互相依赖的分类器上,这些分类器又可以进一步地对所述第一特征和第二特征进行分类。
在步骤140中,将所述企业模型标签输入所述双标签预测模型,并接收从所述双标签预测模型中输出的财税数据分析结果,所述财税数据分析结果包括:
以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果。
以发票流主导的财税数据分析结果,对于于所述双标签预测模型以第一特征和固定标签为传递方式输出,以数据流为主导的财税数据分析结果则对应于所述双标签预测模型以第二特征和动态标签为数据传递时输出的分析结果。
基于上述分类相互依赖关系,可通过对所述固定标签和所述动态标签设计全新的标签相关系数矩阵实现,利用卷积神经网络对标签相关性进行建模,让所述第一特征和所述第二特征能够从所述标签相关系数矩阵中获取与所述税务数据和所述财务数据相对应的处理方式,以期得到所述税务数据和所述财务数据在卷积神经网络的各层传递后的财税数据分析结果,包括以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果。
在本发明示例性实施例的一种实施方式中,本发明的方法的重点和核心在于设计了通过所述相互依赖关系之间的信息传播而更新的标签相关系数矩阵,具体地:
所述双标签预测模型采用的卷积神经网络的目标之一是学习一个相互依赖关系的函数,借助上述相互依赖关系的函数f(., .)的堆叠,可以实现双标签预测模型的多个卷积层并实现对相互依赖关系之间的复杂关系的建模,其输出的是对每一个相互依赖关系的实际的财税数据的预测结果。
在本发明示例性实施例的一种可行的实施方式中,所述方法还包括通过线上审计的方式实现,以适配于各种不同类型的企业通过线上服务自行审计并对财税数据进行分析,这一过程包括如下步骤:
在步骤210中,基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练,以得到若干个双标签预测模型;
本发明示例性实施例的实施方式中,针对于每一种固定的双标签预测模型,会建立固定标签和动态标签之间的映射属性,使其关联,以期在遇到相同的映射属性时,能够直接从预设的服务器中调用对应的双标签预测模型对第二特征所属的企业相关财税数据进行分析,以得到包括了以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果。
训练过程为对税务数据和财务数据的样本进行训练的常规过程,此处不再赘述。
在步骤220中,在所述服务器以线上服务的方式部署所述若干个双标签预测模型;
在步骤230中,当接收到输入的特定企业时,根据该特定企业带有第一特征和第二特征的双标签,从所述线上服务获取对应的双标签预测模型,将所述输入的特定企业的带有第二特征的财务数据输入到所述双标签预测模型,以得到与所述输入的特定企业发票流为主导的财务分析结果。
部署线上服务的方式包括:将前期训练好的双标签预测模型部署成线上服务,该线上服务将双标签预测模型的分析结果传至应用了该程序的终端中,并且将实时交互日志上传至服务器后台,以对本次分析过程及结果进行记录,生成二次训练所用的新样本训练内容,以对服务器中保存的双标签预测模型实时更新,确保其分析双流数据的准确性。
双标签的方式,对不同类型的财税数据进行分流以及结合性地分析,使得分析结果的分析方式都是基于模型的设定进行的双流分析,运用灵活,能够适用于不同分析条件的分析。
在本发明示例性实施例的一种可行的实施方式中,所述方法还包括:
根据所述第一特征,查询与所述第一特征相对应的部门政策,将所述部门政策输入到所述若干个双标签预测模型中;
当接收到输入的特定企业时,获取所述部门政策中的减税降费计算方式,在将所述企业模型标签输入到所述对应的双标签预测模型时,结合所述减税降费计算方式,输出所述财税数据分析结果。
这一过程中,由于税务数据所对应的部门政策原因导致其对应的税务数据的计算方式可能出现差别,则此时对双标签预测模型的数据源设定作出灵活改变,以根据部门政策灵活调整对税务数据的计算方式,由于分析结果都是基于双标签预测模型的设定进行分析,因此,分析结果能够及时跟上政策的变化,且通过以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果的双流数据表现形式加以表现。
在本发明示例性实施例的一种可行的实施方式中,结合图3所示,为本发明的方法处理可视化处理流程示意图,所述方法还包括所述方法还包括:
将所述财税数据分析结果以符合用户定制化需求的可视化方式输出。
涉及的计算公式,原则上包括与部门政策相对应的主要税种,以分析税种种类、增值税行业、增值税品目和契税交易内容,根据选择好的动态标签内容获取申报数据和税种的税率。
分析结果中也包括了各类对应于经济指数的增幅、占比、结构、行业集中度以及变化趋势等可视化内容,以方便为部门政策所属的决策者提供精准的数据参考。
第一特征所属的三类部门以及第二特征所属的企业的动态标签建立可视化过程参考图2所示。
在本发明示例性实施例的一种可行的实施方式中,所述方法还包括所述方法还包括:
所述基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练之前,还包括:
利用现有的税率标注数据对模型进行预训练,并通过预训练解算出所述双标签预测模型的权重参数。
财税数据最重要的一个参考参数即是税率,税率对其分析结果所涉及到的计算公式也很重要,在本步骤中,通过现有的税率标注对双标签预测模型进行预训练,能够预训练解算出所述双标签预测模型的权重参数并对双标签预测模型加以调整,将部门政策出现变化时,将新的税率标注加入到预训练过程中重新调整其权重参数,以使得每一所述双标签预测模型预测出的分析结果能够及时调整,跟进时代步伐。
在本发明示例性实施例的一种可行的实施方式中,所述方法还包括所述第一特征为基于税务文本的结构化信息抽取得到。
由于税务数据和财务数据的非结构化,因此,对其转化成结构化数据非常必要,当形成税务文本后,通过转化后形成的结构化信息的实体标注,能够使不同类型的部门能够采用统一的标准转化形成双标签预测模型
在本发明示例性实施例的一种可行的实施方式中,所述方法还包括:
通过大数据系统采集与财税相关的辅助动态数据,结合所述特定企业输入的静态财税数据,分别从发票流和数据流进行分析,以得到所述特定企业的财税数据分析结果。
需要说明的是,本发明实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本发明实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本发明的一些实施例进行了描述。在一些情况下,上述记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本发明还提供了一种基于双标签模型处理财税数据的装置。参考图4,本发明示例性实施例的一种基于双标签模型处理财税数据的装置,所述装置包括:
第一特征模块401,用于用于获取税务数据,所述税务数据包括第一特征,所述第一特征为与所述税务数据所属部门属性相关的部门特征,且根据所述第一特征,从所述税务数据中提取固定标签;
第二特征模块402,用于用于获取财务数据,所述财务数据带有第二特征,所述第二特征为与所述财务数据所属企业的企业属性相关的企业特征,所属企业不同时,所述第二特征是动态变化的,所述财务数据也是动态变化的,且根据动态变化的所述第二特征,从动态的所述财务数据中提取动态标签;
分解模块403,用于基于所述固定标签和所述动态标签,通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,并通过对所述动态标签进行分解得到所述输入的特定企业相匹配的企业模型标签;
输出模块404,用于将所述企业模型标签输入所述双标签预测模型,并接收从所述双标签预测模型中输出的财税数据分析结果,所述财税数据分析结果包括:
以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果。
进一步地,所述装置还用于:基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练,以得到若干个双标签预测模型;
在所述服务器以线上服务的方式部署所述若干个双标签预测模型;
此时,所述通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,包括:当接收到输入的特定企业时,根据该特定企业带有第一特征和第二特征的双标签,从所述线上服务获取对应的双标签预测模型,将所述输入的特定企业的带有第二特征的财务数据输入到所述双标签预测模型,以得到与所述输入的特定企业发票流为主导的财务分析结果。
进一步地,所述装置用于:根据所述第一特征,查询与所述第一特征相对应的部门政策,将所述部门政策输入到所述若干个双标签预测模型中;
当接收到输入的特定企业时,获取所述部门政策中的减税降费计算方式,在将所述企业模型标签输入到对应的双标签预测模型时,结合所述减税降费计算方式,输出所述财税数据分析结果。
进一步地,所述装置用于:将所述财税数据分析结果以符合用户定制化需求的可视化方式输出。
在本发明示例性实施例的一种可行的实施方式中,所述装置还用于:
利用现有的税率标注数据对双标签预测模型进行预训练,并通过预训练解算出所述双标签预测模型的权重参数。
在本发明示例性实施例的一种可行的实施方式中,所述方法还包括
通过大数据系统采集与财务数据和税务数据相关的辅助动态数据,结合所述特定企业输入的静态财税数据,分别从发票流和数据流进行分析,以得到所述特定企业的财税数据分析结果。
为了描述的方便,描述以上基于双标签模型处理财税数据的装置时以功能分为各种模块分别描述。当然,在实施本发明时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的基于双标签模型处理财税数据的装置用于实现前述任一实施例中相应的基于双标签模型处理财税数据的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的基于双标签模型处理财税数据的方法。
图5示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图, 该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线 1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的基于双标签模型处理财税数据的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本发明还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的基于双标签模型处理财税数据的方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的基于双标签模型处理财税数据的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明的范围被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于双标签模型处理财税数据的方法,其特征在于,所述方法包括:
获取税务数据,所述税务数据包括第一特征,所述第一特征为与所述税务数据所属部门属性相关的部门特征,且根据所述第一特征,从所述税务数据中提取固定标签;
获取财务数据,所述财务数据带有第二特征,所述第二特征为与所述财务数据所属企业的企业属性相关的企业特征,所属企业不同时,所述第二特征是动态变化的,所述财务数据也是动态变化的,且根据动态变化的所述第二特征,从动态的所述财务数据中提取动态标签;
基于所述固定标签和所述动态标签,通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,并通过对所述动态标签进行分解得到所述输入的特定企业相匹配的企业模型标签;
将所述企业模型标签输入所述双标签预测模型,并接收从所述双标签预测模型中输出的财税数据分析结果,所述财税数据分析结果包括:
以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果;
所述方法还包括:
基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练,以得到若干个双标签预测模型;
在所述服务器以线上服务的方式部署所述若干个双标签预测模型;
此时,所述通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,包括:当接收到输入的特定企业时,根据该特定企业带有第一特征和第二特征的双标签,从所述线上服务获取对应的双标签预测模型,将所述输入的特定企业的带有第二特征的财务数据输入到所述双标签预测模型,以得到与所述输入的特定企业发票流为主导的财务分析结果;
所述方法还包括:
根据所述第一特征,查询与所述第一特征相对应的部门政策,将所述部门政策输入到所述若干个双标签预测模型中;
当接收到输入的特定企业时,获取所述部门政策中的减税降费计算方式,在将所述企业模型标签输入到对应的双标签预测模型时,结合所述减税降费计算方式,输出所述财税数据分析结果;
所述方法还包括:
所述基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练之前,还包括:
利用现有的税率标注数据对双标签预测模型进行预训练,并通过预训练解算出所述双标签预测模型的权重参数。
2.根据权利要求1所述的基于双标签模型处理财税数据的方法,其特征在于,所述方法还包括:
将所述财税数据分析结果以符合用户定制化需求的可视化方式输出。
3.根据权利要求1所述的基于双标签模型处理财税数据的方法,其特征在于,所述方法还包括:
通过大数据系统采集与财务数据和税务数据相关的辅助动态数据,结合所述特定企业输入的静态财税数据,分别从发票流和数据流进行分析,以得到所述特定企业的财税数据分析结果。
4.根据权利要求1所述的基于双标签模型处理财税数据的方法,其特征在于,所述第一特征基于税务文本的结构化信息抽取得到。
5.一种基于双标签模型处理财税数据的装置,其特征在于,所述装置包括:
第一特征模块,用于获取税务数据,所述税务数据包括第一特征,所述第一特征为与所述税务数据所属部门属性相关的部门特征,且根据所述第一特征,从所述税务数据中提取固定标签;
第二特征模块,用于获取财务数据,所述财务数据带有第二特征,所述第二特征为与所述财务数据所属企业的企业属性相关的企业特征,所属企业不同时,所述第二特征是动态变化的,所述财务数据也是动态变化的,且根据动态变化的所述第二特征,从动态的所述财务数据中提取动态标签;
分解模块,用于基于所述固定标签和所述动态标签,通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,并通过对所述动态标签进行分解得到所述输入的特定企业相匹配的企业模型标签;
输出模块,用于将所述企业模型标签输入所述双标签预测模型,并接收从所述双标签预测模型中输出的财税数据分析结果,所述财税数据分析结果包括:
以发票流为主导的财务数据分析结果和以数据流为主导的税务数据分析结果;
所述装置还用于:
基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练,以得到若干个双标签预测模型;
在所述服务器以线上服务的方式部署所述若干个双标签预测模型;
此时,所述通过服务器预设的辅助分配策略获取与输入的特定企业相匹配的双标签预测模型,包括:当接收到输入的特定企业时,根据该特定企业带有第一特征和第二特征的双标签,从所述线上服务获取对应的双标签预测模型,将所述输入的特定企业的带有第二特征的财务数据输入到所述双标签预测模型,以得到与所述输入的特定企业发票流为主导的财务分析结果;
所述装置还用于:
根据所述第一特征,查询与所述第一特征相对应的部门政策,将所述部门政策输入到所述若干个双标签预测模型中;
当接收到输入的特定企业时,获取所述部门政策中的减税降费计算方式,在将所述企业模型标签输入到对应的双标签预测模型时,结合所述减税降费计算方式,输出所述财税数据分析结果;
所述装置还用于:
所述基于所述固定标签和所述动态标签对与所述第二特征所属的企业相关财税数据进行训练之前,还包括:
利用现有的税率标注数据对双标签预测模型进行预训练,并通过预训练解算出所述双标签预测模型的权重参数。
6.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至4任意一项所述的基于双标签模型处理财税数据的方法。
7.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行权利要求1至4任一所述的基于双标签模型处理财税数据的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310530162.5A CN116245670B (zh) | 2023-05-12 | 2023-05-12 | 基于双标签模型处理财税数据的方法、装置、介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310530162.5A CN116245670B (zh) | 2023-05-12 | 2023-05-12 | 基于双标签模型处理财税数据的方法、装置、介质和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116245670A CN116245670A (zh) | 2023-06-09 |
CN116245670B true CN116245670B (zh) | 2023-08-04 |
Family
ID=86633496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310530162.5A Active CN116245670B (zh) | 2023-05-12 | 2023-05-12 | 基于双标签模型处理财税数据的方法、装置、介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116245670B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116542801B (zh) * | 2023-07-07 | 2023-09-22 | 成都理工大学 | 一种财务数据分析方法及系统 |
CN117422573A (zh) * | 2023-10-30 | 2024-01-19 | 广州金财智链数字科技有限公司 | 基于动态神经网络的财税数据预测方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109242664B (zh) * | 2018-10-16 | 2021-03-16 | 西安交通大学 | 一种面向新设立企业的纳税风险预测方法 |
CN111861721A (zh) * | 2020-07-28 | 2020-10-30 | 山东浪潮商用系统有限公司 | 一种税收经济分析报告方法 |
WO2022221719A2 (en) * | 2021-04-16 | 2022-10-20 | Strong Force Vcn Portfolio 2019, Llc | Systems, methods, kits, and apparatuses for digital product network systems and biology-based value chain networks |
CN112529679A (zh) * | 2020-12-25 | 2021-03-19 | 深圳前海微众银行股份有限公司 | 企业授信模型的构建方法、装置、设备及可读存储介质 |
CN114048436A (zh) * | 2021-11-11 | 2022-02-15 | 北京道口金科科技有限公司 | 一种预测企业财务数据模型构建方法及构建装置 |
CN115205005A (zh) * | 2022-07-18 | 2022-10-18 | 北京合盛众泰管理咨询服务有限公司 | 一种基于大数据的税务信息分析系统及方法 |
CN115578167A (zh) * | 2022-08-01 | 2023-01-06 | 江苏新基健智能化科技有限公司 | 一种基于大数据的财税核算处理系统 |
CN115311029A (zh) * | 2022-08-01 | 2022-11-08 | 上海东普信息科技有限公司 | 用于提高处理效率的开票管理方法、装置、设备及存储介质 |
-
2023
- 2023-05-12 CN CN202310530162.5A patent/CN116245670B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN116245670A (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116245670B (zh) | 基于双标签模型处理财税数据的方法、装置、介质和设备 | |
US9304672B2 (en) | Representation of an interactive document as a graph of entities | |
EP4137961A1 (en) | Method and apparatus for executing automatic machine learning process, and device | |
Zhu et al. | A framework-based approach to utility big data analytics | |
US20120159312A1 (en) | Representation of an interactive document as a graph of entities | |
US11367008B2 (en) | Artificial intelligence techniques for improving efficiency | |
US20090259664A1 (en) | Infrastructure and Architecture for Development and Execution of Predictive Models | |
CN110196834A (zh) | 一种用于数据项、文件、数据库的对标方法和系统 | |
CN109947811A (zh) | 通用特征库生成方法及装置、存储介质、电子设备 | |
US20170300461A1 (en) | Representation of an Interactive Document as a Graph of Entities | |
US20190163726A1 (en) | Automatic equation transformation from text | |
Faroukhi et al. | A novel approach for big data monetization as a service | |
US20210349920A1 (en) | Method and apparatus for outputting information | |
Deng et al. | Computational operations research exchange (core): A cyber-infrastructure for analytics | |
CN117273968A (zh) | 一种跨业务线产品的会计凭证生成方法及其相关设备 | |
CN112199395A (zh) | 一种人工智能分析方法及系统 | |
Hellmanzik et al. | Towards a FAIR-ready data value chain for dataspaces | |
CN114493853A (zh) | 信用等级评价方法、装置、电子设备及存储介质 | |
US11669696B2 (en) | System and method for implementing an open digital rights language (ODRL) visualizer | |
Biju et al. | Comparative Analysis of selected big data analytics tools | |
CN113176873A (zh) | 用于信息管理的方法和装置、电子设备、及介质 | |
You et al. | Data encryption technology application in enterprise cost operation management based on cloud computing | |
CN111582648A (zh) | 用户策略生成方法、装置及电子设备 | |
Ahishakiye et al. | Comparative Analysis of Open source Business Intelligence tools for Crime Data Analytics | |
US20140019370A1 (en) | Transforming project management representations into business process representations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230713 Address after: Floor 4, No. 86, Minzhu Road, Baita District, Liaoyang City, Liaoning Province, 111000 Applicant after: Liaolian (Liaoning) Information Technology Co.,Ltd. Address before: No. 91, Zone 3, Dongzhuangzi Village, Hebei Town, Fangshan District, Beijing, 102400 Applicant before: Liaolian (Beijing) data technology development Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |