CN110517130A - 一种智能记账方法及其系统 - Google Patents
一种智能记账方法及其系统 Download PDFInfo
- Publication number
- CN110517130A CN110517130A CN201910831692.7A CN201910831692A CN110517130A CN 110517130 A CN110517130 A CN 110517130A CN 201910831692 A CN201910831692 A CN 201910831692A CN 110517130 A CN110517130 A CN 110517130A
- Authority
- CN
- China
- Prior art keywords
- intelligent
- sample
- accounting
- data
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Biomedical Technology (AREA)
- Technology Law (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种智能记账方法及其系统,包括:收集样本数据,建立样本库和会计项目映射,搭建深度学习智能记账模型,通过输入样本文件不断训练和修正,建立可以适用于当前企业的智能记账模型,通过智能记账模型自动完成报销单的会计项目分类。本发明有益效果:采用人工智能机器学习方法,从众多记账的历史数据中自行提炼记账规律,搭建智能记账模型,从而有效的提升财务系统记账的效率和准确性,减少财务人员的工作量。
Description
技术领域
本发明涉及一种智能记账方法及其系统,属于计算机技术领域。
背景技术
企业财务系统中,报销业务是一项重要的工作,当一笔费用发生后,企业人员拿报销单和发票报销时,财务人员需要根据报销单上的明细,判断该笔费用属于哪一类费用类型,该笔费用需要挂在什么会计科目下面,这就是当前普遍使用的人工财务记账方法,当企业规模扩大,发生的报销费用日趋庞大和复杂后,对财务记账人员来说,人工识别报销单所属会计科目的工作量大,准确度低,效率低下。
中国专利CN110097440A《一种数据处理方法和装置》公开了一种财务数据处理方法,通过获取业务流水数据和数据标识,并从业务流水数据中提取与数据标识对应的业务流水数据;确定能够生成业务流水数据对应资源信息的规则引擎;利用规则引擎对业务流水数据进行处理,生成业务流水数据对应的资源信息。但此专利公开的规则引擎是通过预先人工设置规则,通过规则的整体实现一对一的判断,即如果出现什么内容,就做什么判断的穷举式判断,此方法只能应对有限范围的信息做判断,即样本库中有则可支持,范围外则无法支持。当财务系统所需支持的场景不断扩充的情况下,其财务规则很难通过人工设计的面面俱到,比如原始信息中针对“笔记本”记为办公耗材费用,当报销出现“某电脑品牌笔记本”时,该方法就会将购置固定资产费用误认为办公耗材费用。
发明内容
为了解决上述技术问题,本发明提供一种智能记账方法及其系统,基于人工智能及机器自我学习的方法,从众多记账的历史数据中进行样本训练和学习,使机器能够明白并提炼记账规律,搭建智能记账模型,利用机器的智能化的适应性提升从而有效的提升财务系统记账的效率和准确性,减少财务人员的工作量。
本发明的技术方案一:
一种智能记账方法,包括如下步骤:
S1:收集样本数据,所述样本数据为用于记账用的费用单据数据。
S2:收集采购明细的商品名称库、票据种类列表、商品分类表、财务分类表,将所述各类知识库、列表、分类表建立判断标准库。
S3:标注所述样本数据的要素,建立样本库,所述特征包括:发票种类、费用部门、项目名称、财务短语、摘要短语、附件类别。
S4:构建智能记账模型,所述智能记账模型包括:输入端、智能记账神经网络、输出端,其中,所述智能记账神经网络进行样本数据的特征提取和特征映射,经过训练完成样本数据的识别。
S5:将所述样本库中的样本数据输入所述智能记账模型进行训练,获得所述智能记账模型输出的对所述样本数据所属会计账目的识别结果,针对识别结果错误的样本进行标注要素修正,修正后再次输入到所述智能记账模型进行训练,直至最终输出结果正确,得到可以进行自动分类的智能记账模型,将所述智能记账模型封装成智能记账模块,嵌入到会计记账主流程系统中。
S6:将待记账的费用单据数据输入到所述智能记账模块中,经过所述智能记账模块的处理,自动识别出所述费用单据数据所属的财务记账会计科目,将所述费用单据的费用发生额挂账在所属的会计科目上。
S4步骤中,所述智能记账模型的神经网络为Word2vec浅层神经网络和CNN卷积神经网络组合,通过所述Word2vec浅层神经网络计算所述费用单据数据中的词向量、度量词与词之间的相似性,通过所述CNN卷积神经网络提取数据进行分类。
S3步骤中,对样本数据进行样本标注映射,其中包括如下步骤:
S31:将所述样本数据中的费用单据数据,按照所述判断标准库中的分类,进行分类对应;
S32:对各个分类的样本数据标注要素;
S33:对所述经过标注要素的样本数据映射其所属会计科目,保存在样本库中。
S6步骤中,当所述智能记账模块的完成会计科目的分类识别,若发生对结果进行查证和纠正的触发处理,则将纠正结果反馈给所述智能记账模块,所述智能记账模块根据反馈执行修正程序。
本发明的技术方案二:
一种智能记账系统,包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行以下步骤:
S1:收集样本数据,所述样本数据为用于记账用的费用单据数据。
S2:收集采购明细的商品名称库、票据种类列表、商品分类表、财务分类表,将所述各类知识库、列表、分类表建立判断标准库。
S3:标注所述样本数据的要素,建立样本库,所述特征包括:发票种类、费用部门、项目名称、财务短语、摘要短语、附件类别。
S4:构建智能记账模型,所述智能记账模型包括:输入端、智能记账神经网络、输出端,其中,所述智能记账神经网络进行样本数据的特征提取和特征映射,经过训练完成样本数据的识别。
将所述样本库中的样本数据输入所述智能记账模型进行训练,获得所述智能记账模型输出的对所述样本数据所属会计账目的识别结果,针对识别结果错误的样本进行标注要素修正,修正后再次输入到所述智能记账模型进行训练,直至最终输出结果正确,得到可以进行自动分类的智能记账模型,将所述智能记账模型封装成智能记账模块,嵌入到会计记账主流程系统中。
S6:将待记账的费用单据数据输入到所述智能记账模块中,经过所述智能记账模块的处理,自动识别出所述费用单据数据所属的财务记账会计科目,将所述费用单据的费用发生额挂账在所属的会计科目上。
S4步骤中,所述智能记账模型的神经网络为Word2vec浅层神经网络和CNN卷积神经网络组合,通过所述Word2vec浅层神经网络计算所述费用单据数据中的词向量、度量词与词之间的相似性,通过所述CNN卷积神经网络提取数据进行分类。
S3步骤中,对样本数据进行样本标注映射,其中包括如下步骤:
S31:将所述样本数据中的费用单据数据,按照所述判断标准库中的分类,进行分类对应;
S32:对各个分类的样本数据标注要素;
S33:对所述经过标注要素的样本数据映射其所属会计科目,保存在样本库中。
S6步骤中,当所述智能记账模块的完成会计科目的分类识别,若发生对结果进行查证和纠正的触发处理,则将纠正结果反馈给所述智能记账模块,所述智能记账模块根据反馈执行修正程序。
本发明具有如下有益效果:
1、本发明的一种智能记账方法及其系统,通过设置判断标准库,细分样本要素分类,缩小识别映射的范围,使样本库的建立更加完善,利于神经网络自我学习;
2、本发明的一种智能记账方法及其系统,通过深度学习平台自我学习报销判断规则,自动推荐报销会计项目,记账速度快,正确性高。
附图说明
图1为本发明一种智能记账方法及其系统的流程示意图;
图2为本发明一种智能记账方法及其系统的一个实施例的样本标记示意图;
图3为本发明一种智能记账方法及其系统的一个实施例的流程示意图;
图4为本发明一种智能记账方法及其系统的一个实施例的商品分类图;
图5为本发明一种智能记账方法及其系统的一个实施例的场景分类图。
具体实施方式
下面结合附图和具体实施例来对本发明进行详细的说明。
实施例一
如图1所示,一种智能记账方法,包括如下步骤:
S1:收集样本数据,所述样本数据为用于记账用的费用单据数据。
费用单据数据已经经过影像拍摄和数据提取了,即已经从纸质转换为电子数据,转换过程不是本专利的重点,直接可以从现有财务OA流程中提取。
根据智能记账系统运用的单位不同,收集的样本数据也有不同,例如学校单位,样本数据包括书本,教辅资料,教学设备,科研项目等报销单数据,例如演艺团体,样本数据包括服装,道具,群演聘用等报销单数据。针对不同单位有针对性的收集样本数据,能够确保样本集的数据纯净性。
样本数据收集可直接从运营单位的财务系统中提取数据库,现有财务系统已经将报销单和发票进行电子化,表格化,直接提取数据库中的报销单数据,效率更高,数据更全面,而且因为已经电子化,报销单中的各个元素可以通过类别查找到,方便后续S3步骤进行标注。
对于没有建立电子财务系统的运营单位,需要事先将所有报销单据和发票进行电子化采集。
S2:收集采购明细的商品名称库、票据种类列表、商品分类表、财务分类表,将所述各类知识库、列表、分类表建立判断标准库。
判断标准库是用来辅助人工执行数据标注的,对于财务的记账流程和规则,还是沿用原有的模式,会计对于一笔费用判断属于哪一种科目分类,主要根据报销的发票、提报的金额、报销事由描述、以及提报人员所属的部门信息进行判断,除此之外,作为判断标准,会计还需要一些辅助知识来识别报销的内容,如采购明细的商品名称库、票据种类、标准的商品分类与财务分类的关系等内容。以上内容的数据收集得是否齐全将直接影响到智能记账模型判断的准确性和可适应的场景。
商品名称,是从采购系统中提取的,比如采购部某某年采购明细里包括,书籍,设备等等。
S3:标注所述样本数据的要素,建立样本库,所述要素包括:发票种类、费用部门、项目名称、财务短语、摘要短语、附件类别。对样本数据的标注,是基于财务记账规则的。
S3步骤中,对样本数据进行样本标注映射,其中包括如下步骤:
S31:将所述样本数据中的费用单据数据,按照所述判断标准库中的分类,进行分类对应;
S32:对各个分类的样本数据标注要素;
S33:对所述经过标注要素的样本数据映射其所属会计科目,保存在样本库中。
该过程是搭建智能记账模型的关键步骤,基于标注平台,分为如下几个层面的样本标注映射:
将收集到的商品&服务明细的名称按照国标进行分类对应,以此缩小识别映射的范围;
票据的种类和费用类别也是有比较强烈的对应关系的,所使用的票据往往带有一定的业务场景含义,如的士票属于交通类、增值税普通发票为一般采购服务类、会议通知单涉及到企业招待类等等;
一些费用发生过程的辅助信息,包括费用摘要、部门名称和属性,项目名称和属性、记账单的财务短语,也是带着业务场景含义的,将这些辅助信息作为样本的标注参考项做标注。
如图2所示,部分样本数据经过分类标注要素和会计项目。
S4:构建智能记账模型,所述智能记账模型包括:输入端、智能记账神经网络、输出端,其中,所述智能记账神经网络进行样本数据的特征提取和特征映射,经过训练完成样本数据的识别。
提取特征就是对费用单据数据中的关键词进行提取,就是寻找“发票种类、费用部门、项目名称、财务短语、摘要短语、附件类别”各要素种类的关键词,然后根据关键词映射到神经网络认为的会计科目上。这些是在神经网络内部处理,整个过程是只有机器可读的复杂数学运算过程。
神经网络具有卷积核,卷积核称为滤波器filter,带着一组固定权重的神经元,通常是n*m二维的矩阵,n和m也是神经元的感受野。n*m 矩阵中存的是对感受野中数据处理的系数。一个卷积核的滤波可以用来提取特定的特征。通过卷积层从原始数据中提取出新的特征的过程又成为特征映射。
S4步骤中,所述智能记账模型的神经网络为Word2vec浅层神经网络和CNN卷积神经网络组合,通过所述Word2vec浅层神经网络计算所述费用单据数据中的词向量、度量词与词之间的相似性,通过所述CNN卷积神经网络提取数据进行分类。
Word2vec浅层神经网络主要包含两个模型:跳字模型(skip-gram)和连续词袋模型(continuous bag of words,简称CBOW),以及两种高效训练的方法:负采样(negativesampling)和层序softmax(hierarchical softmax)。Word2vec浅层神经网络可以在百万数量级的词典和上亿的数据集上进行高效地训练,其次,该工具得到的训练结果——词向量(word embedding),可以很好地度量词与词之间的相似性。本专利采用Word2vec浅层神经网络可以很好地提取报销中的文字信息。
CNN卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,它包括卷积层(convolutionallayer)和池化层(pooling layer),可以较好地提取数据特征。
深度学习平台的搭建属于现有技术,通过神经网络,预设各类权重,模拟人脑对于财务报销规则的判断。
S5:将所述样本库中的样本数据输入所述智能记账模型进行训练,获得所述智能记账模型输出的对所述样本数据所属会计账目的识别结果,针对识别结果错误的样本进行标注要素修正,修正后再次输入到所述智能记账模型进行训练,直至最终输出结果正确,得到可以进行自动分类的智能记账模型,将所述智能记账模型封装成智能记账模块,嵌入到会计记账主流程系统中。
修正的过程是仅修正识别错误的样本,模型不修改。比如笔记本电脑识别成了文具,那么就对这一单据数据的进行重新标注,比如在商品名称要素只保留电脑,或者修改为便携式电脑,摘要短语要素修改为电子设备,用途测试等等。 增加更加明显的区别描述,这是人工进行操作的过程。
S6:将待记账的费用单据数据输入到所述智能记账模块中,经过所述智能记账模块的处理,自动识别出所述费用单据数据所属的财务记账会计科目,将所述费用单据的费用发生额挂账在所属的会计科目上。
报销人员在财务系统提交报销单数据,根据输入的报销单内容,发票内容,以及报销人属性信息,智能记账模块会将该笔报销单一笔一笔地准确地挂到相对应的会计科目上,完成每单的记账工作,此过程无需会计人员直接参与,得到的账套即是通过自动记账获得的准确的记账凭证。
S6步骤中,当所述智能记账模块的完成会计科目的分类识别,若发生对结果进行查证和纠正的触发处理,则将纠正结果反馈给所述智能记账模块,所述智能记账模块根据反馈执行修正程序。
在实际运作过程中,还需要人工对识别结果进行抽查验证,当人工发现识别结果错误时,会进入系统修改识别结果,此时触发智能记账模块的修正程序,所述智能记账模块根据修正后的结果修改神经网络的卷积核参数使得其推测的结果和修正结果相同,继续工作。
本发明的一种智能记账方法及其系统,通过设置判断标准库,细分样本要素分类,缩小识别映射的范围,使样本库的建立更加完善,利于神经网络自我学习;通过深度学习平台自我学习报销判断规则,自动推荐报销会计项目,记账速度快,正确性高。
实施例二
一种智能记账系统,包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行以下步骤:
S1:收集样本数据,所述样本数据为用于记账用的费用单据数据。
S2:收集采购明细的商品名称库、票据种类列表、商品分类表、财务分类表,将所述各类知识库、列表、分类表建立判断标准库。
S3:标注所述样本数据的要素,建立样本库,所述特征包括:发票种类、费用部门、项目名称、财务短语、摘要短语、附件类别。
S4:构建智能记账模型,所述智能记账模型包括:输入端、智能记账神经网络、输出端,其中,所述智能记账神经网络进行样本数据的特征提取和特征映射,经过训练完成样本数据的识别。
S5:将所述样本库中的样本数据输入所述智能记账模型进行训练,获得所述智能记账模型输出的对所述样本数据所属会计账目的识别结果,针对识别结果错误的样本进行标注要素修正,修正后再次输入到所述智能记账模型进行训练,直至最终输出结果正确,得到可以进行自动分类的智能记账模型,将所述智能记账模型封装成智能记账模块,嵌入到会计记账主流程系统中。
S6:将待记账的费用单据数据输入到所述智能记账模块中,经过所述智能记账模块的处理,自动识别出所述费用单据数据所属的财务记账会计科目,将所述费用单据的费用发生额挂账在所属的会计科目上。
S4步骤中,所述智能记账模型的神经网络为Word2vec浅层神经网络和CNN卷积神经网络组合,通过所述Word2vec浅层神经网络计算所述费用单据数据中的词向量、度量词与词之间的相似性,通过所述CNN卷积神经网络提取数据进行分类。
S3步骤中,对样本数据进行样本标注映射,其中包括如下步骤:
S31:将所述样本数据中的费用单据数据,按照所述判断标准库中的分类,进行分类对应;
S32:对各个分类的样本数据标注要素;
S33:对所述经过标注要素的样本数据映射其所属会计科目,保存在样本库中。
要素就是权1 S3步骤描述的发票种类、费用部门、项目名称、财务短语、摘要短语、附件类别。比如一个差旅报销单数据,标记要素发票种类:火车票,费用部门:研发部,项目名称:XXX产品现场技术支持等等,然后再把这个报销单标记为差旅费科目。神经网络要做的就是学习发现要素包含这些字眼确定一单数据是差旅费,模拟人类识别的过程。
S6步骤中,当所述智能记账模块的完成会计科目的分类识别,若发生对结果进行查证和纠正的触发处理,则将纠正结果反馈给所述智能记账模块,所述智能记账模块根据反馈执行修正程序。
本发明的一种智能记账方法及其系统,通过设置判断标准库,细分样本要素分类,缩小识别映射的范围,使样本库的建立更加完善,利于神经网络自我学习;通过深度学习平台自我学习报销判断规则,自动推荐报销会计项目,记账速度快,正确性高。
实施例三
本实施例以某高校的智能记账工作为例:
如图3所示,第一步:报账历史数据摸底;
摸底高校的报账单历史数据,了解其现有财务系统中的报销单数据,其中票种和票面内容数据只有纸质内容,未电子化,未有其他数据可供模型使用。需要对纸质内容完成电子化,并且根据其常用场景自行制造数据。
第二步:样本数据收集与整理
收集理工学院的报账单数据,和与之相对应的票据数据(票种、票面内容)。补充数据样本,按照报账场景报账单的实际情况自造样本数据,建立报账和经济分类的有效样本,收集互联网上和教育体系相关的商品明细与分类数据,发票类型与记账标准数据。由于是自造数据,与真实完整的场景还有差异,挑选3-5个典型场景制造样本数据,先实现模型的初步搭建。
第三步:样本数据整理与分类
如图4和图5所示,自造数据分类中包括商品分类表,场景分类表。
第四步:构建自学习分类模型
模型实现,优先选择3-5个典型场景内实现自学习模型的构建,将收集的样本数据送入对应的场景模型中进行训练。训练过程中重点关注自学习功能,边运行边收集实际场景的完整数据,作为完善模型的新样本数据,直至最终模型完成。
第五步:自学习模型衔接应用场景
注意和应用系统人工操作过程的接口衔接,在现有财务系统中添加一个和人工记账并行的输入输出接口,互不影响。设定判断分支,根据模型运行情况和操作者手动选择,设定模型是否接入系统进行工作。
第六步:模型生产应用,与人工并行,完善模型
部署初期要和人工处理流程并行执行;初期不实际参与流程;由于是自学习功能的模型,需要积累实际场景的完整数据,也包括人工处理的数据,做好标记,定期倒数来完善模型,通过不断的完善,减少人工直接操作的频率,将记账工作逐步交给模型进行识别,人工接入后续的验证环节,验证环节由初期的全验证逐渐向随机验证,数额制验证过度。
本发明的一种智能记账方法及其系统,通过设置判断标准库,细分样本要素分类,缩小识别映射的范围,使样本库的建立更加完善,利于神经网络自我学习;通过深度学习平台自我学习报销判断规则,自动推荐报销会计项目,记账速度快,正确性高。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包含在本发明的专利保护范围内。
Claims (8)
1.一种智能记账方法,其特征在于,包括如下步骤:
S1:收集样本数据,所述样本数据为用于记账用的费用单据数据;
S2:收集采购明细的商品名称库、票据种类列表、商品分类表、财务分类表,将所述各类知识库、列表、分类表建立判断标准库;
S3:标注所述样本数据的要素,建立样本库,所述要素包括:发票种类、费用部门、项目名称、财务短语、摘要短语、附件类别;
S4:构建智能记账模型,所述智能记账模型包括:输入端、智能记账神经网络、输出端,其中,所述智能记账神经网络进行样本数据的特征提取和特征映射,经过训练完成样本数据的识别;
S5:将所述样本库中的样本数据输入所述智能记账模型进行训练,获得所述智能记账模型输出的对所述样本数据所属会计账目的识别结果,针对识别结果错误的样本进行标注要素修正,修正后再次输入到所述智能记账模型进行训练,直至最终输出结果正确,得到可以进行自动分类的智能记账模型,将所述智能记账模型封装成智能记账模块,嵌入到会计记账主流程系统中;
S6:将待记账的费用单据数据输入到所述智能记账模块中,经过所述智能记账模块的处理,自动识别出所述费用单据数据所属的财务记账会计科目,将所述费用单据的费用发生额挂账在所属的会计科目上。
2.根据权利要求1所述的一种智能记账方法,其特征在于:S4步骤中,所述智能记账模型的神经网络为Word2vec浅层神经网络和CNN卷积神经网络组合,通过所述Word2vec浅层神经网络计算所述费用单据数据中的词向量、度量词与词之间的相似性,通过所述CNN卷积神经网络提取数据进行分类。
3.根据权利要求1所述的一种智能记账方法,其特征在于:S3步骤中,对样本数据进行样本标注映射,其中包括如下步骤:
S31:将所述样本数据中的费用单据数据,按照所述判断标准库中的分类,进行分类对应;
S32:对各个分类的样本数据标注要素;
S33:对所述经过标注要素的样本数据映射其所属会计科目,保存在样本库中。
4.根据权利要求1所述的一种智能记账方法,其特征在于:S6步骤中,当所述智能记账模块的完成会计科目的分类识别,若发生对结果进行查证和纠正的触发处理,则将纠正结果反馈给所述智能记账模块,所述智能记账模块根据反馈执行修正程序。
5.一种智能记账系统,其特征在于,包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行以下步骤:
S1:收集样本数据,所述样本数据为用于记账用的费用单据数据;
S2:收集采购明细的商品名称库、票据种类列表、商品分类表、财务分类表,将所述各类知识库、列表、分类表建立判断标准库;
S3:标注所述样本数据的要素,建立样本库,所述特征包括:发票种类、费用部门、项目名称、财务短语、摘要短语、附件类别;
S4:构建智能记账模型,所述智能记账模型包括:输入端、智能记账神经网络、输出端,其中,所述智能记账神经网络进行样本数据的特征提取和特征映射,经过训练完成样本数据的识别;
S5:将所述样本库中的样本数据输入所述智能记账模型进行训练,获得所述智能记账模型输出的对所述样本数据所属会计账目的识别结果,针对识别结果错误的样本进行标注要素修正,修正后再次输入到所述智能记账模型进行训练,直至最终输出结果正确,得到可以进行自动分类的智能记账模型,将所述智能记账模型封装成智能记账模块,嵌入到会计记账主流程系统中;
S6:将待记账的费用单据数据输入到所述智能记账模块中,经过所述智能记账模块的处理,自动识别出所述费用单据数据所属的财务记账会计科目,将所述费用单据的费用发生额挂账在所属的会计科目上。
6.根据权利要求5所述的一种智能记账系统,其特征在于:S4步骤中,所述智能记账模型的神经网络为Word2vec浅层神经网络和CNN卷积神经网络组合,通过所述Word2vec浅层神经网络计算所述费用单据数据中的词向量、度量词与词之间的相似性,通过所述CNN卷积神经网络提取数据进行分类。
7.根据权利要求5所述的一种智能记账系统,其特征在于:S3步骤中,对样本数据进行样本标注映射,其中包括如下步骤:
S31:将所述样本数据中的费用单据数据,按照所述判断标准库中的分类,进行分类对应;
S32:对各个分类的样本数据标注要素;
S33:对所述经过标注要素的样本数据映射其所属会计科目,保存在样本库中。
8.根据权利要求5所述的一种智能记账系统,其特征在于:S6步骤中,当所述智能记账模块的完成会计科目的分类识别,若发生对结果进行查证和纠正的触发处理,则将纠正结果反馈给所述智能记账模块,所述智能记账模块根据反馈执行修正程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910831692.7A CN110517130A (zh) | 2019-09-04 | 2019-09-04 | 一种智能记账方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910831692.7A CN110517130A (zh) | 2019-09-04 | 2019-09-04 | 一种智能记账方法及其系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110517130A true CN110517130A (zh) | 2019-11-29 |
Family
ID=68630771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910831692.7A Pending CN110517130A (zh) | 2019-09-04 | 2019-09-04 | 一种智能记账方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110517130A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111046935A (zh) * | 2019-12-05 | 2020-04-21 | 北京公瑾科技有限公司 | 基于机器学习模型的单据生成凭证方法及设备 |
CN111652703A (zh) * | 2020-06-04 | 2020-09-11 | 策拉人工智能科技(云南)有限公司 | 一种人工智能会计自动记账、报税的方法及系统 |
CN111986015A (zh) * | 2020-06-18 | 2020-11-24 | 励程 | 提取财务信息用于记账的方法和系统 |
CN112669133A (zh) * | 2020-12-28 | 2021-04-16 | 祝泽文 | 一种根据应用场景自动匹配的智能费控报销方法 |
CN112967122A (zh) * | 2021-02-05 | 2021-06-15 | 马晓华 | 一种财务管理系统 |
CN113034255A (zh) * | 2021-04-02 | 2021-06-25 | 北京神州数字科技有限公司 | 一种基于业务流水的增值税结售汇方法及装置 |
CN113935723A (zh) * | 2021-12-17 | 2022-01-14 | 畅捷通信息技术股份有限公司 | 一种基于优化损失的记账凭证生成方法、装置及存储介质 |
CN116029852A (zh) * | 2023-01-30 | 2023-04-28 | 北京四方启点科技有限公司 | 一种报销单会计科目确认方法和装置 |
JP7448801B2 (ja) | 2020-04-13 | 2024-03-13 | 弥生株式会社 | 情報処理装置及びプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170293951A1 (en) * | 2016-04-11 | 2017-10-12 | Ian Nolan | System, Method and Apparatus for Automatic Categorization and Assessment of Billing Narratives |
CN107301225A (zh) * | 2017-06-20 | 2017-10-27 | 挖财网络技术有限公司 | 短文本分类方法及装置 |
CN109300026A (zh) * | 2018-11-14 | 2019-02-01 | 成都光谷云财务咨询有限公司 | 基于自动记账大数据的财务智能分析方法及其系统 |
CN109636557A (zh) * | 2018-12-11 | 2019-04-16 | 厦门商集网络科技有限责任公司 | 一种基于票据识别的智能分类记账方法及设备 |
CN109871443A (zh) * | 2018-12-25 | 2019-06-11 | 杭州茂财网络技术有限公司 | 一种基于记账场景的短文本分类方法及装置 |
CN110097440A (zh) * | 2019-05-08 | 2019-08-06 | 金瓜子科技发展(北京)有限公司 | 一种数据处理方法和装置 |
-
2019
- 2019-09-04 CN CN201910831692.7A patent/CN110517130A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170293951A1 (en) * | 2016-04-11 | 2017-10-12 | Ian Nolan | System, Method and Apparatus for Automatic Categorization and Assessment of Billing Narratives |
CN107301225A (zh) * | 2017-06-20 | 2017-10-27 | 挖财网络技术有限公司 | 短文本分类方法及装置 |
CN109300026A (zh) * | 2018-11-14 | 2019-02-01 | 成都光谷云财务咨询有限公司 | 基于自动记账大数据的财务智能分析方法及其系统 |
CN109636557A (zh) * | 2018-12-11 | 2019-04-16 | 厦门商集网络科技有限责任公司 | 一种基于票据识别的智能分类记账方法及设备 |
CN109871443A (zh) * | 2018-12-25 | 2019-06-11 | 杭州茂财网络技术有限公司 | 一种基于记账场景的短文本分类方法及装置 |
CN110097440A (zh) * | 2019-05-08 | 2019-08-06 | 金瓜子科技发展(北京)有限公司 | 一种数据处理方法和装置 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111046935A (zh) * | 2019-12-05 | 2020-04-21 | 北京公瑾科技有限公司 | 基于机器学习模型的单据生成凭证方法及设备 |
CN111046935B (zh) * | 2019-12-05 | 2023-08-01 | 北京子敬科技有限公司 | 基于机器学习模型的单据生成凭证方法及设备 |
JP7448801B2 (ja) | 2020-04-13 | 2024-03-13 | 弥生株式会社 | 情報処理装置及びプログラム |
CN111652703A (zh) * | 2020-06-04 | 2020-09-11 | 策拉人工智能科技(云南)有限公司 | 一种人工智能会计自动记账、报税的方法及系统 |
CN111986015A (zh) * | 2020-06-18 | 2020-11-24 | 励程 | 提取财务信息用于记账的方法和系统 |
CN111986015B (zh) * | 2020-06-18 | 2024-04-30 | 励程 | 提取财务信息用于记账的方法和系统 |
CN112669133A (zh) * | 2020-12-28 | 2021-04-16 | 祝泽文 | 一种根据应用场景自动匹配的智能费控报销方法 |
CN112967122A (zh) * | 2021-02-05 | 2021-06-15 | 马晓华 | 一种财务管理系统 |
CN113034255B (zh) * | 2021-04-02 | 2023-06-06 | 北京神州数字科技有限公司 | 一种基于业务流水的增值税结售汇方法及装置 |
CN113034255A (zh) * | 2021-04-02 | 2021-06-25 | 北京神州数字科技有限公司 | 一种基于业务流水的增值税结售汇方法及装置 |
CN113935723B (zh) * | 2021-12-17 | 2022-02-25 | 畅捷通信息技术股份有限公司 | 一种基于优化损失的记账凭证生成方法、装置及存储介质 |
CN113935723A (zh) * | 2021-12-17 | 2022-01-14 | 畅捷通信息技术股份有限公司 | 一种基于优化损失的记账凭证生成方法、装置及存储介质 |
CN116029852A (zh) * | 2023-01-30 | 2023-04-28 | 北京四方启点科技有限公司 | 一种报销单会计科目确认方法和装置 |
CN116029852B (zh) * | 2023-01-30 | 2023-10-24 | 北京四方启点科技有限公司 | 一种报销单会计科目确认方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110517130A (zh) | 一种智能记账方法及其系统 | |
CN109597994B (zh) | 短文本问题语义匹配方法和系统 | |
CN109086756A (zh) | 一种基于深度神经网络的文本检测分析方法、装置及设备 | |
CN111652232B (zh) | 票据识别方法及装置、电子设备和计算机可读存储介质 | |
CN108876166A (zh) | 财务风险验证处理方法、装置、计算机设备及存储介质 | |
CN103207855A (zh) | 针对产品评论信息的细粒度情感分析系统及方法 | |
CN110046978A (zh) | 智能报销方法 | |
CN109598517B (zh) | 商品通关处理、对象的处理及其类别预测方法和装置 | |
CN110390320A (zh) | 一种包含有多张单据的影像信息的识别方法及系统 | |
CN109376766B (zh) | 一种画像预测分类方法、装置及设备 | |
CN109670191A (zh) | 机器翻译的校准优化方法、装置与电子设备 | |
CN109858414A (zh) | 一种发票分块检测方法 | |
CN107590127A (zh) | 一种题库知识点自动标注方法及系统 | |
CN105976056A (zh) | 基于双向rnn的信息提取系统 | |
CN109375948A (zh) | 一种智能功能点识别的软件计价方法 | |
CN112182214B (zh) | 一种数据分类方法、装置、设备及介质 | |
CN109271201A (zh) | 一种智能功能点识别的软件计价系统 | |
Debreceny et al. | Adios! Airways: An assignment on mapping financial statements to the US GAAP XBRL taxonomy | |
CN113449046A (zh) | 基于企业知识图谱的模型训练方法、系统及相关装置 | |
CN107291775A (zh) | 错误样本的修复语料生成方法和装置 | |
CN109933783A (zh) | 一种不良资产经营领域的合同要素化方法 | |
Bickel | A new approach to semantic sustainability assessment: text mining via network analysis revealing transition patterns in German municipal climate action plans | |
CN115081025A (zh) | 基于数字中台的敏感数据管理方法、装置及电子设备 | |
CN110119353A (zh) | 测试数据生成方法、装置以及控制器和介质 | |
JP2022020543A (ja) | 技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |