CN113837183B - 基于实时挖掘的多阶段凭证智能生成方法、系统及介质 - Google Patents

基于实时挖掘的多阶段凭证智能生成方法、系统及介质 Download PDF

Info

Publication number
CN113837183B
CN113837183B CN202111137083.5A CN202111137083A CN113837183B CN 113837183 B CN113837183 B CN 113837183B CN 202111137083 A CN202111137083 A CN 202111137083A CN 113837183 B CN113837183 B CN 113837183B
Authority
CN
China
Prior art keywords
prediction
accuracy
intelligent
stage
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111137083.5A
Other languages
English (en)
Other versions
CN113837183A (zh
Inventor
黄斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHANJET INFORMATION TECHNOLOGY CO LTD
Original Assignee
CHANJET INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHANJET INFORMATION TECHNOLOGY CO LTD filed Critical CHANJET INFORMATION TECHNOLOGY CO LTD
Priority to CN202111137083.5A priority Critical patent/CN113837183B/zh
Publication of CN113837183A publication Critical patent/CN113837183A/zh
Application granted granted Critical
Publication of CN113837183B publication Critical patent/CN113837183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于实时挖掘的多阶段凭证智能生成方法、系统及介质,涉及智能化凭证生成技术领域,方法包括:通过OCR技术对上传的票据进行识别;对识别后的票据进行N阶段的智能预测,其中,N为整数,N≥2;所述智能预测具体包括:在N‑1轮的预测阶段,预测多个标签,每一轮的标签发送给票据上传者进行确认;确认后的标签作为特征输入第N轮最终凭证的预测,并将预测的结果发送给专业人员进行审核调整;审核调整后生成记账凭证。该方法通过在多阶段的智能预测过程中预测并引入更多标签,提高发票生成记账凭证的准确性。

Description

基于实时挖掘的多阶段凭证智能生成方法、系统及介质
技术领域
本发明涉及智能化凭证生成技术领域,具体涉及一种基于实时挖掘的多阶段凭证智能生成方法、系统、终端及介质。
背景技术
现在的电子信息系统中,处理票据生成凭证的方法,都是通过会计进行原始票据的手动整理,然后在系统中编制凭证,这样的做法不仅工作量特别大,而且还容易出现错误,需要会计多次核对,大大影响了工作效率。
随着互联网技术的不断创新与普及,人工智能在计算机领域内,得到了愈加广泛的重视,越来越多的行业开始运用人工智能为企业创造价值,并在票据的识别中得到越来越广泛的应用。现有的智能化凭证生成技术,一般通过OCR完成票据识别并通过规则或者算法进行凭证生成。由于不同企业的个性化记账特点,部分相似票据的标签并不统一,导致机器学习、深度学习模型的准确性较低;由于部分类型的凭证样本较少,容易陷入对小样本的过拟合以及对整体目标任务的欠拟合。
发明内容
针对现有技术中的缺陷,本发明实施例提供一种基于实时挖掘的多阶段凭证智能生成方法、系统、终端及介质,通过在多阶段的智能预测过程中引入标签,提高发票生成凭证的准确性。
第一方面,本发明实施例提供的一种基于实时挖掘的多阶段凭证智能生成方法,包括:
通过OCR技术对上传的票据进行识别;
对识别后的票据进行N阶段的智能预测,其中,N为整数,N≥2;
所述智能预测具体包括:在N-1轮的预测阶段,预测多个标签,每一轮的标签发送给票据上传者进行确认;
确认后的标签作为特征输入第N轮最终凭证的预测,并将预测的结果发送给专业人员进行审核调整;
审核调整后生成记账凭证。
第二方面,本发明实施例提供的一种基于实时挖掘的多阶段凭证智能生成系统,包括:票据识别模块、智能预测模块和凭证生成模块;
所述票据识别模块通过OCR技术对上传的票据进行识别;
所述智能预测模块对识别后的票据进行N阶段的智能预测,其中,N为整数,N≥2;
所述智能预测具体包括:在N-1轮的预测阶段,预测多个标签,每一轮的标签发送给票据上传者进行确认;
确认后的标签作为特征输入第N轮最终凭证的预测,并将预测的结果发送给专业人员进行审核调整;
所述凭证生成模块用于生成记账凭证。
第三方面,本发明实施例提供的一种智能终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述实施例描述的方法的步骤。
第四方面,本发明实施例提供的一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述实施例描述的方法的步骤。
本发明的有益效果:
本发明实施例提供的一种基于实时挖掘的多阶段凭证智能生成方法、系统、终端及介质,对票据采用多阶段智能预测,预测并引入标签,提升发票生成记账凭证的准确性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1示出了本发明第一实施例所提供的一种基于实时挖掘的多阶段凭证智能生成方法的流程图;
图2示出了本发明第二实施例所提供的一种基于实时挖掘的多阶段凭证智能生成系统的结构框图;
图3示出了本发明第三实施例所提供的一种智能终端的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
如图1所示,示出了本发明第一实施例所提供的一种基于实时挖掘的多阶段凭证智能生成方法的流程图,方法包括以下步骤:
通过OCR技术对上传的票据进行识别;
对识别后的票据进行N阶段的智能预测,其中,N为整数,N≥2;
所述智能预测具体包括:在N-1轮的预测阶段,预测多个标签,每一轮的标签发送给票据上传者进行确认;
确认后的标签作为特征输入第N轮最终凭证的预测,并将预测的结果发送给专业人员进行审核调整;
审核调整后生成记账凭证。
在本实施例中,通过对识别后的票据进行多阶段的智能预测,在前置的N-1轮预测阶段,引入标签,标签包括票据用途标签,针对不同企业的部分个性化需求进行定义,并引入用户交互(通过手机APP、浏览器的可视化界面展现待确认的信息,引导用户对信息进行确认或修改),将智能预测的结果(票据用途)发送给票据上传者进行确认,提升个性化需求识别的准确性,并让票据上传者对预测结果进行确认。在最终轮预测阶段,在追加票据用途标签后进行最终凭证预测,同时引入专业会计对生成的最终凭证进行审核调整,审核调整后自动生成记账凭证。对票据采用多阶段智能预测,预测并引入标签,提升发票生成凭证的准确性。
本发明实施例提供的一种基于实时挖掘的多阶段凭证智能生成方法还包括在每个阶段预测时进行实时规则挖掘,具体包括:
实时收集每个阶段的用户行为数据,通用的用户行为数据包含操作时间、操作账套ID、操作人员ID、本次交互操作时长;不同阶段还要分别收集本阶段关注的标签数据包含本次交互确认提交的标签(票据用途或凭证分录科目信息)、本次交互曾选中过的标签集合(票据用途或凭证分录科目信息)、本次交互标签(票据用途或凭证分录科目信息)在界面中被调整的统计次数;其中,用户行为数据在N-1阶段收集的是票据上传人对票据用途的标签信息,在最终轮收集的是专业会计对凭证分录科目信息的标签信息。
根据收集的用户行为数据进行实时规则挖掘。
采用挖掘前的规则进行票据预测得到第一预测结果。其中,挖掘前的规则指当前在线使用的所有规则、模型组合而成的预测模型,包含用户干预规则集、实时挖掘规则集、专家规则集、票据用途分类模型和专家兜底决策树模型;用户干预规则集是产品界面中提供给用户进行设置的规则集,在发票摘要中包含特定关键字时自动选择票据用途。此规则集主要用于用户的个性化定制。实时挖掘规则集是通过实时挖掘获取的规则集。是通过实时收集的行为数据,应用实时挖掘的方法获取的规则集。专家规则集是产品专家基于业务经验制定的规则集,通过税收分类简称、发票摘要、销售方名称、金额作为规则条件,匹配得出票据用途的规则集。票据用途分类模型是一个使用Fasttext训练的有监督多分类模型。模型训练数据的获取方法为从产品历史的发票及对应凭证分录信息为原始数据(上线时产品内并无票据用途的相关信息),手工整理凭证分录的科目名称与票据用途的映射表,最终,特征为通过分词器得到的发票摘要的分词列表,标签为通过科目名称映射而来的票据用途。专家兜底决策树模型是为了解决以上方法都无法命中的场景而引入的兜底方案,是产品专家使用决策树模型表达的专家知识。模型是从树根到叶子节点的推演,各节点的子节点为不同条件下的推演方向,叶子结点皆为某票据用途。
采用实时挖掘的规则进行票据预测得到第二预测结果;此处应用的预测模型为在当前在线使用的所有规则、模型,特别的,在实时挖掘规则集中插入当前挖掘出的规则后得到的预测模型。
使用历史数据库中的数据计算第一预测结果的准确率为第一准确率。
使用历史数据库中的数据计算第二预测结果的准确率为第二准确率。
将第一准确率与第二准确率进行对比;若第二准确率大于第一准确率,则说明效果正向,将挖掘的规则插入到数据库表中;若第二准确率小于第一准确率,则说明效果负向,则丢弃此次挖掘的规则。
具体地,在每轮的智能预测进行实时规则挖掘,例如票据上传人、专业人员的行为会落入Flink中,实时挖掘对不同的应用场景在多个层级(包括用户级、企业级、行业级、全局等)进行规则挖掘并评估,效果正向的新规则加入到数据库表中。
以前置阶段的票据用途标签的用户级实时规则挖掘为例,假设发票为进项发票:
a.接收到以下信息,特征集(税收分类简称,发票摘要,销售方名称,金额);标签为(票据用途);
b.在历史数据库中计算本用户的票据用途预测准确率为准确率X:计算准确率X的方法是为找出本用户的所有经过用户确认的票据信息,收集特征(税收分类简称,发票摘要,销售方名称,金额),以用户确认的票据用途为标签,利用当前的预测能力对特征进行预测,准确率X=预测结果与用户确认的票据用途相等的总数/本用户的所有票据数;
c.对以上特征进行加工处理,变成规则条件:
ⅰ.税收分类简称
1.不限制税收分类
2.等于税收分类简称
ⅱ.发票摘要
1.不限制摘要信息
2.等于摘要
3.包含摘要核心词(基于NLP模块进行核心词提取)
ⅲ.销售方名称
1.不限制销售方名称
2.等于销售方名称
ⅳ.金额
1.不限制金额
2.限定金额范围,取出在如下区间中可命中的,每个作为一个候选条件:
[0,100),[100,200),[100,500),[100,1000),[200,500),[500,1000)……
d.从上述条件中,每个特征选一个条件作为新规则,取迪卡尔积共有2*3*2*(1+N)种组合(N取决于该金额所在的金额范围),每一条新规则皆加入原规则中,利用历史数据库中本用户的数据进行票据用途预测,找出准确率最大的一条新规则,准确率记为Y;
e.如果Y>X,说明效果正向,此规则插入到数据库中;
f.如果Y<X,说明效果负向,此规则丢弃;
g.如果Y=X,说明效果相同,根据奥卡姆剃刀原理遵循简单有效原则,此规则丢弃。
该方法通过引入Flink技术进行实时规则的挖掘,时效性比传统的定期模型训练、上线过程更优,同时只需要小样本就可以定向挖掘出不同层级且有效的规则,提升整体智能算法准确率。
在每轮的智能预测中,采用多种推理引擎组合解决某个特定场景问题。采用规则引擎组件、算法引擎组件和决策树引擎组件通过设置不同的优先级和条件分支进行整体预测流程的运行。其中在最上层包含干预规则层,便于运营、用户进行自定义。智能预测融合了不同引擎通过策略编排进行预测,比现有的单一规则和算法预测更有针对性以及可干预性,整体表现更优。以前置阶段的票据用途标签的智能预测为例:
1、通过规则引擎组件判断用户干预规则集是否匹配,匹配则按干预结果进行返回,不匹配则继续下一步;
2、通过规则引擎组件判断实时挖掘规则集是否匹配,匹配则返回,不匹配则继续下一步;
3、通过规则引擎组件判断专家规则集是否匹配,匹配则返回,不匹配则继续;
4、算法引擎组件:采用票据用途分类模型进行预测,分类准确性阈值80%以上则返回,不匹配则继续下一步;
5、决策树引擎组件:采用专家兜底决策树模型预测是否匹配,匹配则返回,不匹配则继续。
在现有技术中,采用OCR技术并使用凭证模板的方法生成记账凭证的准确率为40%左右,统计了近4个月各月度采用本发明实施例的方法生成记账凭证的准确率如表1所示:
时间 准确率 预测失败数/预测总数
2021-05 99.8% 3/1181
2021-06 99.4% 22/3716
2021-07 98.9% 26/3261
2021-08 99.3% 3/445
表1准确率表
由表1可知,使用本发明实施例提供的一种基于实时挖掘的多阶段凭证智能生成方法生成记账凭证的准确率达到98%以上,所以本发明实施例的方法远远优于现有技术。
本发明实施例提供的一种基于实时挖掘的多阶段凭证智能生成方法,对票据采用多阶段智能预测,预测并引入标签,提升发票生成记账凭证的准确性。引入实时规则挖掘并进评估,时效性比传统的定期模型训练、上线过程更优,同时只需要小样本就可以定向挖掘出不同层级且有效的规则,提升记账凭证生成方法的准确性。
在上述的第一实施例中,提供了一种基于实时挖掘的多阶段凭证智能生成方法,与之相对应的,本申请还提供一种基于实时挖掘的多阶段凭证智能生成系统。请参考图2,其为本发明第二实施例提供的一种基于实时挖掘的多阶段凭证智能生成系统的结构框图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
如图2所示,示出了本发明第二实施例提供的一种基于实时挖掘的多阶段凭证智能生成系统的结构框图,该系统包括:票据识别模块、智能预测模块和凭证生成模块;票据识别模块通过OCR技术对上传的票据进行识别;智能预测模块对识别后的票据进行N阶段的智能预测,其中,N为整数,N≥2;智能预测具体包括:在N-1轮的预测阶段,预测多个标签,每一轮的标签发送给票据上传者进行确认;确认后的标签作为特征输入第N轮最终凭证的预测,并将预测的结果发送给专业人员进行审核调整;凭证生成模块用于生成记账凭证。标签包括票据用途、企业个性化需求和人机交互内容。智能预测采用规则引擎组件、算法引擎组件和决策树引擎组件通过设置不同的优先级和条件分支进行整体预测流程的运行。
在本实施例中,系统还包括实时挖掘模块,实时挖掘模块用于实时收集每个阶段的用户行为数据;根据收集的数据进行实时规则挖掘;采用挖掘前的规则进行票据预测得到第一预测结果;采用实时挖掘的规则进行票据预测得到第二预测结果;使用历史数据库中的数据计算第一预测结果的准确率为第一准确率;使用历史数据库中的数据计算第二预测结果的准确率为第二准确率;将第一准确率与第二准确率进行对比;若第二准确率大于第一准确率,则说明效果正向,将挖掘的规则插入到数据库表中;若第二准确率小于第一准确率,则说明效果负向,则丢弃此次挖掘的规则。
以上,为本发明第二实施例提供的一种基于实时挖掘的多阶段凭证智能生成系统的实施例说明。
本发明实施例提供的一种基于实时挖掘的多阶段凭证智能生成系统与上述基于实时挖掘的多阶段凭证智能生成方法出于相同的发明构思,具有相同的有益效果,此处不再赘述。
如图3所示,示出了本发明第三实施例提供的一种智能终端的结构框图,该终端包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述实施例描述的方法。
应当理解,在本发明实施例中,所称处理器可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备可以包括显示器(LCD等)、扬声器等。
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器、输入设备、输出设备可执行本发明实施例提供的方法实施例所描述的实现方式,也可执行本发明实施例所描述的系统实施例的实现方式,在此不再赘述。
在本发明还提供一种计算机可读存储介质的实施例,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述实施例描述的方法。
所述计算机可读存储介质可以是前述实施例所述的终端的内部存储单元,例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述终端的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (8)

1.一种基于实时挖掘的多阶段凭证智能生成方法,其特征在于,包括:
通过OCR技术对上传的票据进行识别;
对识别后的票据进行N阶段的智能预测,其中,N为整数,N≥2;
所述智能预测具体包括:在N-1轮的预测阶段,预测多个标签,每一轮的标签发送给票据上传者进行确认;
确认后的标签作为特征输入第N轮最终凭证的预测,并将预测的结果发送给专业人员进行审核调整;
审核调整后生成记账凭证;
还包括:在每个阶段预测时进行实时规则挖掘,具体包括:
实时收集每个阶段的用户行为数据;
根据收集的数据进行实时规则挖掘;
采用挖掘前的规则进行票据预测得到第一预测结果;
采用实时挖掘的规则进行票据预测得到第二预测结果;
使用历史数据库中的数据计算第一预测结果的准确率为第一准确率;
使用历史数据库中的数据计算第二预测结果的准确率为第二准确率;
将第一准确率与第二准确率进行对比;
若第二准确率大于第一准确率,则说明效果正向,将挖掘的规则插入到数据库表中;
若第二准确率小于第一准确率,则说明效果负向,则丢弃此次挖掘的规则。
2.如权利要求1所述的方法,其特征在于,所述标签包括票据用途、企业个性化需求和人机交互内容。
3.如权利要求1所述的方法,其特征在于,所述智能预测采用规则引擎组件、算法引擎组件和决策树引擎组件通过设置不同的优先级和条件分支进行整体预测流程的运行。
4.一种基于实时挖掘的多阶段凭证智能生成系统,其特征在于,包括:票据识别模块、智能预测模块和凭证生成模块;
所述票据识别模块通过OCR技术对上传的票据进行识别;
所述智能预测模块对识别后的票据进行N阶段的智能预测,其中,N为整数,N≥2;
所述智能预测具体包括:在N-1轮的预测阶段,预测多个标签,每一轮的标签发送给票据上传者进行确认;
确认后的标签作为特征输入第N轮最终凭证的预测,并将预测的结果发送给专业人员进行审核调整;
所述凭证生成模块用于生成记账凭证;
所述系统还包括实时挖掘模块,所述实时挖掘模块用于实时收集每个阶段的用户行为数据;
根据收集的数据进行实时规则挖掘;
采用挖掘前的规则进行票据预测得到第一预测结果;
采用实时挖掘的规则进行票据预测得到第二预测结果;
使用历史数据库中的数据计算第一预测结果的准确率为第一准确率;
使用历史数据库中的数据计算第二预测结果的准确率为第二准确率;
将第一准确率与第二准确率进行对比;
若第二准确率大于第一准确率,则说明效果正向,将挖掘的规则插入到数据库表中;
若第二准确率小于第一准确率,则说明效果负向,则丢弃此次挖掘的规则。
5.如权利要求4所述的系统,其特征在于,所述标签包括票据用途、企业个性化需求和人机交互内容。
6.如权利要求4所述的系统,其特征在于,所述智能预测采用规则引擎组件、算法引擎组件和决策树引擎组件通过设置不同的优先级和条件分支进行整体预测流程的运行。
7.一种智能终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,其特征在于,所述处理器被配置用于调用所述程序指令,执行如权利要求1-3任一项所述的方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-3任一项所述的方法的步骤。
CN202111137083.5A 2021-09-27 2021-09-27 基于实时挖掘的多阶段凭证智能生成方法、系统及介质 Active CN113837183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111137083.5A CN113837183B (zh) 2021-09-27 2021-09-27 基于实时挖掘的多阶段凭证智能生成方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111137083.5A CN113837183B (zh) 2021-09-27 2021-09-27 基于实时挖掘的多阶段凭证智能生成方法、系统及介质

Publications (2)

Publication Number Publication Date
CN113837183A CN113837183A (zh) 2021-12-24
CN113837183B true CN113837183B (zh) 2022-07-15

Family

ID=78970982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111137083.5A Active CN113837183B (zh) 2021-09-27 2021-09-27 基于实时挖掘的多阶段凭证智能生成方法、系统及介质

Country Status (1)

Country Link
CN (1) CN113837183B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636557A (zh) * 2018-12-11 2019-04-16 厦门商集网络科技有限责任公司 一种基于票据识别的智能分类记账方法及设备
CN110119977A (zh) * 2019-05-10 2019-08-13 极智(上海)企业管理咨询有限公司 财务记账凭证自动生成方法、系统、介质和电子设备
CN112819597A (zh) * 2021-01-29 2021-05-18 陈世海 一种发票自动抓取和凭证录入方法、系统及存储介质

Also Published As

Publication number Publication date
CN113837183A (zh) 2021-12-24

Similar Documents

Publication Publication Date Title
CN107818344B (zh) 用户行为进行分类和预测的方法和系统
CN110263821B (zh) 交易特征生成模型的训练、交易特征的生成方法和装置
Chow et al. Estimating optimal feature subsets using efficient estimation of high-dimensional mutual information
CN111222976B (zh) 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN111199474B (zh) 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN107704512A (zh) 基于社交数据的金融产品推荐方法、电子装置及介质
CN109740642A (zh) 发票类别识别方法、装置、电子设备及可读存储介质
CN111428217B (zh) 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质
CN110428139A (zh) 基于标签传播的信息预测方法及装置
CN103617146B (zh) 一种基于硬件资源消耗的机器学习方法及装置
CN111046184A (zh) 文本的风险识别方法、装置、服务器和存储介质
CN115130711A (zh) 一种数据处理方法、装置、计算机及可读存储介质
Fu et al. A sentiment-aware trading volume prediction model for P2P market using LSTM
CN112988840A (zh) 一种时间序列预测方法、装置、设备和存储介质
CN113592605A (zh) 基于相似产品的产品推荐方法、装置、设备及存储介质
CN112950347B (zh) 资源数据处理的优化方法及装置、存储介质、终端
CN112995414B (zh) 基于语音通话的行为质检方法、装置、设备及存储介质
CN113159213A (zh) 一种业务分配方法、装置及设备
CN110213239B (zh) 可疑交易报文生成方法、装置及服务器
CN113435900A (zh) 交易风险确定方法、装置和服务器
CN113837183B (zh) 基于实时挖掘的多阶段凭证智能生成方法、系统及介质
CN110796381A (zh) 建模数据评价指标的处理方法、装置、终端设备及介质
CN113822390B (zh) 用户画像构建方法、装置、电子设备和存储介质
CN113688232A (zh) 招标文本分类方法、装置、存储介质及终端
CN112651753A (zh) 基于区块链的智能合约生成方法、系统及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant