CN116362816B - 凭证信息遗漏识别及处理方法、系统与介质 - Google Patents
凭证信息遗漏识别及处理方法、系统与介质 Download PDFInfo
- Publication number
- CN116362816B CN116362816B CN202310624777.4A CN202310624777A CN116362816B CN 116362816 B CN116362816 B CN 116362816B CN 202310624777 A CN202310624777 A CN 202310624777A CN 116362816 B CN116362816 B CN 116362816B
- Authority
- CN
- China
- Prior art keywords
- missing
- omission
- certificate
- historical
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title description 4
- 238000004458 analytical method Methods 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000011156 evaluation Methods 0.000 claims abstract description 26
- 238000012937 correction Methods 0.000 claims abstract description 14
- 238000012795 verification Methods 0.000 claims description 73
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000012015 optical character recognition Methods 0.000 claims description 14
- 239000002245 particle Substances 0.000 claims description 10
- 238000003062 neural network model Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 230000009469 supplementation Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/04—Billing or invoicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19093—Proximity measures, i.e. similarity or distance measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种凭证信息遗漏识别及处理方法、系统与介质,属于数据处理技术领域,具体包括:将凭证的校验区域划分为遗漏问题区域和错误问题区域,并至少基于纹理特征和SURF特征确定遗漏问题区域的遗漏评估值,并结合识别准确率得到凭证的遗漏概率,当基于遗漏概率确定不需要总体分析时,通过杰卡德相似系数与马氏距离函数确定错误问题区域与目标图像的相似度,并基于相似度、问题率、遗漏概率确定需要总体分析时,对凭证进行OCR识别得到凭证文字确定是否进行自动补正,基于受票方以及开票方的历史凭证得到凭证的开票校验金额,并基于开票校验金额确定开票金额存在问题时,输出报警信息,从而提升了凭证信息泄露处理的效率以及准确性。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种凭证信息遗漏识别及处理方法、系统与介质。
背景技术
随着电子凭证方便快捷以及节约纸张的优势,在越来越多的领域内得到了大量的应用,但与此同时凭证信息有可能会存在一些信息填写错误或者遗漏的地方,因此为了实现对凭证信息的遗漏的自动识别,在发明专利授权公告号CN115169284B《基于视觉化分析的凭证信息遗漏填补方法》中通过对凭证信息分析后,对凭证信息的遗漏值处理以及资料视觉化,并且通过选取多种填补方法来比较填补效果,最终选取适合的填补方法,将遗漏的资料处理完成,从而提高了遗漏值处理的效率和准确性,但是却存在以下技术问题:
未能结合凭证信息的填写内容进行疑似填写错误的判断,例如某些凭证信息并未存在填写信息的遗漏,但是在实际的操作过程中会有可能存在开票金额或者开票人信息存在异常的情况,若不能结合上述因素,则同样无法准确的实现开票。
未能对凭证信息的缺失内容进行分析,并根据缺失内容的分析结果进行是否补充的判断,例如在发票类的凭证信息中,若开票金额等涉及到金额信息存在遗漏,由于不同的发票的开票信息并不一致,此时无法进行自动补充,而例如开票方信息等存在遗漏,此时可以进行自动补充,因此若不能结合上述分析结果,则无法准确的实现对遗漏信息的自动填充。
针对上述技术问题,本发明提供了一种凭证信息遗漏识别及处理方法、系统与介质。
发明内容
根据本发明的一个方面,提供了一种凭证信息遗漏识别及处理方法。
一种凭证信息遗漏识别及处理方法,其特征在于,具体包括:
S11基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率进行所述凭证的问题率的确定,并基于所述问题率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S12;
S12将所述凭证换分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,并至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,通过所述遗漏概率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S13;
S13基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定需要总体分析时,进入步骤S14;
S14对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定是否进行自动补正,基于受票方以及开票方的历史凭证得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
另一方面,本发明提供了一种凭证信息遗漏识别及处理系统,采用上述的一种凭证信息遗漏识别及处理方法,具体包括:
问题率确定模块;校验区域划分模块;遗漏概率确定模块;相似度评估模块;报警信息输出模块;
其中所述问题率确定模块负责基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率确定所述凭证的问题率;
所述校验区域划分模块负责将所述凭证划分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域;
所述遗漏概率确定模块负责至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率;
所述相似度评估模块负责基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定是否需要总体分析;
所述自动补正确定模块负责对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定所述凭证的遗漏信息类型,通过所述遗漏信息类型确定是否进行自动补正;
所述报警信息输出模块负责基于受票方以及开票方的历史凭证、所述凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
另一方面,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种凭证信息遗漏识别及处理方法。
本发明的有益效果在于:
通过结合凭证的开票方的历史凭证的错误率和遗漏率以及所述受票方的历史凭证的错误率确定是否需要总体分析,从而实现了从开票方的历史凭证的实际情况以及受票方的实际情况对凭证的差异性分析,在保证凭证遗漏识别的准确性的基础上,也进一步提升了凭证识别的效率。
通过利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,从而实现了对不同的校验区域的类型的划分,这也为差异性的进行遗漏概率和相似度的确定奠定了基础。
通过基于纹理特征和SURF特征确定遗漏问题区域的局部遗漏概率,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,从而实现了从校验区域的图像的识别的角度对遗漏概率的准确评价,不仅实现了从总体的纹理角度以及细节的SURF特征对校验区域的图像特征的表征,进而提升了整体的准确性,并且通过遗漏概率的识别,也保证了存在遗漏可能的凭证的可靠性处理。
通过基于所述相似度、问题率、遗漏概率确定是否需要总体分析,从而实现了从多角度对凭证的评价,在保证校验效率的同时,也保证了存在问题的凭证能够得到全面的分析。
通过基于受票方以及开票方的历史凭证、所述凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息,从而实现了对开票金额的错误的在线识别,不仅保证了对凭证的遗漏信息的识别,同时也避免了凭证的开票金额的错误导致的开票信息错误的自动识别,进而保证了凭证的准确性和完整性。
其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显;
图1是一种凭证信息遗漏识别及处理方法的流程图;
图2是基于所述问题率确定是否需要总体分析的具体步骤的流程图;
图3是凭证的遗漏概率确定的具体步骤的流程图;
图4是开票校验金额确定的具体步骤的流程图;
图5是一种基于多维大数据分析的数据处理系统的框架图;
图6是另外一种基于多维大数据分析的数据处理系统的框架图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
用语“一个”、“一”、“该”、“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等。
为解决上述问题,根据本发明的一个方面,如图1所示,提供了根据本发明的一个方面,提供了一种凭证信息遗漏识别及处理方法,其特征在于,具体包括:
S11基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率进行所述凭证的问题率的确定,并基于所述问题率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S12;
需要说明的是,所述受票方的历史凭证的错误率根据所述受票方的历史凭证的识别情况进行确定,具体的,根据所述受票方的历史凭证的购买方信息的错误情况进行确定,并当所述受票方的历史凭证的错误率大于错误率限定值时,确定需要对所述凭证进行总体分析。
具体的举例说明,一般来说,由于受票方的信息导致受票方的历史凭证中容易出现错别字等导致受票方的历史凭证的错误率较大,而此时为了进一步减少由于受票方的信息导致的错误率较大的问题,需要对凭证进行总体分析,也就是通过OCR识别确定凭证中的文字信息。
具体的举例说明,如图2所示,基于所述问题率确定是否需要总体分析,具体包括:
S21基于所述凭证的开票方的历史凭证的错误率确定是否需要总体分析,若是,则需要总体分析,若否,则进入步骤S22;
需要说明的是,当所述凭证的开票方的历史凭证的错误率大于一定的值的情况下,需要进行总体分析。
S22基于所述凭证的开票方的历史凭证的遗漏率确定是否需要总体分析,若是,则需要总体分析,若否,则进入步骤S23;
需要说明的是,当所述凭证的开票方的历史凭证的遗漏率大于一定的值的情况下,需要进行总体分析。
S23基于所述凭证的开票方的历史凭证的错误率和遗漏率得到所述开票方的开票问题概率,并基于所述开票问题概率确定是否需要进一步的评估,若是,则进入步骤S24,若否,则确定不需要总体分析;
具体的举例说明,开票方的开票问题概率可以通过凭证的开票方的历史凭证的错误率和遗漏率的最大值进行确定,亦或者根据开票方的历史凭证的存在问题的凭证所占的比例进行确定。
S24基于所述受票方的历史凭证的错误率以及所述开票方的开票问题概率得到问题率,并基于所述问题率确定是否需要总体分析。
具体的举例说明,问题率不仅仅涉及到受票方,而且同时涉及到开票方的历史凭证的具体情况,因此需要综合两方面的实际情况,在实际的操作过程中,例如可以首先基于开票方的开票问题概率构建一个基础的问题概率,再与历史凭证的错误率相加,从而得到问题率。
需要说明的是,在进行凭证的受票方的历史凭证的错误率的确认之前,当所述开票方的历史凭证的数量或者所述受票方的历史凭证的数量小于预设数量时,则直接确定需要进行总体分析。
具体的举例说明,当受票方的历史凭证的数量仅有10个以下,此时进行各种错误率和遗漏率的评价不够准确,因此需要直接进行总体分析。
在本实施例中,通过结合凭证的开票方的历史凭证的错误率和遗漏率以及所述受票方的历史凭证的错误率确定是否需要总体分析,从而实现了从开票方的历史凭证的实际情况以及受票方的实际情况对凭证的差异性分析,在保证凭证遗漏识别的准确性的基础上,也进一步提升了凭证识别的效率。
S12将所述凭证换分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,并至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,通过所述遗漏概率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S13;
需要说明的是,所述校验区域根据所述凭证的必填信息的区域进行确定,其中所述凭证的必填信息根据所述凭证的凭证类型进行确定。
具体的举例说明,不同的凭证类型,其必填信息的区域是确定的,因此可以通过对凭证的凭证类型的分析,进而进行校验区域的确定。
具体的举例说明,如图3所示,所述凭证的遗漏概率确定的具体步骤为:
S31基于所述遗漏问题区域的图像的SURF特征确定遗漏问题区域的SURF遗漏概率,并基于所述遗漏问题区域的SURF遗漏概率的最大值确定是否需要总体评估,若是,则需要总体分析,若否,则进入步骤S32;
可以理解的是,SURF 特征属于尺度不变特征的,即不仅在任何尺度下拍摄的物体都能检测到一致的关键点,而且每个被检测的特征点都对应一个尺度因子。理想情况下,计算得到的两个尺度因子之间的比率应该等于图像尺度的比率。SURF特征,它的全称为加速稳健特征( Speeded Up Robust Feature ),它不仅是尺度不变特征,而且是具有较高计算效率的特征。
S32基于所述遗漏问题区域的SURF遗漏概率的和确定是否需要进一步分析,若是,则进入步骤S34,若否,则进入步骤S33;
S33基于所述遗漏问题区域的SURF遗漏概率以及遗漏问题区域的识别准确率,确定所述凭证的SURF遗漏概率,并基于所述凭证的SURF遗漏概率确定是否需要进一步分析,若是,则进入步骤S34,若否,则无需总体分析;
S34将所述遗漏问题区域的图像转换为灰度图像,并基于所述灰度图像进行灰度共生矩阵、熵值、LBP特征的提取,并基于所述灰度共生矩阵、熵值、LBP特征得到所述遗漏问题区域的纹理特征,基于所述遗漏问题区域的纹理特征得到所述遗漏问题区域的纹理遗漏概率,并基于所述纹理遗漏概率以及遗漏问题区域的识别准确率,得到所述凭证的纹理遗漏概率,并基于所述凭证的纹理遗漏概率以及所述凭证的SURF遗漏概率得到所述凭证的遗漏概率。
需要说明的是,所述凭证的遗漏概率的构建采用基于PSO-BP算法的模型进行确定,其中所述模型构建的具体步骤为:
步骤 1 数据预处理,将原始数据划分为两部分,其中所述原始数据的输入集为凭证的纹理遗漏概率以及所述凭证的SURF遗漏概率;输出集为凭证的遗漏概率;分别为实验训练样本数据和测试数据;
步骤 2 初始化 PSO 算法参数,包含建立迭代次数、种群规模、学习因子及其粒子位置和速度值区间;
步骤 3 确定适应度函数,通过初始化粒子信息对应的参数优化BP神经网络模型,通过模型训练计算得到适应值;
步骤 4 比较各粒子适应度函数,分别记录个体极值和全局极值;
步骤 5 更新惯性权重,然后不断更新粒子的速度和位置;
步骤 6 在满足PSO算法的最大迭代次数后,取参数的最优值进行训练和预测,以优化BP神经网络模型。如不满足条件,则转到步骤4继续迭代;
步骤 7 利用PSO优化后的BP神经网络模型对凭证的遗漏概率进行确定。
需要说明的是,输入集的具体表现方式为X={P1,P2},其中P1、P2分别为凭证的纹理遗漏概率以及所述凭证的SURF遗漏概率。
PSO算法的核心思想是:先在其搜索空间中初始化一组随机解,然后一步步迭代,找到需要的最优解。PSO神经网络模型的两个参数作为粒子在二维空间的寻优变量,通过不断更新粒子的速度和位置来计算目标函数的自适应值,从而实现全局最优,获得更好的模型参数。PSO 算法的速度和位置公式如下:
如果直接将传统PSO算法应用到模型中,很容易陷入局部最优,造成算法在寻优操作过程中陷入停滞,不能进一步预测精度。因此本发明针对传统PSO算法进行了如下改进。
改进惯性权重,PSO算法的收敛性取决于惯 性权重,当惯性权重较大时,PSO全局搜索寻优能力较强,而局部搜索寻优能力较弱;惯性权重较小时,其局部搜索寻优能力较强,而全局搜索寻优能力较弱。考虑到BP神经网络参数范围很大,PSO如果 采用其经典线性递减策略,则在迭代过程中容易陷入局部极值,不能找到最优解。为了解决这一问题,本发明研究针对PSO惯性权重采用了线性微分递减策略,公式为:
式中:t为迭代时刻;ω为惯性权重,ωmax为惯性权重的最大值,ωmin为惯性权重的最小值,tmax为最大迭代次数,且
进一步的,加入随机扰动因子,从而使得PSO算法的寻优效率和随机性得到进一步的加强,其中所述PSO算法的寻优公式为:
在算法迭代的早期阶段,线性微分递减策略使ω下降趋势缓慢,此时PSO全局搜索能力较强,在较大范围内能够得到合适的解;在算法迭代后期,线性微分递减策略使ω的下降趋势加快,这使得当PSO在早期阶段找到合适的解后,能进一步加快算法的收敛速度。
具体的举例说明,所述遗漏问题区域的识别准确率根据所述校验区域的历史识别的准确率进行确定,其中所述遗漏问题区域的识别准确率跟所述校验区域的填写内容以及所述遗漏问题区域的历史凭证的数量有关。
在本实施例中,通过利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,从而实现了对不同的校验区域的类型的划分,这也为差异性的进行遗漏概率和相似度的确定奠定了基础。
在本实施例中,通过基于纹理特征和SURF特征确定遗漏问题区域的局部遗漏概率,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,从而实现了从校验区域的图像的识别的角度对遗漏概率的准确评价,不仅实现了从总体的纹理角度以及细节的SURF特征对校验区域的图像特征的表征,进而提升了整体的准确性,并且通过遗漏概率的识别,也保证了存在遗漏可能的凭证的可靠性处理。
S13基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定需要总体分析时,进入步骤S14;
需要说明的是,目标图像为根据开票方或者受票方的所述错误问题区域中的标准填写方式形成的,可以作为对比图像,以实现对错误问题区域的错误概率的识别;
需要说明的是,可以通过马氏距离函数确定两者的偏差量,基于杰卡德相似系数确定两者的相似系数,并根据相似系数和偏差量实现对相似度的确定,并根据1与相似度的差值实现对错误概率的确定。
需要说明的是,当相似度较小时,则可以直接确定需要总体分析。
需要说明的是,可以采用上述的PSO-BP神经网络,基于所述相似度、问题率、遗漏概率,得到一个综合分析量,并根据该综合分析量确定是否需要进行总体分析。
在本实施例中,通过基于所述相似度、问题率、遗漏概率确定是否需要总体分析,从而实现了从多角度对凭证的评价,在保证校验效率的同时,也保证了存在问题的凭证能够得到全面的分析。
S14对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定是否进行自动补正,基于受票方以及开票方的历史凭证得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
具体的举例说明,对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定所述凭证的遗漏信息类型,通过所述遗漏信息类型确定是否进行自动补正,基于受票方以及开票方的历史凭证、所述凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
具体的举例说明,所述凭证的遗漏信息类型包括开票金额、数量、货物或者应税劳务或者服务名称、受票方信息以及开票方信息,并当所述遗漏信息类型为货物或者应税劳务或者服务名称、受票方信息以及开票方信息时,进行自动补正。
具体的举例说明,如图4所示,所述开票校验金额确定的具体步骤为:
S41基于所述凭证类型,确定开票方为所述受票方开具的相同的凭证类型的历史凭证的历史开票金额的最大值和最小值,并将其作为受票方最大值和受票方最小值;
S42基于所述凭证类型,确定开票方开具的相同的凭证类型的历史凭证的历史开票金额的最大值和最小值,并将其作为开票方最大值和开票方最小值;
S43基于所述开票方最大值以及所述受票方最大值得到开票校验金额的最大值,基于所述开票方最小值以及所述受票方最小值得到开票校验金额的最小值,并基于所述开票校验金额的最小值以及所述开票检验金额的最大值得到所述开票校验金额的范围。
具体的举例说明,当开票金额不在所述开票校验金额的范围内时,确定存在问题时,输出报警信息。
在本实施例中,通过基于受票方以及开票方的历史凭证、所述凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息,从而实现了对开票金额的错误的在线识别,不仅保证了对凭证的遗漏信息的识别,同时也避免了凭证的开票金额的错误导致的开票信息错误的自动识别,进而保证了凭证的准确性和完整性。
另一方面,如图5所示,本发明提供了本发明提供了一种凭证信息遗漏识别及处理系统,采用上述的一种凭证信息遗漏识别及处理方法,具体包括:
问题率确定模块;校验区域划分模块;遗漏概率确定模块;相似度评估模块;报警信息输出模块;
其中所述问题率确定模块负责基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率确定所述凭证的问题率;
所述校验区域划分模块负责将所述凭证划分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域;
所述遗漏概率确定模块负责至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率;
所述相似度评估模块负责基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定是否需要总体分析;
所述自动补正确定模块负责对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定所述凭证的遗漏信息类型,通过所述遗漏信息类型确定是否进行自动补正;
所述报警信息输出模块负责基于受票方以及开票方的历史凭证、所述凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
另一方面,如图6所示,本发明提供了本发明提供了一种凭证信息遗漏识别及处理系统,采用上述的一种凭证信息遗漏识别及处理方法,具体包括:
历史数据获取模块;图像分析模块;报警信息输出模块;
其中所述历史数据获取模块负责获取凭证的受票方的历史凭证的错误率,凭证的开票方的历史凭证的错误率和遗漏率,并进行是否需要总体分析的确定;
所述图像分析模块负责将所述凭证划分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域;至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率;基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定是否需要总体分析;
所述报警信息输出模块负责基于受票方以及开票方的历史凭证、所述凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
另一方面,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种凭证信息遗漏识别及处理方法。
具体的,其中所述一种凭证信息遗漏识别及处理方法具体包括:
基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率确定所述凭证的问题率,并基于所述问题率确定不需要总体分析时进入下一步骤;
将所述凭证划分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,并至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,当基于所述遗漏概率确定不需要总体分析时,进入下一步骤;
基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率,采用基于PSO-BP神经网络的评价模型得到综合评价值,并根据综合评价值确定需要总体分析时,进入下一步骤;
对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定是否进行自动补正,基于受票方以及开票方的历史凭证得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。。
具体的,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以 通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可 包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM (PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括 随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得, 诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强 型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM (RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (10)
1.一种凭证信息遗漏识别及处理方法,其特征在于,具体包括:
S11基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率确定所述凭证的问题率,并基于所述问题率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S12;
S12将所述凭证划分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,并至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,当基于所述遗漏概率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S13;
所述凭证的遗漏概率确定的具体步骤为:
S31基于所述遗漏问题区域的图像的SURF特征确定遗漏问题区域的SURF遗漏概率,并基于所述遗漏问题区域的SURF遗漏概率的最大值确定是否需要总体评估,若是,则需要总体分析,若否,则进入步骤S32;
S32基于所述遗漏问题区域的SURF遗漏概率的和确定是否需要进一步分析,若是,则进入步骤S34,若否,则进入步骤S33;
S33基于所述遗漏问题区域的SURF遗漏概率以及遗漏问题区域的识别准确率,确定所述凭证的SURF遗漏概率,并基于所述凭证的SURF遗漏概率确定是否需要进一步分析,若是,则进入步骤S34,若否,则无需总体分析;
S34将所述遗漏问题区域的图像转换为灰度图像,并基于所述灰度图像进行灰度共生矩阵、熵值、LBP特征的提取,并基于所述灰度共生矩阵、熵值、LBP特征得到所述遗漏问题区域的纹理特征,基于所述遗漏问题区域的纹理特征得到所述遗漏问题区域的纹理遗漏概率,并基于所述纹理遗漏概率以及遗漏问题区域的识别准确率,得到所述凭证的纹理遗漏概率,并基于所述凭证的纹理遗漏概率以及所述凭证的SURF遗漏概率得到所述凭证的遗漏概率;
所述凭证的遗漏概率的构建采用基于PSO-BP算法的模型进行确定,其中所述模型构建的具体步骤为:
步骤 1 数据预处理,将原始数据划分为两部分,其中所述原始数据的输入集为凭证的纹理遗漏概率以及所述凭证的SURF遗漏概率;输出集为凭证的遗漏概率;分别为实验训练样本数据和测试数据;
步骤 2 初始化 PSO 算法参数,包含建立迭代次数、种群规模、学习因子及其粒子位置和速度值区间;
步骤 3 确定适应度函数,通过初始化粒子信息对应的参数优化BP神经网络模型,通过模型训练计算得到适应值;
步骤 4 比较各粒子适应度函数,分别记录个体极值和全局极值;
步骤 5 更新惯性权重,然后不断更新粒子的速度和位置;
步骤 6 在满足PSO算法的最大迭代次数后,取参数的最优值进行训练和预测,以优化BP神经网络模型,如不满足条件,则转到步骤4继续迭代;
步骤 7 利用PSO优化后的BP神经网络模型对凭证的遗漏概率进行确定;
S13基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定需要总体分析时,进入步骤S14;
所述目标图像为根据开票方或者受票方的所述错误问题区域中的标准填写方式形成的图像;
S14对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定是否进行自动补正,基于受票方以及开票方的历史凭证得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息;
所述开票校验金额确定的具体步骤为:
基于凭证类型,确定开票方为所述受票方开具的相同的凭证类型的历史凭证的历史开票金额的最大值和最小值,并将其作为受票方最大值和受票方最小值;
基于凭证类型,确定开票方开具的相同的凭证类型的历史凭证的历史开票金额的最大值和最小值,并将其作为开票方最大值和开票方最小值;
基于所述开票方最大值以及所述受票方最大值得到开票校验金额的最大值,基于所述开票方最小值以及所述受票方最小值得到开票校验金额的最小值,并基于所述开票校验金额的最小值以及所述开票检验金额的最大值得到所述开票校验金额的范围。
2.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,所述受票方的历史凭证的错误率根据所述受票方的历史凭证的识别情况进行确定,具体的,根据所述受票方的历史凭证的购买方信息的错误情况进行确定,并当所述受票方的历史凭证的错误率大于错误率限定值时,确定需要对所述凭证进行总体分析。
3.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,基于所述问题率确定是否需要总体分析,具体包括:
基于所述凭证的开票方的历史凭证的错误率确定是否需要总体分析,若是,则需要总体分析,若否,则进入下一步骤;
基于所述凭证的开票方的历史凭证的遗漏率确定是否需要总体分析,若是,则需要总体分析,若否,则进入下一步骤;
基于所述凭证的开票方的历史凭证的错误率和遗漏率得到所述开票方的开票问题概率,并基于所述开票问题概率确定是否需要进一步的评估,若是,则进入下一步骤,若否,则确定不需要总体分析;
基于所述受票方的历史凭证的错误率以及所述开票方的开票问题概率得到问题率,并基于所述问题率确定是否需要总体分析。
4.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,在进行凭证的受票方的历史凭证的错误率的确认之前,当所述开票方的历史凭证的数量或者所述受票方的历史凭证的数量小于预设数量时,则直接确定需要进行总体分析。
5.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,所述校验区域根据所述凭证的必填信息的区域进行确定,其中所述凭证的必填信息根据所述凭证的凭证类型进行确定。
6.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,所述遗漏问题区域的识别准确率根据所述校验区域的历史识别的准确率进行确定,其中所述遗漏问题区域的识别准确率跟所述校验区域的填写内容以及所述遗漏问题区域的历史凭证的数量有关。
7.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,所述凭证的遗漏信息类型包括开票金额、数量、货物或者应税劳务或者服务名称、受票方信息以及开票方信息,并当所述遗漏信息类型为货物或者应税劳务或者服务名称、受票方信息以及开票方信息时,进行自动补正。
8.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,当开票金额不在所述开票校验金额的范围内时,确定存在问题时,输出报警信息。
9.一种凭证信息遗漏识别及处理系统,采用权利要求1-8任一项所述的一种凭证信息遗漏识别及处理方法,具体包括:
问题率确定模块;校验区域划分模块;遗漏概率确定模块;相似度评估模块;报警信息输出模块;
其中所述问题率确定模块负责基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率确定所述凭证的问题率;
所述校验区域划分模块负责将所述凭证划分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域;
所述遗漏概率确定模块负责至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率;
所述相似度评估模块负责基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定是否需要总体分析;
所述自动补正确定模块负责对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定所述凭证的遗漏信息类型,通过所述遗漏信息类型确定是否进行自动补正;
所述报警信息输出模块负责基于受票方以及开票方的历史凭证、凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
10.一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-8任一项所述的一种凭证信息遗漏识别及处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310624777.4A CN116362816B (zh) | 2023-05-30 | 2023-05-30 | 凭证信息遗漏识别及处理方法、系统与介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310624777.4A CN116362816B (zh) | 2023-05-30 | 2023-05-30 | 凭证信息遗漏识别及处理方法、系统与介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116362816A CN116362816A (zh) | 2023-06-30 |
CN116362816B true CN116362816B (zh) | 2023-09-26 |
Family
ID=86928541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310624777.4A Active CN116362816B (zh) | 2023-05-30 | 2023-05-30 | 凭证信息遗漏识别及处理方法、系统与介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116362816B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003242418A (ja) * | 2002-02-20 | 2003-08-29 | Fujitsu General Ltd | インボイス照合システム及びインボイス照合方法 |
CN109766778A (zh) * | 2018-12-19 | 2019-05-17 | 平安科技(深圳)有限公司 | 基于ocr技术的发票信息录入方法、装置、设备及存储介质 |
CN111127181A (zh) * | 2019-12-24 | 2020-05-08 | 中国建设银行股份有限公司 | 一种凭证记账方法和装置 |
WO2020155763A1 (zh) * | 2019-01-28 | 2020-08-06 | 平安科技(深圳)有限公司 | Ocr识别方法及其电子设备 |
CN111694843A (zh) * | 2020-05-28 | 2020-09-22 | 平安科技(深圳)有限公司 | 缺失号码检测方法、装置、电子设备及存储介质 |
JP6842219B1 (ja) * | 2020-04-30 | 2021-03-17 | 株式会社日本デジタル研究所 | 会計処理装置、会計処理プログラム、会計処理システム及び会計処理方法 |
CN113450077A (zh) * | 2021-07-06 | 2021-09-28 | 中国工商银行股份有限公司 | 一种外汇凭证的处理方法及装置 |
TW202139092A (zh) * | 2020-04-01 | 2021-10-16 | 領導力科技股份有限公司 | 憑證智能辨識系統及其方法 |
CN114444478A (zh) * | 2021-12-31 | 2022-05-06 | 石化盈科信息技术有限责任公司 | 一种凭证可视化方法、装置、电子设备及存储介质 |
CN115169284A (zh) * | 2022-09-07 | 2022-10-11 | 浙江爱信诺航天信息技术有限公司 | 基于视觉化分析的凭证信息遗漏填补方法 |
CN115205882A (zh) * | 2022-07-14 | 2022-10-18 | 厦门大学附属第一医院 | 一种医疗行业的费用支出凭证的智能识别和处理方法 |
-
2023
- 2023-05-30 CN CN202310624777.4A patent/CN116362816B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003242418A (ja) * | 2002-02-20 | 2003-08-29 | Fujitsu General Ltd | インボイス照合システム及びインボイス照合方法 |
CN109766778A (zh) * | 2018-12-19 | 2019-05-17 | 平安科技(深圳)有限公司 | 基于ocr技术的发票信息录入方法、装置、设备及存储介质 |
WO2020155763A1 (zh) * | 2019-01-28 | 2020-08-06 | 平安科技(深圳)有限公司 | Ocr识别方法及其电子设备 |
CN111127181A (zh) * | 2019-12-24 | 2020-05-08 | 中国建设银行股份有限公司 | 一种凭证记账方法和装置 |
TW202139092A (zh) * | 2020-04-01 | 2021-10-16 | 領導力科技股份有限公司 | 憑證智能辨識系統及其方法 |
JP6842219B1 (ja) * | 2020-04-30 | 2021-03-17 | 株式会社日本デジタル研究所 | 会計処理装置、会計処理プログラム、会計処理システム及び会計処理方法 |
CN111694843A (zh) * | 2020-05-28 | 2020-09-22 | 平安科技(深圳)有限公司 | 缺失号码检测方法、装置、电子设备及存储介质 |
CN113450077A (zh) * | 2021-07-06 | 2021-09-28 | 中国工商银行股份有限公司 | 一种外汇凭证的处理方法及装置 |
CN114444478A (zh) * | 2021-12-31 | 2022-05-06 | 石化盈科信息技术有限责任公司 | 一种凭证可视化方法、装置、电子设备及存储介质 |
CN115205882A (zh) * | 2022-07-14 | 2022-10-18 | 厦门大学附属第一医院 | 一种医疗行业的费用支出凭证的智能识别和处理方法 |
CN115169284A (zh) * | 2022-09-07 | 2022-10-11 | 浙江爱信诺航天信息技术有限公司 | 基于视觉化分析的凭证信息遗漏填补方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116362816A (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860674B (zh) | 样本类别识别方法、装置、计算机设备及存储介质 | |
US11816165B2 (en) | Identification of fields in documents with neural networks without templates | |
RU2695489C1 (ru) | Идентификация полей на изображении с использованием искусственного интеллекта | |
US20200065664A1 (en) | System and method of measuring the robustness of a deep neural network | |
CN111145006A (zh) | 基于用户画像的汽车金融反欺诈模型训练方法和装置 | |
CN113255496A (zh) | 基于区块链技术的财务费用报销管理方法 | |
CN114491282B (zh) | 一种基于云计算的异常用户行为分析方法及系统 | |
CN117236826B (zh) | 物流托盘的码放识别方法、装置、设备及存储介质 | |
CN116307671A (zh) | 风险预警方法、装置、计算机设备、存储介质 | |
CN116362816B (zh) | 凭证信息遗漏识别及处理方法、系统与介质 | |
CN114281991A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN116361726B (zh) | 一种基于多维大数据分析的数据处理方法 | |
CN114285587A (zh) | 域名鉴别方法和装置、域名分类模型的获取方法和装置 | |
CN111369417A (zh) | 一种基于技战法模型的案件线索获取方法及装置 | |
Keerthana et al. | Accurate prediction of fake job offers using machine learning | |
CN115170304A (zh) | 风险特征描述的提取方法和装置 | |
CN114663899A (zh) | 金融票据的处理方法、装置、设备及介质 | |
CN110907946B (zh) | 一种位移填补建模的方法和相关装置 | |
CN111754103A (zh) | 企业风险画像方法、装置、计算机设备和可读存储介质 | |
CN113239128B (zh) | 基于隐式特征的数据对分类方法、装置、设备和存储介质 | |
CN117372722B (zh) | 一种目标识别方法及识别系统 | |
CN110673888B (zh) | 用于配置文件的校验方法及装置 | |
CN113297850B (zh) | 基于区块链技术的跨部门财务支出管理方法 | |
CN114724150A (zh) | 业务信息智能检测方法、装置、计算机设备、介质和产品 | |
CN118053169A (zh) | 票据的录入方法和装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |