CN115240216A - 提高票据识别准确度的电子票据处理方法及装置 - Google Patents

提高票据识别准确度的电子票据处理方法及装置 Download PDF

Info

Publication number
CN115240216A
CN115240216A CN202210930134.8A CN202210930134A CN115240216A CN 115240216 A CN115240216 A CN 115240216A CN 202210930134 A CN202210930134 A CN 202210930134A CN 115240216 A CN115240216 A CN 115240216A
Authority
CN
China
Prior art keywords
data volume
identification
time length
standard data
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210930134.8A
Other languages
English (en)
Other versions
CN115240216B (zh
Inventor
李佳
宋志明
张春阳
杨成林
汪晓东
郭飞
李林
匡镕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Sanxiang Bank Co Ltd
Original Assignee
Hunan Sanxiang Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Sanxiang Bank Co Ltd filed Critical Hunan Sanxiang Bank Co Ltd
Priority to CN202210930134.8A priority Critical patent/CN115240216B/zh
Publication of CN115240216A publication Critical patent/CN115240216A/zh
Application granted granted Critical
Publication of CN115240216B publication Critical patent/CN115240216B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明涉及一种提高票据识别准确度的电子票据处理方法及装置,其中该方法包括:接收商业汇票,所述商业汇票内至少存在文字区域和印章区域;根据商业汇票内的文字区域和印章区域的数据量确定识别策略,对文字区域进行识别的时长设置为第一识别时长,对印章区域进行识别的时长设置为第二识别时长;在第一识别时长和第二识别时长内,基于所述识别策略对所述商业汇票进行识别。通过根据文字区域或印章区域内的数据量对识别策略进行调整,使得对于商业汇票上的内容进行识别时长和精准度进行综合评估,大大提高对于电子票据进行识别的识别效率和准确性。

Description

提高票据识别准确度的电子票据处理方法及装置
技术领域
本发明涉及票据处理技术领域,尤其涉及一种提高票据识别准确度的电子票据处理方法及装置。
背景技术
在金融业务中,存在大量的商业汇票等表单票据需要进行识别。目前在对票据识别模型进行训练时往往是基于单字符训练,并未考虑到票据打印位置偏移而使文字骑压在表格边线上的情况,导致现有的票据识别模型无法准确地对票据图像中的骑压在表格边线的文字进行识别。目前的表单票据识别中尚存在若干难题,如票据可能存在弯曲折叠的情况,导致文本行不平直,从而影响文字识别以及印章中的弯曲文本识别存在较大困难。
公开号为CN112446368A的专利文献公开了一种票据的处理方法,其包括获取原始票据图像;识别出所述原始票据图像中的文字区域;基于所述文字区域的尺寸信息,确定线条几何属性;根据所述线条几何属性,生成待添加线条,并将所述待添加线条添加至所述原始票据图像中,得到处理后票据图像。
但是票据中的文字区域、印章区域的处理效率仍然存在局限性,致使对于票据识别的准确度低。
发明内容
为此,本发明提供一种提高票据识别准确度的电子票据处理方法及装置,可以解决现有技术中存在处理效率存在局限的技术问题。
为实现上述目的,第一方面,本发明提供一种提高票据识别准确度的电子票据处理方法,包括:
接收商业汇票,所述商业汇票内至少存在文字区域和印章区域;
根据所述文字区域和印章区域的位置信息确定所述商业汇票的所属类型;
根据所述所属类型确定对商业汇票内的文字区域和印章区域的识别策略,对文字区域进行识别的时长设置为第一识别时长,对印章区域进行识别的时长设置为第二识别时长;
在第一识别时长和第二识别时长内,基于所述识别策略对所述商业汇票进行识别。
进一步地,设置有第一标准数据量D10和第二标准数据量D20,所述第一标准数据量用以表示文字区域的标准数据量,所述第二标准数据量用以表示盖章区域内的标准数据量,文字区域内的第一实际数据量设置为D1,盖章区域内的第二实际数据量为D2,分别比较第一实际数据量D1与第一标准数据量D10的关系以及第二实际数据量D2与第二标准数据量D20的关系,并根据比较结果确定识别策略。
进一步地,在根据比较结果确定识别策略时,若第一实际数据量D1≥第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,则第一模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2<第二标准数据量D20,则采用第二模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,或,第一实际数据量D1≥第一标准数据量D10,则采用第三模式对应的识别策略。
进一步地,第一模式对应的识别策略为:采用最短的第一识别时长和第二识别时长分别对文字区域和印章区域进行识别;
第二模式对应的识别策略为:采用最长的第一识别时长和第二识别时长分别对对文字区域和印章区域进行识别;
第三模式对应的识别策略为:若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20优先识别文字区域并采用最短的第一识别时长和最长的第二识别时长进行识别;
或,
当第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20时,优先识别盖章区域,并采用最短的第二识别时长和最长的第一识别时长进行识别。
进一步地,还包括:检测所述商业汇票中的折痕,确定所述折痕对所述文字区域的影响系数,并根据所述影响系数调整所述识别策略;
预先设置有基准折痕数量N0,NO≥1,当商业汇票中的折痕数量N≥基准折痕数量N0时,则表示识别难度增加,此时需要对商业汇票的第一识别时长和第二识别时长进行延长,在进行延长时的延长幅度是由影响系数k所决定,k=(N-N0)/N,并根据折痕的实际位置确定对第一识别时长进行延长和/或第二识别时长进行延长;
当折痕所在的位置同时贯穿了文字区域和盖章区域时,则利用影响系数k同时延长第一识别时长和第二识别时长;
当折痕所在的位置只贯穿了文字区域,则利用影响系数对第一识别时长进行延长;
当折痕所在的位置只贯穿了盖章区域,则利用影响系数k对第二识别时长进行延长;
利用影响系数k对第一识别时长进行延长,延长后的第一识别时长设置为T1′= T1×(1+k),其中T1表示为第一识别时长;
利用影响系数k对第二识别时长进行延长,延长后的第二识别时长设置为T2′= T2×(1+k),其中T2表示为第二识别时长。
另一方面,本发明还提供一种提高票据识别准确度的电子票据处理装置,包括:接收模块,用以接收商业汇票,所述商业汇票内至少存在文字区域和印章区域;
确定模块,用以根据商业汇票内的文字区域和印章区域的数据量确定识别策略,对文字区域进行识别的时长设置为第一识别时长,对印章区域进行识别的时长设置为第二识别时长;
识别模块,用以在第一识别时长和第二识别时长内,基于所述识别策略对所述商业汇票进行识别。
进一步地,所述第二确定模块内设置有第一标准数据量D10和第二标准数据量D20,所述第一标准数据量用以表示文字区域的标准数据量,所述第二标准数据量用以表示盖章区域内的标准数据量,文字区域内的第一实际数据量设置为D1,盖章区域内的第二实际数据量为D2,分别比较第一实际数据量D1与第一标准数据量D10的关系以及第二实际数据量D2与第二标准数据量D20的关系,并根据比较结果确定识别策略。
进一步地,所述第二确定模块在根据比较结果确定识别策略时,若第一实际数据量D1≥第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,则第一模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2<第二标准数据量D20,则采用第二模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,或,第一实际数据量D1≥第一标准数据量D10,则采用第三模式对应的识别策略。
进一步地,第一模式对应的识别策略为:采用最短的第一识别时长和第二识别时长分别对文字区域和印章区域进行识别;
第二模式对应的识别策略为:采用最长的第一识别时长和第二识别时长分别对对文字区域和印章区域进行识别;
第三模式对应的识别策略为:若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20优先识别文字区域并采用最短的第一识别时长和最长的第二识别时长进行识别;
或,
当第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20时,优先识别盖章区域,并采用最短的第二识别时长和最长的第一识别时长进行识别。
进一步地,还包括检测模块,所述检测模块用以检测所述商业汇票中的折痕,确定所述折痕对所述文字区域的影响系数,并根据所述影响系数调整所述识别策略;
预先设置有基准折痕数量N0,NO≥1,当商业汇票中的折痕数量N≥基准折痕数量N0时,则表示识别难度增加,此时需要对商业汇票的第一识别时长和第二识别时长进行延长,在进行延长时的延长幅度是由影响系数k所决定,k=(N-N0)/N,并根据折痕的实际位置确定对第一识别时长进行延长和/或第二识别时长进行延长;
当折痕所在的位置同时贯穿了文字区域和盖章区域时,则利用影响系数k同时延长第一识别时长和第二识别时长;
当折痕所在的位置只贯穿了文字区域,则利用影响系数对第一识别时长进行延长;
当折痕所在的位置只贯穿了盖章区域,则利用影响系数k对第二识别时长进行延长;
利用影响系数k对第一识别时长进行延长,延长后的第一识别时长设置为T1′= T1×(1+k),其中T1表示为第一识别时长;
利用影响系数k对第二识别时长进行延长,延长后的第二识别时长设置为T2′= T2×(1+k),其中T2表示为第二识别时长。
与现有技术相比,本发明的有益效果在于,通过根据文字区域或印章区域内的数据量对识别策略进行调整,使得对于商业汇票上的内容进行识别时长和精准度进行综合评估,大大提高对于票据进行识别的识别效率和准确性。
尤其,通过针对不同的情况设置不同的处理策略实现对于识别时长和识别优先级的优化,使得对于商业汇票内的文字区域和盖章区域进行有效识别,提高对于商业汇票的识别效率。
尤其,通过对于折痕的数量以及所在的位置进行判定,能够量化折痕对于票据识别难度的初步评估,使得对于第一识别时长和第二识别时长进行有效调整,使得进行对应区域的识别精准度大大提升,有效提高对于票据进行识别的准确性,提高识别效率。
附图说明
图1为本发明实施例提供的提高票据识别准确度的电子票据处理方法的流程示意图;
图2为本发明实施例提供的提高票据识别准确度的电子票据处理装置的结构示意图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,本发明实施例提供了一种提高票据识别准确度的电子票据处理方法,该方法包括:
步骤S100:接收商业汇票,所述商业汇票内至少存在文字区域和印章区域;
步骤S200:根据商业汇票内的文字区域和印章区域的数据量确定识别策略,对文字区域进行识别的时长设置为第一识别时长,对印章区域进行识别的时长设置为第二识别时长;
步骤S300:在第一识别时长和第二识别时长内,基于所述识别策略对所述商业汇票进行识别。
具体而言,在实际应用中,在对商业汇票进行识别的过程中,可以先识别商业汇票中的文字,还可以先识别商业汇票中的印章,还可以对商业汇票中的文字区域以及印章区域同时进行识别,并根据识别内容中数据量的多少确定采用的识别策略;在实际应用中对于商业汇票中的文字进行识别时,设置有多种识别方法,且不同的识别方法对应的准确度和第一识别时长是不同的,在实际应用中,若是识别精度越高,则所使用的第一识别时长越长,在对印章区域进行识别过程中,同样存在识别准确度和第二识别时长的博弈,即识别准确度越高,则第二识别时长越长,在对文字区域进行识别时,可以采用分数据块识别、分行识别和分区域识别,其中数据块组成行,行组成区域,因此数据块识别的识别精度高于分行识别的识别精度高于分区域识别的识别精度,在对印章区域进行识别的过程中包括尺寸调整、文本校正、文本一次识别和文本二次识别,但是在实际识别过程中包含上述四个步骤的识别准确度最高,但是同样第二识别时长也最长,在实际应用中,用户可以根据实际需要进行尺寸调整以及文本一次识别的加入或剔除,当对印章区域不做尺寸调整或文本一次识别时,则识别准确度略微下降,但是第二识别时长也会相应地缩短。
具体而言,本发明实施例根据商业汇票的类型后,根据所属类型对应的标准数据量与商业汇票内的实际数据量进行比较,根据比较结果调整识别策略内的识别过程中的步骤增减。
具体而言,本发明实施例中对于每个商业汇票的处理时间是定量的,若是任意商业汇票处理的时间过长都会影响后续商业汇票的处理时间,导致后续商业汇票处理时间的延后,在实际应用中为了保证每个商业汇票的处理时间是均衡的。在实际应用中设置有第一标准数据量D10和第二标准数据量D20,其中第一标准数据量用以表示文字区域的标准数据量,所述第二标准数据量用以表示盖章区域内的标准数据量,本发明实施例中的文字区域内的第一实际数据量设置为D1,盖章区域内的第二实际数据量为D2,分别比较第一实际数据量D1与第一标准数据量D10的关系以及第二实际数据量D2与第二标准数据量D20的关系,并根据比较结果确定识别策略。
具体而言,在根据比较结果确定识别策略时,若第一实际数据量D1≥第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,则第一模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2<第二标准数据量D20,则采用第二模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,或,第一实际数据量D1≥第一标准数据量D10,则采用第三模式对应的识别策略。
具体而言,本发明实施例通过根据文字区域或印章区域内的数据量对识别策略进行调整,使得对于商业汇票上的内容进行识别时长和精准度进行综合评估,大大提高对于票据进行识别的识别效率和准确性。
具体而言,第一模式对应的识别策略为:采用最短的第一识别时长和第二识别时长分别对文字区域和印章区域进行识别;
第二模式对应的识别策略为:采用最长的第一识别时长和第二识别时长分别对对文字区域和印章区域进行识别;
第三模式对应的识别策略为:若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20优先识别文字区域并采用最短的第一识别时长和最长的第二识别时长进行识别;
或,
当第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20时,优先识别盖章区域,并采用最短的第二识别时长和最长的第一识别时长进行识别。
具体而言,本发明实施例通过针对不同的情况设置不同的处理策略实现对于识别时长和识别优先级的优化,使得对于商业汇票内的文字区域和盖章区域进行有效识别,提高对于商业汇票的识别效率。
具体而言,在步骤S400之前,还包括:检测所述商业汇票中的折痕,确定所述折痕对所述文字区域的影响系数,并根据所述影响系数调整所述识别策略。
具体而言,本发明实施预先设置有基准折痕数量N0,NO≥1,当商业汇票中的折痕数量N≥基准折痕数量N0时,则表示识别难度增加,此时需要对商业汇票的第一识别时长和第二识别时长进行延长,在进行延长时的延长幅度是由影响系数k所决定,k=(N-N0)/N,并根据折痕的实际位置确定对第一识别时长进行延长和/或第二识别时长进行延长;
当折痕所在的位置同时贯穿了文字区域和盖章区域时,则利用影响系数k同时延长第一识别时长和第二识别时长;
当折痕所在的位置只贯穿了文字区域,则利用影响系数对第一识别时长进行延长;
当折痕所在的位置只贯穿了盖章区域,则利用影响系数k对第二识别时长进行延长;
利用影响系数k对第一识别时长进行延长,延长后的第一识别时长设置为T1′= T1×(1+k),其中T1表示为第一识别时长;
利用影响系数k对第二识别时长进行延长,延长后的第二识别时长设置为T2′= T2×(1+k),其中T2表示为第二识别时长。
具体而言,本发明实施例通过对于折痕的数量以及所在的位置进行判定,能够量化折痕对于票据识别难度的初步评估,使得对于第一识别时长和第二识别时长进行有效调整,使得进行对应区域的识别精准度大大提升,有效提高对于票据进行识别的准确性,提高识别效率。
具体而言,如图2所示,本发明实施例提供了一种提高票据识别准确度的电子票据处理装置,包括:
接收模块10,用以接收商业汇票,所述商业汇票内至少存在文字区域和印章区域;
确定模块20,用以根据商业汇票文字区域和印章区域的数据量确定识别策略,对文字区域进行识别的时长设置为第一识别时长,对印章区域进行识别的时长设置为第二识别时长;
识别模块30,用以在第一识别时长和第二识别时长内,基于所述识别策略对所述商业汇票进行识别。
具体而言,所述确定模块内设置有第一标准数据量D10和第二标准数据量D20,所述第一标准数据量用以表示文字区域的标准数据量,所述第二标准数据量用以表示盖章区域内的标准数据量,文字区域内的第一实际数据量设置为D1,盖章区域内的第二实际数据量为D2,分别比较第一实际数据量D1与第一标准数据量D10的关系以及第二实际数据量D2与第二标准数据量D20的关系,并根据比较结果确定识别策略。
具体而言,所述确定模块在根据比较结果确定识别策略时,若第一实际数据量D1≥第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,则第一模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2<第二标准数据量D20,则采用第二模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,或,第一实际数据量D1≥第一标准数据量D10,则采用第三模式对应的识别策略。
具体而言,第一模式对应的识别策略为:采用最短的第一识别时长和第二识别时长分别对文字区域和印章区域进行识别;
第二模式对应的识别策略为:采用最长的第一识别时长和第二识别时长分别对对文字区域和印章区域进行识别;
第三模式对应的识别策略为:若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20优先识别文字区域并采用最短的第一识别时长和最长的第二识别时长进行识别;
或,
当第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20时,优先识别盖章区域,并采用最短的第二识别时长和最长的第一识别时长进行识别。
具体而言,还包括检测模块40,所述检测模块用以检测所述商业汇票中的折痕,确定所述折痕对所述文字区域的影响系数,并根据所述影响系数调整所述识别策略;
预先设置有基准折痕数量N0,NO≥1,当商业汇票中的折痕数量N≥基准折痕数量N0时,则表示识别难度增加,此时需要对商业汇票的第一识别时长和第二识别时长进行延长,在进行延长时的延长幅度是由影响系数k所决定,k=(N-N0)/N,并根据折痕的实际位置确定对第一识别时长进行延长和/或第二识别时长进行延长;
当折痕所在的位置同时贯穿了文字区域和盖章区域时,则利用影响系数k同时延长第一识别时长和第二识别时长;
当折痕所在的位置只贯穿了文字区域,则利用影响系数对第一识别时长进行延长;
当折痕所在的位置只贯穿了盖章区域,则利用影响系数k对第二识别时长进行延长;
利用影响系数k对第一识别时长进行延长,延长后的第一识别时长设置为T1′= T1×(1+k),其中T1表示为第一识别时长;
利用影响系数k对第二识别时长进行延长,延长后的第二识别时长设置为T2′= T2×(1+k),其中T2表示为第二识别时长。
具体而言,本发明实施例中提供的提高票据识别准确度的电子票据处理装置,为上述实施例提供的提高票据识别准确度的电子票据处理方法对应的装置,具有相同的技术手段,能够达到相同的技术效果,在此不再赘述。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种提高票据识别准确度的电子票据处理方法,其特征在于,包括:
接收商业汇票,所述商业汇票内至少存在文字区域和印章区域;
根据商业汇票内的文字区域和印章区域的数据量确定识别策略,对文字区域进行识别的时长设置为第一识别时长,对印章区域进行识别的时长设置为第二识别时长;
在第一识别时长和第二识别时长内,基于所述识别策略对所述商业汇票进行识别;
在进行识别之前,还包括:检测所述商业汇票中的折痕,确定所述折痕对所述文字区域的影响系数,并根据所述影响系数调整所述识别策略;
预先设置有基准折痕数量N0,NO≥1,当商业汇票中的折痕数量N≥基准折痕数量N0时,则表示识别难度增加,此时需要对商业汇票的第一识别时长和第二识别时长进行延长,在进行延长时的延长幅度是由影响系数k所决定,k=(N-N0)/N,并根据折痕的实际位置确定对第一识别时长进行延长和/或第二识别时长进行延长;
当折痕所在的位置同时贯穿文字区域和盖章区域时,则利用影响系数k同时延长第一识别时长和第二识别时长;
当折痕所在的位置只贯穿文字区域,则利用影响系数对第一识别时长进行延长;
当折痕所在的位置只贯穿盖章区域,则利用影响系数k对第二识别时长进行延长。
2.根据权利要求1所述的提高票据识别准确度的电子票据处理方法,其特征在于,
设置有第一标准数据量D10和第二标准数据量D20,所述第一标准数据量用以表示文字区域的标准数据量,所述第二标准数据量用以表示盖章区域内的标准数据量,文字区域内的第一实际数据量设置为D1,盖章区域内的第二实际数据量为D2,分别比较第一实际数据量D1与第一标准数据量D10的关系以及第二实际数据量D2与第二标准数据量D20的关系,并根据比较结果确定识别策略。
3.根据权利要求2所述的提高票据识别准确度的电子票据处理方法,其特征在于,
在根据比较结果确定识别策略时,若第一实际数据量D1≥第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,则第一模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2<第二标准数据量D20,则采用第二模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,或,第一实际数据量D1≥第一标准数据量D10,则采用第三模式对应的识别策略。
4.根据权利要求3所述的提高票据识别准确度的电子票据处理方法,其特征在于,
第一模式对应的识别策略为:采用最短的第一识别时长和第二识别时长分别对文字区域和印章区域进行识别;
第二模式对应的识别策略为:采用最长的第一识别时长和第二识别时长分别对对文字区域和印章区域进行识别;
第三模式对应的识别策略为:若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20优先识别文字区域并采用最短的第一识别时长和最长的第二识别时长进行识别;
或,
当第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20时,优先识别盖章区域,并采用最短的第二识别时长和最长的第一识别时长进行识别。
5.根据权利要求2所述的提高票据识别准确度的电子票据处理方法,其特征在于,
利用影响系数k对第一识别时长进行延长,延长后的第一识别时长设置为T1′= T1×(1+k),其中T1表示为第一识别时长;
利用影响系数k对第二识别时长进行延长,延长后的第二识别时长设置为T2′= T2×(1+k),其中T2表示为第二识别时长。
6.一种应用权利要求1-5任一项所述的提高票据识别准确度的电子票据处理装置,其特征在于,
接收模块,用以接收商业汇票,所述商业汇票内至少存在文字区域和印章区域;
确定模块,用以根据商业汇票文字区域和印章区域的数据量确定识别策略,对文字区域进行识别的时长设置为第一识别时长,对印章区域进行识别的时长设置为第二识别时长;
识别模块,用以在第一识别时长和第二识别时长内,基于所述识别策略对所述商业汇票进行识别。
7.根据权利要求6所述的提高票据识别准确度的电子票据处理装置,其特征在于,
所述确定模块内设置有第一标准数据量D10和第二标准数据量D20,所述第一标准数据量用以表示文字区域的标准数据量,所述第二标准数据量用以表示盖章区域内的标准数据量,文字区域内的第一实际数据量设置为D1,盖章区域内的第二实际数据量为D2,分别比较第一实际数据量D1与第一标准数据量D10的关系以及第二实际数据量D2与第二标准数据量D20的关系,并根据比较结果确定识别策略。
8.根据权利要求7所述的提高票据识别准确度的电子票据处理装置,其特征在于,
所述确定模块在根据比较结果确定识别策略时,若第一实际数据量D1≥第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,则第一模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2<第二标准数据量D20,则采用第二模式对应的识别策略;
若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20,或,第一实际数据量D1≥第一标准数据量D10,则采用第三模式对应的识别策略。
9.根据权利要求8所述的提高票据识别准确度的电子票据处理装置,其特征在于,
第一模式对应的识别策略为:采用最短的第一识别时长和第二识别时长分别对文字区域和印章区域进行识别;
第二模式对应的识别策略为:采用最长的第一识别时长和第二识别时长分别对对文字区域和印章区域进行识别;
第三模式对应的识别策略为:若第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20优先识别文字区域并采用最短的第一识别时长和最长的第二识别时长进行识别;
或,
当第一实际数据量D1<第一标准数据量D10且第二实际数据量D2≥第二标准数据量D20时,优先识别盖章区域,并采用最短的第二识别时长和最长的第一识别时长进行识别。
10.根据权利要求9所述的提高票据识别准确度的电子票据处理装置,其特征在于,还包括检测模块,所述检测模块用以检测所述商业汇票中的折痕,确定所述折痕对所述文字区域的影响系数,并根据所述影响系数调整所述识别策略;
预先设置有基准折痕数量N0,NO≥1,当商业汇票中的折痕数量N≥基准折痕数量N0时,则表示识别难度增加,此时需要对商业汇票的第一识别时长和第二识别时长进行延长,在进行延长时的延长幅度是由影响系数k所决定,k=(N-N0)/N,并根据折痕的实际位置确定对第一识别时长进行延长和/或第二识别时长进行延长;
当折痕所在的位置同时贯穿了文字区域和盖章区域时,则利用影响系数k同时延长第一识别时长和第二识别时长;
当折痕所在的位置只贯穿了文字区域,则利用影响系数对第一识别时长进行延长;
当折痕所在的位置只贯穿了盖章区域,则利用影响系数k对第二识别时长进行延长;
利用影响系数k对第一识别时长进行延长,延长后的第一识别时长设置为T1′= T1×(1+k),其中T1表示为第一识别时长;
利用影响系数k对第二识别时长进行延长,延长后的第二识别时长设置为T2′= T2×(1+k),其中T2表示为第二识别时长。
CN202210930134.8A 2022-08-04 2022-08-04 提高票据识别准确度的电子票据处理方法及装置 Active CN115240216B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210930134.8A CN115240216B (zh) 2022-08-04 2022-08-04 提高票据识别准确度的电子票据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210930134.8A CN115240216B (zh) 2022-08-04 2022-08-04 提高票据识别准确度的电子票据处理方法及装置

Publications (2)

Publication Number Publication Date
CN115240216A true CN115240216A (zh) 2022-10-25
CN115240216B CN115240216B (zh) 2023-07-04

Family

ID=83679668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210930134.8A Active CN115240216B (zh) 2022-08-04 2022-08-04 提高票据识别准确度的电子票据处理方法及装置

Country Status (1)

Country Link
CN (1) CN115240216B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323553A (ja) * 2003-03-05 2003-11-14 Hitachi Ltd 帳票処理方法およびシステム
JP2006121310A (ja) * 2004-10-20 2006-05-11 Oki Electric Ind Co Ltd 文書画像処理装置
JP2006202075A (ja) * 2005-01-21 2006-08-03 Mars Engineering Corp 紙幣識別装置および紙幣識別方法
EP2228768A1 (en) * 2009-03-13 2010-09-15 Omron Corporation Image processing device and image processing method
CN105551133A (zh) * 2015-11-16 2016-05-04 新达通科技股份有限公司 一种纸币拼接缝或折痕的识别方法及系统
CN111859469A (zh) * 2020-08-10 2020-10-30 福州智闽科技有限公司 一种集成虚拟时钟的印章戳及防伪方法
CN114241469A (zh) * 2021-12-23 2022-03-25 广东工业大学 一种面向电表轮换过程的信息识别方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323553A (ja) * 2003-03-05 2003-11-14 Hitachi Ltd 帳票処理方法およびシステム
JP2006121310A (ja) * 2004-10-20 2006-05-11 Oki Electric Ind Co Ltd 文書画像処理装置
JP2006202075A (ja) * 2005-01-21 2006-08-03 Mars Engineering Corp 紙幣識別装置および紙幣識別方法
EP2228768A1 (en) * 2009-03-13 2010-09-15 Omron Corporation Image processing device and image processing method
CN105551133A (zh) * 2015-11-16 2016-05-04 新达通科技股份有限公司 一种纸币拼接缝或折痕的识别方法及系统
CN111859469A (zh) * 2020-08-10 2020-10-30 福州智闽科技有限公司 一种集成虚拟时钟的印章戳及防伪方法
CN114241469A (zh) * 2021-12-23 2022-03-25 广东工业大学 一种面向电表轮换过程的信息识别方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUANGMING LU等: ""Palmprint recognition using eigenpalms features"", vol. 24, no. 9, XP085040914, DOI: 10.1016/S0167-8655(02)00386-0 *
郑祖兵等: ""双网络模型下的智能医疗票据识别方法"", vol. 56, no. 12 *

Also Published As

Publication number Publication date
CN115240216B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
CN109658584B (zh) 一种票据信息识别方法及装置
CN105243730B (zh) 纸币识别方法及系统
US20190188527A1 (en) Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks
US9008431B2 (en) Character string extraction method and character string extraction device
US8041115B2 (en) Method and apparatus for determining a classification boundary for an object classifier
US8588520B2 (en) Character recognition method, character recognition apparatus, and character recognition program
JP2019003421A (ja) 本人確認書類の真偽判定システム、方法およびプログラム
WO2020220575A1 (zh) 证件识别方法和装置、电子设备、计算机可读存储介质
CN115171124B (zh) 用于手写汉字识别的文本分割方法
CN102222226A (zh) 一种基于先验分析的迭代式车牌字符分割方法
EP3511912A1 (en) Currency classification device and currency classification method
JP5110793B2 (ja) 帳票識別装置
CN115240216A (zh) 提高票据识别准确度的电子票据处理方法及装置
CN111797667A (zh) 图像处理设备、图像处理方法和非暂态计算机可读介质
CN103907339A (zh) 文档文件输出装置、文档文件输出方法、以及计算机程序
JP2003109007A (ja) 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
CN112016564A (zh) 一种金融票据小写金额处最优二值化阈值的计算方法
CN106845488A (zh) 一种车牌图像处理方法及装置
CN106886777A (zh) 一种字符边界确定方法及装置
CN111814625A (zh) 智能交通事故处理方法及相关装置
CN111626106A (zh) 一种摄像头车辆检测率统计方法及装置
CN114719791B (zh) 基于图像处理的电机闭口槽冲片的平整度测量方法
JP4730084B2 (ja) 印刷装置及びそのダンプ印刷方法
JP3353215B2 (ja) 帳票書式識別方法及び装置
TW202014968A (zh) 一種基於行動載具之智能理賠系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant