CN114612919B - 一种票据信息处理系统及方法、装置 - Google Patents
一种票据信息处理系统及方法、装置 Download PDFInfo
- Publication number
- CN114612919B CN114612919B CN202210292943.0A CN202210292943A CN114612919B CN 114612919 B CN114612919 B CN 114612919B CN 202210292943 A CN202210292943 A CN 202210292943A CN 114612919 B CN114612919 B CN 114612919B
- Authority
- CN
- China
- Prior art keywords
- character
- bill
- semantic information
- information
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000010365 information processing Effects 0.000 title claims abstract description 48
- 238000003672 processing method Methods 0.000 claims description 25
- 238000012795 verification Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 238000013145 classification model Methods 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 23
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及一种票据信息处理系统及方法、装置,该方法包括获取待录入票据信息的纸质票据图像;将所述待录入票据信息的纸质票据图像输入至设定的字符窗口识别模型中,输出所述纸质票据图像中各个字符的识别窗口尺寸;对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的语义信息和字符类别;根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板;将所述字符类别为手写字符的语义信息录入所述电子票据模板中,以实现所述纸质票据图像的票据信息录入。本发明能够适应不同类型格式的纸质票据的信息识别,确定各类型格式的纸质票据的电子模板,有效提高各类格式票据信息的识别准确率。
Description
技术领域
本发明适用于财务管理领域,尤其涉及一种票据信息处理系统及方法、装置。
背景技术
票据指各种有价证券和凭证,如股票、企业债券、发票、提单等,现有将票据信息录入系统时,通常采用人工录入的方式,操作量大,票据信息处理效率较低,因此,为了提供工作效率,现有技术中存在采用人工智能算法对票据图像进行处理,进而提高票据信息处理的效率。
但是,上述票据信息智能处理方法的不足之处在于,该方法通常只能对于一种固定格式票据进行信息识别,才能保证具有较高的识别准确性,然而现有的纸质票据应用场景较为丰富,因而纸质票据的格式多样,且纸质票据内手写字符的语义信息复杂,导致现有智能票据信息识别方法对各类格式票据信息的识别准确率低下。
发明内容
有鉴于此,本发明实施例提供了一种票据信息处理系统及方法、装置,以解决现有智能票据信息识别方法对各类格式票据信息的识别准确率低下的问题。
第一方面,提供一种票据信息处理方法,所述方法包括:
获取待录入票据信息的纸质票据图像;
将所述待录入票据信息的纸质票据图像输入至设定的字符窗口识别模型中,输出所述纸质票据图像中各个字符的识别窗口尺寸;
对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的语义信息和字符类别;
根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板;
将所述字符类别为手写字符的语义信息录入所述电子票据模板中,以实现所述纸质票据图像的票据信息录入。
第二方面,提供一种票据信息处理装置,所述装置包括:
图像采集模块,用于获取待录入票据信息的纸质票据图像;
窗口识别模块,用于将所述待录入票据信息的纸质票据图像输入至设定的字符窗口识别模型中,输出所述纸质票据图像中各个字符的识别窗口尺寸;
语义信息和字符类别识别模块,用于对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的语义信息和字符类别;
模板筛选模块,用于根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板;
信息录入模块,用于将所述字符类别为手写字符的语义信息录入所述电子票据模板中,以实现所述纸质票据图像的票据信息录入。
第三方面,本发明实施例提供一种票据信息处理系统,所述系统包括:
摄像头,所述摄像头用于获取待录入票据信息的纸质票据图像;
处理器,所述处理器与所述摄像头连接,所述处理器用于在执行计算机程序时实现如第一方面中所述的票据信息处理方法。
本发明与现有技术相比存在的有益效果是:通过设置的字符窗口识别模型,动态调整纸质票据图像中的各个字符识别窗口,既能够避免包含单个字符的局部图像内存在干扰信息,也能够以适应不同类型格式的纸质票据的信息识别,确定各类型格式的纸质票据的电子模板,有效提高各类格式票据信息的识别准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种票据信息处理方法的一应用环境示意图;
图2是本发明实施例一提供的一种票据信息处理方法的流程示意图;
图3是本发明实施例二提供的确定纸质票据图像的电子票据模板的流程示意图;
图4是本发明实施例三提供的一种票据信息处理方法的流程示意图;
图5是本发明实施例四提供的一种票据信息处理装置的结构示意图;
图6是本发明实施例五提供的一种票据信息处理系统的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本发明说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本发明说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本发明说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本发明的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
应理解,以下实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
本发明实施例一提供的一种基于人工智能的票据信息处理方法,可应用在如图1的应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、云端终端设备、个人数字助理(personal digital assistant,PDA)等终端设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
参见图2,是本发明实施例一提供的一种基于人工智能的票据信息处理方法的流程示意图,上述票据信息处理方法可以应用于图1中的服务端,该票据信息处理方法可以包括以下步骤:
步骤S10:获取待录入票据信息的纸质票据图像。
本步骤中,纸质票据图像可采用相机、移动终端等图像采集设备进行采集,在图像采集时应使纸质票据平铺于平面上,并使摄像头光轴垂直于所述平面,以避免视差问题导致后续识别准确率的降低。
步骤S20:将所述待录入票据信息的纸质票据图像输入至设定的字符窗口识别模型中,输出所述纸质票据图像中各个字符的识别窗口尺寸。
本步骤中,上述的字符窗口识别模型包括字符完整度回归网络模型和字符窗口调节模型,其中所述字符完整度回归网络模型为训练好的第一神经网络模型,字符完整度回归网络模型的输入端用于输入基础初始窗口尺寸下对纸质票据图像截取的若干个局部图像,字符完整度回归网络模型的输出端用于输出各个局部图像内的字符完整度。
所述字符窗口调节模型用于根据各个局部图像内的字符完整度,对各个局部图像的识别窗口进行尺寸调整,调整后得到所述纸质票据图像中各个字符的识别窗口尺寸。
具体的,所述字符完整度回归网络模型包括第一编码器和第一全连接层,所述第一编码器的输入端用于输入所述基础初始窗口尺寸下对纸质票据图像截取的若干个局部图像,所述第一编码器的输出端连接所述第一全连接层的输入端,所述第一全连接层的输出端用于输出所述各个局部图像内的字符完整度。
其中,上述字符完整度回归网络模型的训练过程如下:
(1)获取训练数据集,所述训练数据集的获取过程包括:
设置初始识别窗口尺寸,建议设置为3*3大小,并以步长为1的方式进行滑动,滑动截取纸质票据图像的若干个局部图像,各局部图像的尺寸可能不同,例如尺寸为3*3、4*4、5*5、6*6或7*7等;
采用多个填充为统一尺寸大小(例如尺寸统一为9*9)的纸质票据局部图像作为训练数据集,由人为进行字符完整度标注作为标签数据,字符完整度的标注取值范围为[0,1]。
(2)损失函数采用均方误差损失函数,对上述字符完整度回归网络模型进行训练。
上述字符完整度回归网络模型训练完成后,利用该模型对待录入票据信息的纸质票据图像进行处理,得到基于初始窗口尺寸下各个纸质票据局部图像的字符完整度,所述字符窗口调节模型用于根据各个局部图像内的字符完整度,对各个局部图像的识别窗口进行尺寸调整,具体调整过程包括:
步骤S201:保留字符完整度在[0.9,1]范围内的纸质票据局部图像,采用非极大抑制算法对所保留的纸质票据局部图像进行筛选,以避免字符重复识别。
步骤S202:对于字符完整度在[0,0.9)范围内的纸质票据局部图像,固定各个纸质票据局部图像的中心点,以此中心点为基准调整(如扩张)识别窗口尺寸,尺寸包括5*5、7*7和9*9,重新确调整后各识别窗口尺寸对应的字符完整度,选择其中最大字符完整度对应的识别窗口作为优化识别窗口,保留该优化识别窗口下的纸质票据局部图像。
步骤S203:对于所有被保留纸质票据局部图像的识别窗口,判断任两个识别窗口的位置交集面积与该两个识别窗口中任一个识别窗口面积的比值,若存在比值为1,判定所述两个识别窗口存在包含关系,保留其中识别窗口尺寸较小的识别窗口,筛选掉另外一个尺寸较大的识别窗口。
步骤S30:对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的语义信息和字符类别。
本步骤中,采用现有技术中的OCR字符识别算法对步骤S20中确定的各个识别窗口中字符的语义信息进行识别。
本步骤中,采用设定的字符类别分类模型确定各个识别窗口中的字符类别,所述字符类别分类模型为训练好的第二神经网络模型,该字符类别分类模型的结构包括第二编码器和第二全连接层,所述第二编码器的输入端用于输入各个识别窗口内的纸质票据局部图像数据,所述第二编码器的输出端连接所述第二全连接层的输入端,所述第二全连接层的输出端用于输出各识别窗口内各个字符的字符类别,所述字符类别包括印刷字符和手写字符。
具体的,所述字符类别分类模型的训练过程如下:
(1)获取训练数据集,即采用多张识别窗口内的纸质票据局部图像数据作为训练样本,由人为进行字符类别标注,作为样本的标签数据。
(2)损失函数采用交叉熵损失函数,对上述字符类别分类模型进行训练。
步骤S40:根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板。
步骤S50:将所述字符类别为手写字符的语义信息录入所述电子票据模板中,以实现所述纸质票据图像的票据信息录入。
本实施例的票据信息处理方法,通过设置的字符完整度回归网络模型和字符窗口调节模型,动态调整纸质票据图像中的各个字符识别窗口,既能够避免包含单个字符的局部图像内存在干扰信息,也能够以适应不同类型格式的纸质票据的信息识别,确定各类型格式的纸质票据的电子模板,进而提高各类格式票据信息的识别准确率。
在实施例二中,提供一种基于人工智能的票据信息处理方法,该方法与实施例一中方法的不同之处在于,如图3所示,在步骤S40中,根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板包括:
步骤S401:根据所述字符类别为印刷字符的语义信息,确定印刷字符的结构化网络。
其中,采用现有技术中的图结构构建方法确定印刷字符的结构化网络,具体确定过程包括:在图结构中用一个节点表示单个印刷字符,每个节点的数值表示单个印刷字符的语义信息,在图结构中确定出多个印刷字符的节点后,对每个印刷字符节点均选择与其距离最接近的两个印刷字符节点,分别生成两条连线,连线的数值表示两节点对应印刷字符的图像中心点距离,得到由所有印刷字符连线的结构化网络。
步骤S402:将所述印刷字符的结构化网络与各个电子票据模板的第一标准结构化网络进行匹配,确定出与所述印刷字符的结构化网络的匹配结果为相似度最高的第一标准结构化网络,从而确定出与待录入票据信息的纸质票据图像匹配的电子票据模板。
本实施例中,采用印刷字符的结构化网络比对的方式确定电子票据模板,而不直接采用印刷字符的各个语义信息确定电子票据模板,其好处在于,在步骤S30中,对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的字符类别可能存在识别错误的情况,即该字符的字符类别实际是手写字符,但被误识别为印刷字符,在这种情况下,直接采用印刷字符的各个语义信息,会存在无法确定出正确的电子票据模板,而采用结构化网络比对的方式,则不会受单个字符类别识别错误的影响,根据结构化网络的相似度比对,仍然能够准确的确定出电子票据模板。
在实施例三中,如图4所示,提供一种基于人工智能的票据信息处理方法,该方法包括以下步骤:
步骤S10:获取待录入票据信息的纸质票据图像。
步骤S20:将所述待录入票据信息的纸质票据图像输入至设定的字符窗口识别模型中,输出所述纸质票据中各个字符的识别窗口尺寸。
步骤S30:对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的语义信息和字符类别。
步骤S40:根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板。
步骤S45:利用字符类别为手写字符的历史语义信息,对所述字符类别为手写字符的语义信息进行差异验证,当所述字符类别为手写字符的语义信息与所述历史语义信息之间的差异程度在设定阈值范围内,判定所述字符类别为手写字符的语义信息验证通过。
本步骤中,利用字符类别为手写字符的历史语义信息,对所述字符类别为手写字符的语义信息进行差异验证包括:
步骤S451:通过步骤S30获取各个字符类别为手写字符的语义信息,将各个字符类别为手写字符的语义信息输入至手写字符的历史语义信息数据库中,检索得到对应的手写字符的历史语义信息。
步骤S452:确定字符类别为手写字符的语义信息与其对应历史语义信息之间的相似度,将所述相似度作为所述字符类别为手写字符的语义信息与所述历史语义信息之间的差异程度。
其中,确定字符类别为手写字符的语义信息与其对应历史语义信息之间的相似度包括:
根据所述字符类别为手写字符的语义信息,确定手写字符的结构化网络;计算所述手写字符的结构化网络与对应电子票据模板的第二标准结构化网络之间的余弦相似度(或者为欧氏距离),从而得到手写字符的语义信息与其对应历史语义信息之间的相似度。
上述的电子票据模板具有两个标准结构化网络,其中第一标准结构化网络为印刷字符的结构化网络,第二标准结构化网络为手写字符的结构化网络。
上述手写字符的结构化网络具体实现过程与实施例二的步骤S401中印刷字符的结构化网络实现过程类似,本实施例中不再赘述。
步骤S453:当差异程度在设定阈值范围内,判定所述字符类别为手写字符的语义信息验证通过。
在一示例中,设定阈值范围可人为设定,例如为[0.5,1];在另一示例中,可根据手写字符的语义信息与其对应若干个时间段下历史语义信息之间的相似度均值,确定上述阈值范围。例如,确定的相似度均值k1,则上述阈值范围为[k1,1]。
在另一示例中,可根据若干个时间段下历史语义信息之间的相似度均值,确定上述阈值范围。上述阈值范围的具体确定过程如下:
按照时间的先后顺序,确定N个时间段(如12个月份)下历史语义信息之间的相似度,其中第i(i=2…,N)个时间段下历史语义信息与第i-1个时间段下历史语义信息之间的相似度确定方法,包括:
获取第i个时间段下手写字符的历史语义信息的结构化网络,以及第i-1个时间段下手写字符的历史语义信息的结构化网络;计算第i个时间段下、第i-1个时间段下手写字符的历史语义信息的结构化网络的余弦相似度,相似度取值范围为[0,1],0表示完全不相似,1表示完全相似,计算N-1个余弦相似度的均值k2,得到设定阈值范围为[k2,1]。
可选的,在进行步骤S452之前,还包括对字符类别为手写字符的语义信息进行领域判别,当字符类别为手写字符的语义信息的所属领域为设定领域时,则进行步骤S452和步骤S453的验证过程;当字符类别为手写字符的语义信息的所属领域不为设定领域时,判定手写字符的语义信息识别错误,不进行后续步骤S452和步骤S453的验证过程,并生成第一提示信息,以提示识别错误,进行人工票据录入;若未获取到相关信息,不进行后续验证,并生成第二提示信息,以提示人工确认,进行人工录入。
举例说明,当字符类别为手写字符的语义信息为与农业相关的交易信息、支出信息,则其所属领域为农业领域,进行步骤S452和步骤S453中的验证过程;当字符类别为手写字符的语义信息为非农业相关的交易信息、支出信息,则其所属领域为非农业领域,不进行后续步骤S452和步骤S453的验证过程,并生成第一提示信息,以提示识别错误。
步骤S50:将所述字符类别为手写字符的语义信息录入所述电子票据模板中,以实现所述纸质票据图像的票据信息录入。
本步骤中,对经过验证后的手写字符的语义信息进行票据信息录入,录入方法采用常规数据库存储方法实现,例如MySQL数据库等,在此不作赘述。
本实施例中的步骤S10至步骤S40的过程与实施例一中的步骤S10至步骤S40的过程相同,因此本实施例中不对步骤S10至步骤S40的具体实现过程进行赘述。
与实施例一中的票据信息处理方法相比,本实施例中的票据信息处理方法的优点在于,加入了手写字符的语义信息验证过程,根据字符语义的相关信息,在进行农业类票据信息处理时,基于数据库中所存储的历史农业类票据信息进行验证,避免出现误识别的情况,进一步提高了识别的准确率。
对应于上文实施例的方法,图5示出了本发明实施例四提供的票据信息处理装置的结构框图,上述票据信息处理装置应用于终端设备,该装置包括:
图像采集模块51,用于获取待录入票据信息的纸质票据图像;
窗口识别模块52,用于将所述待录入票据信息的纸质票据图像输入至设定的字符窗口识别模型中,输出所述纸质票据图像中各个字符的识别窗口尺寸;
语义信息和字符类别识别模块53,用于对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的语义信息和字符类别;
模板筛选模块54,用于根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板;
信息录入模块55,用于将所述字符类别为手写字符的语义信息录入所述电子票据模板中,以实现所述纸质票据图像的票据信息录入。
可选的是,所述字符窗口识别模型包括字符完整度回归网络模型和字符窗口调节模型,所述字符完整度回归网络模型为训练好的第一神经网络模型,所述字符完整度回归网络模型的输入端用于输入在基础初始窗口尺寸下对纸质票据图像截取的若干个局部图像,所述字符完整度回归网络模型的输出端用于输出各个局部图像内的字符完整度;
所述字符窗口调节模型用于根据各个局部图像内的字符完整度,对各个局部图像的识别窗口进行尺寸调整,调整后得到所述纸质票据图像中各个字符的识别窗口尺寸。
可选的是,所述字符完整度回归网络模型包括第一编码器和第一全连接层,所述第一编码器的输入端用于输入所述基础初始窗口尺寸下对纸质票据图像截取的若干个局部图像,所述第一编码器的输出端连接所述第一全连接层的输入端,所述第一全连接层的输出端用于输出所述各个局部图像内的字符完整度。
可选的是,上述语义信息和字符类别识别模块53中,采用设定的字符类别分类模型确定所述字符类别,所述字符类别分类模型为训练好的第二神经网络模型,所述字符类别分类模型的结构包括第二编码器和第二全连接层,所述第二编码器的输入端用于输入各个识别窗口内的纸质票据局部图像数据,所述第二编码器的输出端连接所述第二全连接层的输入端,所述第二全连接层的输出端用于输出各识别窗口内各个字符的字符类别,所述字符类别包括印刷字符和手写字符。
可选的是,上述模板筛选模块54中包括:
结构化网络生成模块,用于根据所述字符类别为印刷字符的语义信息,确定印刷字符的结构化网络;
网络匹配筛选模块,用于将所述印刷字符的结构化网络与各个电子票据模板的第一标准结构化网络进行匹配,确定出与所述印刷字符的结构化网络的匹配结果为相似度最高的第一标准结构化网络,确定出与待录入票据信息的纸质票据图像匹配的电子票据模板。
可选的是,上述装置还包括:
历史语音信息搜索模块,用于获取各个字符类别为手写字符的语义信息,将各个字符类别为手写字符的语义信息输入至手写字符的历史语义信息数据库中,检索得到对应的手写字符的历史语义信息;
差异计算模块,用于确定字符类别为手写字符的语义信息与其对应历史语义信息之间的相似度,将所述相似度作为所述字符类别为手写字符的语义信息与所述历史语义信息之间的差异程度;
验证模块,用于当所述差异程度在设定阈值范围内,判定所述字符类别为手写字符的语义信息验证通过。
可选的是,上述装置还包括:
第一阈值范围确定模块,用于根据所述手写字符的语义信息与其对应若干个时间段下手写字符的历史语义信息之间的相似度均值,确定所述设定阈值范围。
可选的是,上述装置还包括:
第二阈值范围确定模块,用于获取第i个时间段下手写字符的历史语义信息的结构化网络,以及第i-1个时间段下手写字符的历史语义信息的结构化网络,i=2…,N,N>2;计算第i个时间段下、第i-1个时间段下手写字符的历史语义信息的结构化网络之间的余弦相似度,计算N-1个所述余弦相似度的均值k2,得到设定阈值范围为[k2,1]。
需要说明的是,上述模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图6为本发明实施例四提供的一种票据信息处理系统的结构示意图。如图6所示,该票据信息处理系统包括输入装置(即摄像头)和处理器,其中输入装置用于获取待录入票据信息的纸质票据图像;处理器与输入装置连接,处理器用于在执行计算机程序时实现实施例一至实施例三中任意一种票据信息处理方法。
该票据信息处理系统可包括,但不仅限于,处理器、输入装置、存储器。本领域技术人员可以理解,图6仅仅是票据信息处理系统的举例,并不构成对票据信息处理系统的限定,票据信息处理系统可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括网络接口、显示屏等。
所称处理器可以是CPU,该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器包括可读存储介质、内存储器等,其中,内存储器可以是终端设备的内存,内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是终端设备的硬盘,在另一些实施例中也可以是终端设备的外部存储设备,例如,终端设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器还可以既包括终端设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本发明实现上述实施例方法中的全部或部分流程,也可以通过一种计算机程序产品来完成,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/系统和方法,可以通过其它的方式实现。例如,以上所描述的装置/系统实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (8)
1.一种票据信息处理方法,其特征在于,所述方法包括以下步骤:
获取待录入票据信息的纸质票据图像;
将所述待录入票据信息的纸质票据图像输入至设定的字符窗口识别模型中,输出所述纸质票据图像中各个字符的识别窗口尺寸;
对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的语义信息和字符类别;
根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板;
将所述字符类别为手写字符的语义信息录入所述电子票据模板中,以实现所述纸质票据图像的票据信息录入;
所述字符窗口识别模型包括字符完整度回归网络模型和字符窗口调节模型,所述字符完整度回归网络模型为训练好的第一神经网络模型,所述字符完整度回归网络模型的输入端用于输入在基础初始窗口尺寸下对纸质票据图像截取的若干个局部图像,所述字符完整度回归网络模型的输出端用于输出各个局部图像内的字符完整度;
所述字符窗口调节模型用于根据各个局部图像内的字符完整度,对各个局部图像的识别窗口进行尺寸调整,调整后得到所述纸质票据图像中各个字符的识别窗口尺寸;
所述字符完整度回归网络模型包括第一编码器和第一全连接层,所述第一编码器的输入端用于输入所述基础初始窗口尺寸下对纸质票据图像截取的若干个局部图像,所述第一编码器的输出端连接所述第一全连接层的输入端,所述第一全连接层的输出端用于输出所述各个局部图像内的字符完整度。
2.根据权利要求1所述的票据信息处理方法,其特征在于,采用设定的字符类别分类模型确定所述字符类别,所述字符类别分类模型为训练好的第二神经网络模型,所述字符类别分类模型的结构包括第二编码器和第二全连接层,所述第二编码器的输入端用于输入各个识别窗口内的纸质票据局部图像数据,所述第二编码器的输出端连接所述第二全连接层的输入端,所述第二全连接层的输出端用于输出各识别窗口内各个字符的字符类别,所述字符类别包括印刷字符和手写字符。
3.根据权利要求1所述的票据信息处理方法,其特征在于,根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板包括:
根据所述字符类别为印刷字符的语义信息,确定印刷字符的结构化网络;
将所述印刷字符的结构化网络与各个电子票据模板的第一标准结构化网络进行匹配,确定出与所述印刷字符的结构化网络的匹配结果为相似度最高的第一标准结构化网络,确定出与待录入票据信息的纸质票据图像匹配的电子票据模板。
4.根据权利要求1所述的票据信息处理方法,其特征在于,在所述电子票据模板中录入所述手写字符的语义信息之前,还包括:
获取各个字符类别为手写字符的语义信息,将各个字符类别为手写字符的语义信息输入至手写字符的历史语义信息数据库中,检索得到对应的手写字符的历史语义信息;
确定字符类别为手写字符的语义信息与其对应历史语义信息之间的相似度,将所述相似度作为所述字符类别为手写字符的语义信息与所述历史语义信息之间的差异程度;
当所述差异程度在设定阈值范围内,判定所述字符类别为手写字符的语义信息验证通过。
5.根据权利要求4所述的票据信息处理方法,其特征在于,根据所述手写字符的语义信息与其对应若干个时间段下手写字符的历史语义信息之间的相似度均值,确定所述设定阈值范围。
6.根据权利要求4所述的票据信息处理方法,其特征在于,所述设定阈值范围的确定步骤如下:
获取第i个时间段下手写字符的历史语义信息的结构化网络,以及第i-1个时间段下手写字符的历史语义信息的结构化网络,i=2…,N,N>2;计算第i个时间段下、第i-1个时间段下手写字符的历史语义信息的结构化网络之间的余弦相似度,计算N-1个所述余弦相似度的均值k2,得到设定阈值范围为[k2,1]。
7.一种票据信息处理装置,其特征在于,所述装置包括:
图像采集模块,用于获取待录入票据信息的纸质票据图像;
窗口识别模块,用于将所述待录入票据信息的纸质票据图像输入至设定的字符窗口识别模型中,输出所述纸质票据图像中各个字符的识别窗口尺寸;
语义信息和字符类别识别模块,用于对所述各个字符的识别窗口尺寸内的纸质票据图像进行字符识别,确定各个字符的语义信息和字符类别;
模板筛选模块,用于根据所述字符类别为印刷字符的语义信息,确定所述纸质票据图像的电子票据模板;
信息录入模块,用于将所述字符类别为手写字符的语义信息录入所述电子票据模板中,以实现所述纸质票据图像的票据信息录入;
所述字符窗口识别模型包括字符完整度回归网络模型和字符窗口调节模型,所述字符完整度回归网络模型为训练好的第一神经网络模型,所述字符完整度回归网络模型的输入端用于输入在基础初始窗口尺寸下对纸质票据图像截取的若干个局部图像,所述字符完整度回归网络模型的输出端用于输出各个局部图像内的字符完整度;
所述字符窗口调节模型用于根据各个局部图像内的字符完整度,对各个局部图像的识别窗口进行尺寸调整,调整后得到所述纸质票据图像中各个字符的识别窗口尺寸;
所述字符完整度回归网络模型包括第一编码器和第一全连接层,所述第一编码器的输入端用于输入所述基础初始窗口尺寸下对纸质票据图像截取的若干个局部图像,所述第一编码器的输出端连接所述第一全连接层的输入端,所述第一全连接层的输出端用于输出所述各个局部图像内的字符完整度。
8.一种票据信息处理系统,其特征在于,所述系统包括:
摄像头,所述摄像头用于获取待录入票据信息的纸质票据图像;
处理器,所述处理器与所述摄像头连接,所述处理器用于在执行计算机程序时实现如权利要求1至6任一项所述的票据信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210292943.0A CN114612919B (zh) | 2022-03-23 | 2022-03-23 | 一种票据信息处理系统及方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210292943.0A CN114612919B (zh) | 2022-03-23 | 2022-03-23 | 一种票据信息处理系统及方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114612919A CN114612919A (zh) | 2022-06-10 |
CN114612919B true CN114612919B (zh) | 2024-06-28 |
Family
ID=81865098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210292943.0A Active CN114612919B (zh) | 2022-03-23 | 2022-03-23 | 一种票据信息处理系统及方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114612919B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115640952B (zh) * | 2022-08-29 | 2023-09-26 | 格莱杰(深圳)科技有限公司 | 一种数据导入上传的方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258198A (zh) * | 2013-04-26 | 2013-08-21 | 四川大学 | 一种表格文档图像中字符提取方法 |
CN109710907A (zh) * | 2018-12-20 | 2019-05-03 | 平安科技(深圳)有限公司 | 一种电子文档的生成方法及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783760B (zh) * | 2020-06-30 | 2023-08-08 | 北京百度网讯科技有限公司 | 文字识别的方法、装置、电子设备及计算机可读存储介质 |
-
2022
- 2022-03-23 CN CN202210292943.0A patent/CN114612919B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258198A (zh) * | 2013-04-26 | 2013-08-21 | 四川大学 | 一种表格文档图像中字符提取方法 |
CN109710907A (zh) * | 2018-12-20 | 2019-05-03 | 平安科技(深圳)有限公司 | 一种电子文档的生成方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114612919A (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086756B (zh) | 一种基于深度神经网络的文本检测分析方法、装置及设备 | |
CN112862024B (zh) | 一种文本识别方法及系统 | |
CN111144079B (zh) | 一种智能获取学习资源的方法、装置、打印机和存储介质 | |
CN111353491A (zh) | 一种文字方向确定方法、装置、设备及存储介质 | |
CN110796210A (zh) | 一种标签信息的识别方法及装置 | |
CN113837151A (zh) | 表格图像处理方法、装置、计算机设备及可读存储介质 | |
CN110781856A (zh) | 异质人脸识别模型训练方法、人脸识别方法及相关装置 | |
CN114612919B (zh) | 一种票据信息处理系统及方法、装置 | |
CN112232336A (zh) | 一种证件识别方法、装置、设备及存储介质 | |
CN113705468B (zh) | 基于人工智能的数字图像识别方法及相关设备 | |
CN111931557B (zh) | 瓶装饮品的规格识别方法、装置、终端设备及可读存介质 | |
CN111414889B (zh) | 基于文字识别的财务报表识别方法及装置 | |
CN114491134B (zh) | 一种商标注册成功率分析方法及系统 | |
CN113221907B (zh) | 一种车辆部件分割方法、装置、设备及存储介质 | |
CN115618019A (zh) | 知识图谱构建方法、装置及终端设备 | |
CN111291726B (zh) | 医疗票据分拣方法、装置、设备和介质 | |
US11335108B2 (en) | System and method to recognise characters from an image | |
CN113343968A (zh) | 多模板证书快速审证方法、系统、介质及装置 | |
CN109493868B (zh) | 基于语音识别的保单录入方法和相关装置 | |
JP2021125040A (ja) | 帳票仕分システム、帳票仕分方法、及びプログラム | |
CN113887441B (zh) | 一种表格数据处理方法、装置、设备及存储介质 | |
CN117351508A (zh) | 保险场景的身份信息核验方法、装置、设备及介质 | |
CN116467419A (zh) | 基于人工智能的对话生成方法、装置、计算机设备及介质 | |
CN117746443A (zh) | 手写体文字识别方法、装置、设备及存储介质 | |
Wan | Invoice Recognition System based on Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |