CN118072321A - 发票信息识别方法、装置、设备及存储介质 - Google Patents

发票信息识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN118072321A
CN118072321A CN202410240650.7A CN202410240650A CN118072321A CN 118072321 A CN118072321 A CN 118072321A CN 202410240650 A CN202410240650 A CN 202410240650A CN 118072321 A CN118072321 A CN 118072321A
Authority
CN
China
Prior art keywords
invoice
information
text
image
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410240650.7A
Other languages
English (en)
Inventor
吴燕度
李姗姗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jialing Technology Co ltd
Original Assignee
Shenzhen Jialing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jialing Technology Co ltd filed Critical Shenzhen Jialing Technology Co ltd
Priority to CN202410240650.7A priority Critical patent/CN118072321A/zh
Publication of CN118072321A publication Critical patent/CN118072321A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明涉及发票识别领域,公开一种发票信息识别方法、装置、设备及存储介质,该方法包括:获取待识别发票图像;判断待识别发票图像是否属于格式模板库中的标准发票格式;若否,则将待识别发票图像输入至预设信息提取模型,获得待识别发票图像对应的发票文字信息;对发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。由于本发明是先判断待识别发票图像是否为标准发票格式,并在并非格式模板库中的标准发票格式时,由预设信息提取模型进行发票文字信息的提取,采用预设语义规则进行数据结构化处理,从而获得发票识别文本,能够实现对复杂多样格式发票信息的灵活识别,进而提升发票信息识别效果。

Description

发票信息识别方法、装置、设备及存储介质
技术领域
本发明涉及发票识别技术领域,尤其涉及一种发票信息识别方法、装置、设备及存储介质。
背景技术
随着数字化和自动化的需求不断增长,发票识别技术成为提高企业效率,降低成本的重要工具,典型的发票识别方式旨在通过自动识别和提取发票上的文字以实现自动化的信息识别。
然而,现有的发票识别方式多基于开源光学字符识别(Optical CharacterRecognition,OCR)工具进行文字提取,难以适用于复杂的发票样式,由于识别灵活度较低进而影响识别效果。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是相关技术。
发明内容
本发明的主要目的在于提供了一种发票信息识别方法、装置、设备及存储介质,旨在解决现有的基于开源OCR工具实现发票文字提取的方式难以适应于复杂多样的发票样式,识别灵活性较低进而导致的识别效果较差的技术问题。
为实现上述目的,本发明提供了一种发票信息识别方法,所述方法包括以下步骤:
获取待识别发票图像;
判断所述待识别发票图像是否属于格式模板库中的标准发票格式;
若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息;
对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
可选地,所述判断所述待识别发票图像是否属于格式模板库中的标准发票格式,包括:
提取所述待识别发票图像中的若干个文字区域以及边框线段,获得当前版式信息,其中所述当前版式信息包括各所述文字区域与各所述边框线段在所述待识别发票图像中的分布位置;
根据所述当前版式信息在所述格式模板库中进行匹配,并根据匹配结果判断是否存在对应所述待识别发票图像的标准发票格式。
可选地,所述根据所述当前版式信息在所述格式模板库中进行匹配,并根据匹配结果判断是否存在对应所述待识别发票图像的标准发票格式之后,还包括:
若是,则获取所述标准发票格式对应的格式模板,所述格式模板中包括若干个待填补字段域;
根据所述格式模板对所述待识别发票图像进行文字内容提取,并根据提取信息对各所述待填补字段域进行补全,获得发票识别文本。
可选地,所述获取待识别发票图像,包括:
接收用户上传的原始发票图像;
对所述原始发票图像进行预处理操作,所述预处理操作包括图像去噪、尺寸调节;
将经过预处理操作的所述原始发票图像作为所述待识别发票图像。
可选地,所述对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本之前,包括:
确定所述发票文字信息中包含的语种类别,并判断各所述语种类别中是否存在非标准语种类别;
若是,则对所述非标准语种类别对应的文本段进行翻译处理,获得标准语种类别的发票文字信息;
相应地,所述对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本,包括:
对所述标准语种类别的发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
可选地,所述对所述标准语种类别的发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本,包括:
通过预设语义规则对所述标准语种类别的发票文字信息进行格式转换,获得标准格式的发票文字信息;
对所述标准格式的发票文字信息进行逻辑验证,判断所述发票文字信息是否存在信息异常;
根据异常判定结果确定发票识别文本。
可选地,所述根据异常判定结果确定发票识别文本,包括:
在所述发票文字信息存在信息异常时,定位并标注对应的异常字段以使用户对所述异常字段进行复核;
或,在所述发票文字信息不存在信息异常时,将所述发票文字信息确定为发票识别文本。
此外,为实现上述目的,本发明还提出一种发票信息识别装置,所述装置包括:
图像获取模块,用于获取待识别发票图像;
图像判断模块,用于判断所述待识别发票图像是否属于格式模板库中的标准发票格式;
信息提取模块,用于若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息;
文本生成模块,用于对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
此外,为实现上述目的,本发明还提出一种发票信息识别设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的发票信息识别程序,所述发票信息识别程序配置为实现如上文所述的发票信息识别方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储发票信息识别程序,所述发票信息识别程序被处理器执行时实现如上文所述的发票信息识别方法的步骤。
本发明公开一种发票信息识别方法,通过获取待识别发票图像;判断所述待识别发票图像是否属于格式模板库中的标准发票格式;若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息;对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。由于本发明是先判断待识别发票图像是否为标准发票格式,并在并非格式模板库中的标准发票格式时,由预设信息提取模型进行发票文字信息的提取,采用预设语义规则进行数据结构化处理,从而获得发票识别文本,能够实现对复杂多样格式下发票的信息识别,提高发票识别的灵活性,进而提升发票信息识别效果。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的发票信息识别设备结构示意图;
图2为本发明发票信息识别方法第一实施例的流程示意图;
图3为本发明发票信息识别方法第二实施例的流程示意图;
图4为本发明发票信息识别方法第三实施例的流程示意图;
图5为本发明发票信息识别装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的发票信息识别设备结构示意图。
如图1所示,该发票信息识别设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对发票信息识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及发票信息识别程序。
在图1所示的发票信息识别设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明发票信息识别设备中的处理器1001、存储器1005可以设置在发票信息识别设备中,所述发票信息识别设备通过处理器1001调用存储器1005中存储的发票信息识别程序,并执行本发明实施例提供的发票信息识别方法。
本发明实施例提供了一种发票信息识别方法,参照图2,图2为本发明发票信息识别方法第一实施例的流程示意图。
本实施例中,所述发票信息识别方法包括以下步骤:
步骤S10:获取待识别发票图像。
需要说明的是,本实施例方法可以应用在对发票识别的场景中,本实施例方法的执行主体可以为具有数据处理、网络通信以及程序运行功能的计算服务设备,例如手机、平板电脑、个人电脑等,还可以是能够实现相同或相似功能的其他电子设备。以下以上述发票信息识别设备(简称识别设备)对本实施例和下述各实施例进行说明。
可以理解的是,该待识别发票图像可以是由用户上传的PDF形式的发票扫描图像,还可以是由用户直接拍摄所得的发票图像,本实施例对此不加以限制。
步骤S20:判断所述待识别发票图像是否属于格式模板库中的标准发票格式。
可以理解的是,格式模板库可以是基于网络或是当前场景中的历史发票信息采集整合得到的,该格式模板库中可以包含若干个常见的标准发票格式,有利于后续对不同类型发票格式的待识别发票图像进行文字识别。
还需说明的是,为了进一步说明对待识别发票图像对应的发票格式类型的判断过程,步骤S20,还包括:
步骤S201:提取所述待识别发票图像中的若干个文字区域以及边框线段,获得当前版式信息。
可以理解的是,其中所述当前版式信息包括各所述文字区域与各所述边框线段在所述待识别发票图像中的分布位置。
应该理解的是,在待识别发票图像中,每一个文字段可以对应有单元文字区域,距离较近的单元文字区域可以合并为一整个文字区域。边框线段可以由例如霍夫直线变换(Hough Transform)算法对待识别发票图像中的直线段进行提取所得。
步骤S202:根据所述当前版式信息在所述格式模板库中进行匹配,并根据匹配结果判断是否存在对应所述待识别发票图像的标准发票格式。
可以理解的是,所述格式模板库中包括若干个标准发票格式,其中各标准发票格式对应有自身的版式信息,作为用于进行匹配的标准版式信息。将各标准版式信息与当前版式信息顺次进行相似度匹配,判断是否存在匹配度大于预设阈值的标准版式信息,其中该预设阈值可以设置为例如:75%或其他数值。
应该理解的是,若存在匹配度大于预设阈值的标准版式信息,则存在并将其对应的发票格式作为所述待识别发票图像对应的标准发票格式;若不存在匹配度大于预设阈值的标准版式信息,则所述格式模板库中不存在对应所述待识别发票图像的标准发票格式。
进一步地,若存在匹配度大于预设阈值的标准版式信息,步骤S202之后,包括:
步骤S31:若是,则获取所述标准发票格式对应的格式模板,所述格式模板中包括若干个待填补字段域。
可以理解的是,在存在匹配度大于预设阈值的标准版式信息时,则可以直接获取对应的格式模板。其中格式模板中包括若干个待填补字段域,该待填补字段域可以为空白的信息框,分布在格式模板中各位置并用于进行对应位置的文字内容提取。
步骤S32:根据所述格式模板对所述待识别发票图像进行文字内容提取,并根据提取信息对各所述待填补字段域进行补全,获得发票识别文本。
可以理解的是,由于格式模板中预先包括了用于进行文字内容提取的各待填补字段域,从而在处理标准发票格式对应的待识别发票图像时,能够采用预先设置的格式模板进行内容提取,直接获得发票识别文本,有利于实现对标准格式的发票的快速准确识别。
步骤S30:若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息。
可以理解的是,该预设信息提取模型可以是经过训练的深度学习模型,该深度学习模型可以采用卷积神经网络(Convolutional Neural Network,CNN)以及循环神经网络(Recurrent Neural Network,RNN)或是Transformer相结合。其中CNN可以用于图像处理,RNN或Transformer可以用于文本理解。
还需说明的是,可以预先采集不同光照、不同尺寸或是不同角度的发票图像构建训练集以进行模型训练,有利于提升获得的预设信息提取模型的泛化能力。
应该理解的是,通过预设信息提取模型,可以对不属于格式模板库中的标准发票格式对应的待识别发票图像进行内容提取,有利于提升对非标准格式的发票的识别效率,实现对复杂多样的发票格式的灵活识别。
在具体实现中,在待识别发票图像不属于格式模板库中的标准发票格式时,可以通过预设信息提取模型对待识别发票图像上的文字信息进行文本识别,将其识别为可处理的文本数据。
步骤S40:对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
可以理解的是,该预设语义规则可以是由用户预先设置的或是基于历史发票数据处理经验确定的数据处理规则,通过该预设语义规则可以将发票文字信息转换为具有标准格式的发票识别文本,有利于提高获得的发票识别文本的数据质量。
本实施例中,通过获取待识别发票图像;判断所述待识别发票图像是否属于格式模板库中的标准发票格式;若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息;对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。由于本实施例是先判断待识别发票图像是否为标准发票格式,并在并非格式模板库中的标准发票格式时,由预设信息提取模型进行发票文字信息的提取,采用预设语义规则进行数据结构化处理,从而获得发票识别文本;在待识别发票图像为标准发票格式时,获取所述标准发票格式对应的格式模板以进行文字内容提取,能够实现对复杂多样格式下不同发票的信息识别,提高发票识别的灵活性,进而提升发票信息识别效果。
参照图3,图3为本发明发票信息识别方法第二实施例的流程示意图。
基于上述实施例,在本实施例中,为了增强后续对待识别发票图像的识别效率,进一步地,步骤S10,包括:
步骤S101:接收用户上传的原始发票图像。
步骤S102:对所述原始发票图像进行预处理操作,所述预处理操作包括图像去噪、尺寸调节。
可以理解的是,由于原始发票图像可以为用户在不同光照场景下采用不同拍照设备进行获取的,原始发票图像可以以不同的角度和方向出现,因此该预处理操作还可以包括对原始发票图像进行角度矫正、图像缩放裁剪等尺寸调节处理。
应该理解的是,该图像去噪过程可以采用常见的去噪算法,例如小波去噪、均值去噪和中值滤波等,以减少发票图像中可能存在的噪声,提高原始发票图像的质量,该图像去噪过程中还可以采用光照不变性处理方式进一步提升对不同光照场景下图像去噪效果。
步骤S103:将经过预处理操作的所述原始发票图像作为所述待识别发票图像。
在具体实现中,识别设备在获取到用户上传的原始发票图像之后,为了便于提升识别效率,可以对来源各异的原始发票图像进行例如图像去噪、角度矫正等图像预处理,并将处理后的所述原始发票图像作为待识别发票图像。
进一步地,为了提高发票识别的多样性,实现对多语言发票的识别,步骤S40之前,还包括:
步骤S001:确定所述发票文字信息中包含的语种类别,并判断各所述语种类别中是否存在非标准语种类别。
应该理解的是,由于本申请方法还可以应用于国际化业务场景中的发票识别,因此提取得到的发票文字信息中可以包括多语种类别,例如中文类别、英文类别或是其他语种类别。
可以理解的是,可以根据当前业务环境的差异,将不同的语种类别区分为标准语种类别和非标准语种类别,例如若当前业务环境主要为中文环境,则可以将中文语种类别确定为标准语种类别,则非中文语种类别为非标准语种类别。
在具体实现中,可以对由预设信息提取模型提取得到的发票文字信息进行语种识别,判断该发票文字信息中是否存在非中文语种类别的文字段。
步骤S002:若是,则对所述非标准语种类别对应的文本段进行翻译处理,获得标准语种类别的发票文字信息。
可以理解的是,在发票文字信息中存在非标准语种类别的文字段,可以对该文字段翻译为标准语种类别的发票文字信息,有利于进一步提升后续获得的发票识别文本的语义准确度,且便于用户清楚知悉所述待识别发票的文字内容。
相应地,所述步骤S40,包括:
步骤S400:对所述标准语种类别的发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
在具体实现中,对标准语种类别的发票文字信息采用预先设置的语义规则进行数据结构化处理,能够获得对用户可读性更强的发票识别文本。
本实施例接收用户上传的原始发票图像;对所述原始发票图像进行预处理操作,所述预处理操作包括图像去噪、尺寸调节;将经过预处理操作的所述原始发票图像作为所述待识别发票图像,有利于提升图像信息的识别效率。并在数据结构化处理之前,确定所述发票文字信息中包含的语种类别,并判断各所述语种类别中是否存在非标准语种类别;若是,则对所述非标准语种类别对应的文本段进行翻译处理,获得标准语种类别的发票文字信息,实现了发票信息识别的多语言支持,能够获得用户可读性更强的发票识别文本。
参照图4,图4为本发明发票信息识别方法第三实施例的流程示意图。
基于上述实施例,在本实施例中,为了确保获得的发票识别文本的语义准确度,进一步提升获得的识别文本的可读性,步骤S400,包括:
步骤S401:通过预设语义规则对所述标准语种类别的发票文字信息进行格式转换,获得标准格式的发票文字信息。
应该理解的是,该预设语义规则可以包括例如:关键词提取规则、实体识别规则、文本解析规则、数据标准化规则等。
其中,关键词提取规则可以定义用于识别和提取关键词的规则,包括词性标注、关键词匹配等方式;实体识别规则可以定义用于从文本中是被和提取特定实体,例如金额、单价、税率、销售方、纳税人、开票人等;文本解析规则可以是定义用于解析和处理文本数据的规则,包括分段、分句、词性标准等处理;数据标准化规则可以定义用于将数据按照统一格式进行标准化的规则,包括单位转换、命名规范等。
在具体实现中,识别设备可以通过预先定义的各类语义规则对标准语种类别的发票文字信息进行格式转化,获得标准格式的发票文字信息。
步骤S402:对所述标准格式的发票文字信息进行逻辑验证,判断所述发票文字信息是否存在信息异常。
可以理解的是,为了提升对获得的发票识别文本的语义可靠性,加强对发票隐含信息(包括商品描述、交易关系等)的提取能力,便于后续深度业务分析,可以对经过格式转化的发票文字信息进行逻辑验证。
具体地,逻辑验证的方式可以包括:对所述发票文字信息中的进而进行计算校验、包括商品金额、税额、总额等;对商品名进行匹配和验证,检查商品名称、规格、数量以及单价等信息是否与实际情况相符;根据税法规定,验证发票上的税率、税额是否符合税务法规要求;对各字段之间的逻辑关系进行验证,如金额和数量的逻辑关系、税前总额与税后总额的关系等。
应该理解的是,通过基于语义的逻辑验证方式,可以帮助确保发票文字信息的准确性和合规性,防止因误差或违规导致的问题出现。
步骤S403:根据异常判定结果确定发票识别文本。
应该理解的是,在所述发票文字信息存在信息异常时,定位并标注对应的异常字段以使用户对所述异常字段进行复核;或,在所述发票文字信息不存在信息异常时,将所述发票文字信息确定为发票识别文本。
还需说明的是,在基于上述逻辑验证方式验证得到发票文字信息中存在信息异常时,为了便于及时进行异常处理,可以在上述发票文字信息中定位至存在异常的字段行,并发出警告通知等操作以提示用户进行异常复核并处理。并在获得不存在信息异常的发票文字信息时,生成包含上述发票文字信息的文本或是表格文件,获得便于后续用户阅读的发票识别文本。
进一步地,在进行批量发票信息识别时,为了实现发票数据整合,可以预先设置有个性化的发票存储规则,例如设置相同开票人对应的发票识别文本存储至同一文件夹;或是设置同一日期的各待识别发票图像对应的发票识别文本存储至同一文件夹,本实施例对该发票存储规则的设置在此不加以限制。
本实施例通过预设语义规则对所述标准语种类别的发票文字信息进行格式转换,获得标准格式的发票文字信息;对所述标准格式的发票文字信息进行逻辑验证,判断所述发票文字信息是否存在信息异常;根据异常判定结果确定发票识别文本。能够实现对发票识别信息的逻辑验证,进一步确保了获得的发票识别文本的可靠性。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有发票信息识别程序,所述发票信息识别程序被处理器执行时实现如上文所述的发票信息识别方法的步骤。
参考图5,图5为本发明发票信息识别装置第一实施例的结构框图。
如图5所示,本发明发票信息识别装置,包括:
图像获取模块501,用于获取待识别发票图像;
图像判断模块502,用于判断所述待识别发票图像是否属于格式模板库中的标准发票格式;
信息提取模块503,用于若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息;
文本生成模块504,用于对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
进一步地,所述图像判断模块502,还用于提取所述待识别发票图像中的若干个文字区域以及边框线段,获得当前版式信息,其中所述当前版式信息包括各所述文字区域与各所述边框线段在所述待识别发票图像中的分布位置;根据所述当前版式信息在所述格式模板库中进行匹配,并根据匹配结果判断是否存在对应所述待识别发票图像的标准发票格式。
进一步地,所述图像判断模块502,还用于若是,则获取所述标准发票格式对应的格式模板,所述格式模板中包括若干个待填补字段域;根据所述格式模板对所述待识别发票图像进行文字内容提取,并根据提取信息对各所述待填补字段域进行补全,获得发票识别文本。
本实施例中,通过获取待识别发票图像;判断所述待识别发票图像是否属于格式模板库中的标准发票格式;若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息;对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。由于本实施例是先判断待识别发票图像是否为标准发票格式,并在并非格式模板库中的标准发票格式时,由预设信息提取模型进行发票文字信息的提取,采用预设语义规则进行数据结构化处理,从而获得发票识别文本;在待识别发票图像为标准发票格式时,获取所述标准发票格式对应的格式模板以进行文字内容提取,能够实现对复杂多样格式下不同发票的信息识别,提高发票识别的灵活性,进而提升发票信息识别效果。
基于本发明上述发票信息识别装置第一实施例,提出本发明发票信息识别装置第二实施例。
在本实施例中,进一步地,所述图像获取模块501,还用于接收用户上传的原始发票图像;对所述原始发票图像进行预处理操作,所述预处理操作包括图像去噪、尺寸调节;将经过预处理操作的所述原始发票图像作为所述待识别发票图像。
进一步地,所述文本生成模块504,还用于确定所述发票文字信息中包含的语种类别,并判断各所述语种类别中是否存在非标准语种类别;若是,则对所述非标准语种类别对应的文本段进行翻译处理,获得标准语种类别的发票文字信息;对所述标准语种类别的发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
进一步地,所述文本生成模块504,还用于通过预设语义规则对所述标准语种类别的发票文字信息进行格式转换,获得标准格式的发票文字信息;对所述标准格式的发票文字信息进行逻辑验证,判断所述发票文字信息是否存在信息异常;根据异常判定结果确定发票识别文本。
进一步地,所述文本生成模块504,还用于在所述发票文字信息存在信息异常时,定位并标注对应的异常字段以使用户对所述异常字段进行复核;或,在所述发票文字信息不存在信息异常时,将所述发票文字信息确定为发票识别文本。
本发明发票信息识别装置其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……限定”的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围。

Claims (10)

1.一种发票信息识别方法,其特征在于,所述方法包括:
获取待识别发票图像;
判断所述待识别发票图像是否属于格式模板库中的标准发票格式;
若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息;
对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
2.如权利要求1所述的发票信息识别方法,其特征在于,所述判断所述待识别发票图像是否属于格式模板库中的标准发票格式,包括:
提取所述待识别发票图像中的若干个文字区域以及边框线段,获得当前版式信息,其中所述当前版式信息包括各所述文字区域与各所述边框线段在所述待识别发票图像中的分布位置;
根据所述当前版式信息在所述格式模板库中进行匹配,并根据匹配结果判断是否存在对应所述待识别发票图像的标准发票格式。
3.如权利要求2所述的发票信息识别方法,其特征在于,所述根据所述当前版式信息在所述格式模板库中进行匹配,并根据匹配结果判断是否存在对应所述待识别发票图像的标准发票格式之后,还包括:
若是,则获取所述标准发票格式对应的格式模板,所述格式模板中包括若干个待填补字段域;
根据所述格式模板对所述待识别发票图像进行文字内容提取,并根据提取信息对各所述待填补字段域进行补全,获得发票识别文本。
4.如权利要求1所述的发票信息识别方法,其特征在于,所述获取待识别发票图像,包括:
接收用户上传的原始发票图像;
对所述原始发票图像进行预处理操作,所述预处理操作包括图像去噪、尺寸调节;
将经过预处理操作的所述原始发票图像作为所述待识别发票图像。
5.如权利要求1所述的发票信息识别方法,其特征在于,所述对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本之前,包括:
确定所述发票文字信息中包含的语种类别,并判断各所述语种类别中是否存在非标准语种类别;
若是,则对所述非标准语种类别对应的文本段进行翻译处理,获得标准语种类别的发票文字信息;
相应地,所述对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本,包括:
对所述标准语种类别的发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
6.如权利要求5所述的发票信息识别方法,其特征在于,所述对所述标准语种类别的发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本,包括:
通过预设语义规则对所述标准语种类别的发票文字信息进行格式转换,获得标准格式的发票文字信息;
对所述标准格式的发票文字信息进行逻辑验证,判断所述发票文字信息是否存在信息异常;
根据异常判定结果确定发票识别文本。
7.如权利要求6所述的发票信息识别方法,其特征在于,所述根据异常判定结果确定发票识别文本,包括:
在所述发票文字信息存在信息异常时,定位并标注对应的异常字段以使用户对所述异常字段进行复核;
或,在所述发票文字信息不存在信息异常时,将所述发票文字信息确定为发票识别文本。
8.一种发票信息识别装置,其特征在于,所述发票信息识别装置包括:
图像获取模块,用于获取待识别发票图像;
图像判断模块,用于判断所述待识别发票图像是否属于格式模板库中的标准发票格式;
信息提取模块,用于若否,则将所述待识别发票图像输入至预设信息提取模型,获得所述待识别发票图像对应的发票文字信息;
文本生成模块,用于对所述发票文字信息基于预设语义规则进行数据结构化处理,获得发票识别文本。
9.一种发票信息识别设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的发票信息识别程序,所述发票信息识别程序配置为实现如权利要求1至7中任一项所述的发票信息识别方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有发票信息识别程序,所述发票信息识别程序被处理器执行时实现如权利要求1至7任一项所述的发票信息识别方法的步骤。
CN202410240650.7A 2024-03-04 2024-03-04 发票信息识别方法、装置、设备及存储介质 Pending CN118072321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410240650.7A CN118072321A (zh) 2024-03-04 2024-03-04 发票信息识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410240650.7A CN118072321A (zh) 2024-03-04 2024-03-04 发票信息识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN118072321A true CN118072321A (zh) 2024-05-24

Family

ID=91098730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410240650.7A Pending CN118072321A (zh) 2024-03-04 2024-03-04 发票信息识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN118072321A (zh)

Similar Documents

Publication Publication Date Title
US11232300B2 (en) System and method for automatic detection and verification of optical character recognition data
US9552516B2 (en) Document information extraction using geometric models
KR101462289B1 (ko) 모바일 장치 시스템을 이용한 디지털 이미지 아카이빙 및 검색
US8064703B2 (en) Property record document data validation systems and methods
US9081412B2 (en) System and method for using paper as an interface to computer applications
CN111144210B (zh) 图像的结构化处理方法及装置、存储介质及电子设备
US10489645B2 (en) System and method for automatic detection and verification of optical character recognition data
US11430242B2 (en) Systems and methods for obtaining product information in real-time
CN112800848A (zh) 票据识别后信息结构化提取方法、装置和设备
CN105631393A (zh) 信息识别方法及装置
CN112464927B (zh) 一种信息提取方法、装置及系统
US9710769B2 (en) Methods and systems for crowdsourcing a task
CN112418812A (zh) 分布式全链路自动化智能通关系统、方法及存储介质
CN111310750B (zh) 一种信息处理方法、装置、计算设备及介质
CN112418813A (zh) 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质
CN113807416B (zh) 一种模型训练方法、装置、电子设备以及存储介质
CN110472121B (zh) 名片信息搜索方法、装置、电子设备以及计算机可读存储介质
CN118072321A (zh) 发票信息识别方法、装置、设备及存储介质
CN115862025A (zh) 产品说明书要素提取方法、装置、设备、介质和程序产品
CN114743012A (zh) 一种文本识别方法及装置
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
WO2022146536A1 (en) Image analysis based document processing for inference of key-value pairs in non-fixed digital documents
CN113539518A (zh) 基于rpa和ai的药品数据处理方法、装置及电子设备
CN111191130A (zh) 信息抽取方法、装置、设备及计算机可读存储介质
CN117132244B (zh) 用于智慧合规管理系统的分类处理方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination