CN112560767A - 文档签名识别方法、装置及计算机可读存储介质 - Google Patents

文档签名识别方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN112560767A
CN112560767A CN202011557454.0A CN202011557454A CN112560767A CN 112560767 A CN112560767 A CN 112560767A CN 202011557454 A CN202011557454 A CN 202011557454A CN 112560767 A CN112560767 A CN 112560767A
Authority
CN
China
Prior art keywords
document
picture
identified
signature
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011557454.0A
Other languages
English (en)
Inventor
肖威
潘晓华
刘福权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Power Grid Digital Grid Research Institute Co Ltd
Shenzhen Digital Power Grid Research Institute of China Southern Power Grid Co Ltd
Original Assignee
Shenzhen Digital Power Grid Research Institute of China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Digital Power Grid Research Institute of China Southern Power Grid Co Ltd filed Critical Shenzhen Digital Power Grid Research Institute of China Southern Power Grid Co Ltd
Priority to CN202011557454.0A priority Critical patent/CN112560767A/zh
Publication of CN112560767A publication Critical patent/CN112560767A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • G06V40/33Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种文档签名识别方法、装置及计算机可读存储介质。本申请的文档签名识别方法包括:获取待识别文档、待识别文档的文档类型;待识别文档是非图片文档;根据待识别文档的文档类型对待识别文档进行图片化处理,以获得待处理图片;对待处理图片进行图像分割处理以获得待识别图片;对待识别图片进行图像识别处理,获得目标图片;识别出目标图片的文档内容;文档内容用于表征待识别文档的签名信息。该方法提高文档签名识别的正确率。

Description

文档签名识别方法、装置及计算机可读存储介质
技术领域
本申请涉及但不限于信息处理领域,尤其是涉及一种文档签名识别方法、装置及计算机可读存储介质。
背景技术
签名识别技术应用于信息处理领域中,当前的签名识别技术存在错误率较高的问题。
发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种文档签名识别方法,能够提高签名识别的准确性。
本申请还提出一种具有文档签名识别方法的装置。
本申请还提出一种具有文档签名识别方法的计算机可读存储介质。
根据本申请第一方面实施例的文档签名识别方法,所述方法包括:获取待识别文档、所述待识别文档的文档类型;所述待识别文档是非图片文档;根据待识别文档的文档类型对所述待识别文档进行图片化处理,以获得待处理图片;对所述待处理图片进行图像分割处理以获得待识别图片;对所述待识别图片进行图像识别处理,获得目标图片;识别出所述目标图片的文档内容;所述文档内容用于表征所述待识别文档的签名信息。
根据本申请实施例的文档签名识别方法,至少具有如下技术效果:本方法能够提升文档签名识别的正确率。
根据本申请的一些实施例,所述文档类型包括PDF文档,所述根据待识别文档的文档类型对所述待识别文档进行图片化处理,以获得待处理图片,包括:若所述文档类型为PDF文档,则通过PDFBOX对所述待识别文档进行图片化处理,以获得所述待处理图片。
根据本申请的一些实施例,所述文档类型包括非PDF文档,所述根据待识别文档的文档类型对所述待识别文档进行图片化处理,以获得待处理图片,包括:若所述文档类型为非PDF文档,则通过POI技术对所述待识别文档进行图片化处理,以获得所述待处理图片。
根据本申请的一些实施例,所述对所述待处理图片进行图像分割处理以获得待识别图片包括:根据Spire对图片进行图片分割处理以获得待识别图片。
根据本申请的一些实施例,所述识别出所述目标图片的文档内容包括:获取签名识别模型;根据签名识别模型识别出所述目标图片的文档内容。
根据本申请的一些实施例,所述识别出所述目标图片的文档内容,包括:若所述目标图片中有签名,则识别出所述目标图片的文档内容;若所述目标图片中没有签名,则根据所述目标图片训练所述签名识别模型。
根据本申请第二方面实施例的文档签名识别装置,包括:文档获取模块,用于获取待识别文档、所述待识别文档的文档类型;所述待识别文档是非图片文档;图片化处理模块,用于根据待识别文档的文档类型对所述待识别文档进行图片化处理,以获得待处理图片;图像分割模块,用于对所述待处理图片进行图像分割处理以获得待识别图片;目标图片获取模块,用于对所述待识别图片进行图像识别处理,获得目标图片;目标图片识别模块,用于识别出所述目标图片的文档内容;所述文档内容用于表征所述待识别文档的签名信息。
根据本申请第三方面实施例的文档签名识别装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现:本申请上述第一方面实施例的文档签名识别方法。
根据本申请第四方面实施例的计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于:执行上述第一方面实施例的所述的文档签名识别方法。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过申请的实践了解到。
附图说明
下面结合附图和实施例对本申请做进一步的说明,其中:
图1是本申请一个实施例提供的文档签名识别方法流程图;
图2是本申请另一个实施例提供的文档签名识别方法流程图;
图3是本申请另一个实施例提供的文档签名识别方法流程图;
图4是本申请另一个实施例提供的文档签名识别方法流程图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。
在本申请的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
本申请的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
现有技术普遍使用OCR直接识别文档,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息,然后找出需要识别内容。但是直接使用OCR进行识别的方法存在正确率较低的问题,进而影响文本识别的实际应用效果。
针对OCR识别的正确率较低的情况,本发明主要将待识别内容通过深度学习进行识别训练,在应用中通过对文档进行图形处理,将文档中文本、签名、印章等信息转化为图片;利用深度学习对转化后的图片进行内容识别来确认是否包含特定的签名信息,有效的提高识别正确率,同时还可以不断完善训练模型,从而提高识别的正确率。
根据本申请实施例的文档签名识别方法,方法包括:获取待识别文档、待识别文档的文档类型;待识别文档是非图片文档;根据待识别文档的文档类型对待识别文档进行图片化处理,以获得待处理图片;对待处理图片进行图像分割处理以获得待识别图片;对待识别图片进行图像识别处理,获得目标图片;识别出目标图片的文档内容;文档内容用于表征待识别文档的签名信息。
如图1所示,在一些实施例中,文档签名识别方法包括:
S110,获取待识别文档、待识别文档的文档类型;
S120,根据待识别文档的文档类型对待识别文档进行图片化处理,以获得待处理图片;
S130,对待处理图片进行图像分割处理以获得待识别图片;
S140,对待识别图片进行图像识别处理,获得目标图片;
S150,识别出目标图片的文档内容。
在步骤S110中,待识别文档是非图片文档,文档类型包括PDF和非PDF两种类型,针对不同的文档类型,使用不同的图片化处理手段。
在步骤S120中,针对待识别文档,文档签名识别方法抽取文档中的图片信息,将文档内容进行拆分,并转换为待识图片,便于后续对文字的提取。
在步骤S130中,图像分割的目的是将待处理图片分割成多个部分,在对含有签名的区域进行识别时,避免了其他部分对识别准确率的影响。
在步骤S140中,文档签名识别方法通过获得目标图片的方式,找到最有可能包含签名的图片部分,进而再对其进行有针对性地识别工作。
在步骤S150中,文档内容用于表征待识别文档的签名信息,即所识别得到的内容就是签名中包含的文字内容。
本申请的文档签名识别方法利用了图形识别学习技术和文档图片转换技术,对需要识别的特定签名进行图形对比,同时结合了OCR识别技术,实现对特定签名的识别,从而能更准确地识别出文档内容,解决了现有识别方法的正确率较低的问题,提高文档签名识别的正确率。
根据本申请的一些实施例,文档类型包括PDF文档,根据待识别文档的文档类型对待识别文档进行图片化处理,以获得待处理图片,包括:若文档类型为PDF文档,则通过PDFBOX对待识别文档进行图片化处理,以获得待处理图片。
根据本申请的一些实施例,文档类型包括非PDF文档,根据待识别文档的文档类型对待识别文档进行图片化处理,以获得待处理图片,包括:若文档类型为非PDF文档,则通过POI技术对待识别文档进行图片化处理,以获得待处理图片。
如图2所示,在一些实施例中,文档签名识别方法包括:
S210,获取待识别文档的文档类型;
S220,判断文档类型是否为PDF文档;若判断结果为是,则执行步骤S230;若判断结果为否,则执行步骤S240;
S230,通过PDFBOX对待识别文档进行图片化处理,以获得待处理图片;
S240,则通过POI技术对待识别文档进行图片化处理,以获得待处理图片。
在步骤S210至S220中,文档类型用于决定对待识别文档的处理方式。
在步骤S230中,对于PDF文件,通过PDFBOX对PDF文档进行处理,抽取图片信息,将文档内容进行拆分及转换为待识图片。
在步骤S240中,对于非PDF文件,通过POI技术对文档进行处理,抽取图片信息,将文档内容进行拆分及转换为待识图片。
文档签名识别方法通过针对不同文档类型来设置不同的处理方法,提高了识别的正确率。
根据本申请的一些实施例,对待处理图片进行图像分割处理以获得待识别图片包括:根据Spire对图片进行图片分割处理以获得待识别图片。
在具体的实施例中,文档签名识别方法使用Spire对图片进行分割,将图片信息拆分,减少待识别内容的干扰。
根据本申请的一些实施例,识别出目标图片的文档内容包括:获取签名识别模型;根据签名识别模型识别出目标图片的文档内容。
如图3所示,在一些实施例中,文档签名识别方法包括:
S310,获取签名识别模型;
S320,根据签名识别模型识别出目标图片的文档内容。
在步骤S310至S320中,签名识别模型为深度学习领域的网络模型,本申请不对具体的网络类型和结构做具体限制。
在具体的实施例中,通过将包含签名数据及其标签的数据集作为训练集,输入深度学习网络中,对模型进行训练,从而得到签名识别模型,再利用签名识别模型对待检测文档中的签名进行识别,输出识别结果。
根据本申请的一些实施例,识别出目标图片的文档内容,包括:若目标图片中有签名,则识别出目标图片的文档内容;若目标图片中没有签名,则根据目标图片训练签名识别模型。
如图4所示,在一些实施例中,文档签名识别方法包括:
S410,对待识别图片进行图像识别处理,获得目标图片;
S420,判断目标图片中是否有签名;若判断结果为是,则执行步骤S430;若判断结果为否,则执行步骤S440;
S430,识别出目标图片的文档内容;
S440,根据目标图片训练签名识别模型。
在步骤S410至S440中,文档签名识别方法对拆分好的图片进行图片识别,识别出特定的签名信息所在图片。若发现识别错误的签名信息,即没有找到满足要求的目标图片,或找到的目标图片有误,则会将其纳入到模型的训练集中,从而提高模型的准确性,避免下次识别继续出现这种错误。
根据本申请实施例的文档签名识别装置,包括:文档获取模块,用于获取待识别文档、待识别文档的文档类型;待识别文档是非图片文档;图片化处理模块,用于根据待识别文档的文档类型对待识别文档进行图片化处理,以获得待处理图片;图像分割模块,用于对待处理图片进行图像分割处理以获得待识别图片;目标图片获取模块,用于对待识别图片进行图像识别处理,获得目标图片;目标图片识别模块,用于识别出目标图片的文档内容;文档内容用于表征待识别文档的签名信息。
本申请的文档签名识别装置实现了上述文档签名识别方法,利用了图形识别学习技术和文档图片转换技术,对需要识别的特定签名进行图形对比,同时结合了OCR识别技术,实现对特定签名的识别,从而能更准确地识别出文档内容,解决了现有识别方法的正确率较低的问题,提高文档签名识别的正确率。
根据本申请实施例的文档签名识别装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现:本申请上述任一实施例的文档签名识别方法。
本申请的文档签名识别装置实现了上述文档签名识别方法,利用了图形识别学习技术和文档图片转换技术,对需要识别的特定签名进行图形对比,同时结合了OCR识别技术,实现对特定签名的识别,从而能更准确地识别出文档内容,解决了现有识别方法的正确率较低的问题,提高文档签名识别的正确率。
根据本申请实施例的计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于:执行上述任一实施例的文档签名识别方法。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
上面结合附图对本申请实施例作了详细说明,但是本申请不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本申请宗旨的前提下作出各种变化。此外,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

Claims (9)

1.文档签名识别方法,其特征在于,包括:
获取待识别文档、所述待识别文档的文档类型;所述待识别文档是非图片文档;
根据待识别文档的文档类型对所述待识别文档进行图片化处理,以获得待处理图片;
对所述待处理图片进行图像分割处理以获得待识别图片;
对所述待识别图片进行图像识别处理,获得目标图片;
识别出所述目标图片的文档内容;所述文档内容用于表征所述待识别文档的签名信息。
2.根据权利要求1所述的文档签名识别方法,其特征在于,所述文档类型包括PDF文档,所述根据待识别文档的文档类型对所述待识别文档进行图片化处理,以获得待处理图片,包括:
若所述文档类型为PDF文档,则通过PDFBOX对所述待识别文档进行图片化处理,以获得所述待处理图片。
3.根据权利要求1所述的文档签名识别方法,其特征在于,所述文档类型包括非PDF文档,所述根据待识别文档的文档类型对所述待识别文档进行图片化处理,以获得待处理图片,包括:
若所述文档类型为非PDF文档,则通过POI技术对所述待识别文档进行图片化处理,以获得所述待处理图片。
4.根据权利要求1所述的文档签名识别方法,其特征在于,所述对所述待处理图片进行图像分割处理以获得待识别图片包括:
根据Spire对图片进行图片分割处理以获得待识别图片。
5.根据权利要求1所述的文档签名识别方法,其特征在于,所述识别出所述目标图片的文档内容包括:
获取签名识别模型;
根据签名识别模型识别出所述目标图片的文档内容。
6.根据权利要求5所述的文档签名识别方法,其特征在于,所述识别出所述目标图片的文档内容,包括:
若所述目标图片中有签名,则识别出所述目标图片的文档内容;
若所述目标图片中没有签名,则根据所述目标图片训练所述签名识别模型。
7.文档签名识别装置,其特征在于,包括:
文档获取模块,用于获取待识别文档、所述待识别文档的文档类型;所述待识别文档是非图片文档;
图片化处理模块,用于根据待识别文档的文档类型对所述待识别文档进行图片化处理,以获得待处理图片;
图像分割模块,用于对所述待处理图片进行图像分割处理以获得待识别图片;
目标图片获取模块,用于对所述待识别图片进行图像识别处理,获得目标图片;
目标图片识别模块,用于识别出所述目标图片的文档内容;所述文档内容用于表征所述待识别文档的签名信息。
8.文档签名识别装置,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现:
如权利要求1至7中任一项所述的文档签名识别方法。
9.计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于:
执行权利要求1至7中任一项所述的文档签名识别方法。
CN202011557454.0A 2020-12-24 2020-12-24 文档签名识别方法、装置及计算机可读存储介质 Pending CN112560767A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011557454.0A CN112560767A (zh) 2020-12-24 2020-12-24 文档签名识别方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011557454.0A CN112560767A (zh) 2020-12-24 2020-12-24 文档签名识别方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112560767A true CN112560767A (zh) 2021-03-26

Family

ID=75034093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011557454.0A Pending CN112560767A (zh) 2020-12-24 2020-12-24 文档签名识别方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112560767A (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160104039A1 (en) * 2014-10-10 2016-04-14 Morpho Method for identifying a sign on a deformed document
CN107909580A (zh) * 2017-11-01 2018-04-13 深圳市深网视界科技有限公司 一种行人衣着颜色识别方法、电子设备及存储介质
CN109426793A (zh) * 2017-09-01 2019-03-05 中兴通讯股份有限公司 一种图像行为识别方法、设备及计算机可读存储介质
CN110390269A (zh) * 2019-06-26 2019-10-29 平安科技(深圳)有限公司 Pdf文档表格提取方法、装置、设备及计算机可读存储介质
CN110827247A (zh) * 2019-10-28 2020-02-21 上海悦易网络信息技术有限公司 一种识别标签的方法及设备
CN110941947A (zh) * 2018-09-21 2020-03-31 广州金山移动科技有限公司 一种文档编辑的方法、装置、计算机存储介质及终端
CN111259830A (zh) * 2020-01-19 2020-06-09 中国农业科学院农业信息研究所 一种海外农业pdf文档内容碎片化方法及系统
CN111340037A (zh) * 2020-03-25 2020-06-26 上海智臻智能网络科技股份有限公司 文本版面分析方法、装置、计算机设备和存储介质
CN111444922A (zh) * 2020-03-27 2020-07-24 Oppo广东移动通信有限公司 图片处理方法、装置、存储介质及电子设备
CN111507214A (zh) * 2020-04-07 2020-08-07 中国人民财产保险股份有限公司 文档识别方法、装置及设备
CN111914597A (zh) * 2019-05-09 2020-11-10 杭州睿琪软件有限公司 一种文档对照识别方法、装置、电子设备和可读存储介质
CN112000834A (zh) * 2020-08-26 2020-11-27 北京百度网讯科技有限公司 文档处理方法、装置、系统、电子设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160104039A1 (en) * 2014-10-10 2016-04-14 Morpho Method for identifying a sign on a deformed document
CN109426793A (zh) * 2017-09-01 2019-03-05 中兴通讯股份有限公司 一种图像行为识别方法、设备及计算机可读存储介质
CN107909580A (zh) * 2017-11-01 2018-04-13 深圳市深网视界科技有限公司 一种行人衣着颜色识别方法、电子设备及存储介质
CN110941947A (zh) * 2018-09-21 2020-03-31 广州金山移动科技有限公司 一种文档编辑的方法、装置、计算机存储介质及终端
CN111914597A (zh) * 2019-05-09 2020-11-10 杭州睿琪软件有限公司 一种文档对照识别方法、装置、电子设备和可读存储介质
CN110390269A (zh) * 2019-06-26 2019-10-29 平安科技(深圳)有限公司 Pdf文档表格提取方法、装置、设备及计算机可读存储介质
CN110827247A (zh) * 2019-10-28 2020-02-21 上海悦易网络信息技术有限公司 一种识别标签的方法及设备
CN111259830A (zh) * 2020-01-19 2020-06-09 中国农业科学院农业信息研究所 一种海外农业pdf文档内容碎片化方法及系统
CN111340037A (zh) * 2020-03-25 2020-06-26 上海智臻智能网络科技股份有限公司 文本版面分析方法、装置、计算机设备和存储介质
CN111444922A (zh) * 2020-03-27 2020-07-24 Oppo广东移动通信有限公司 图片处理方法、装置、存储介质及电子设备
CN111507214A (zh) * 2020-04-07 2020-08-07 中国人民财产保险股份有限公司 文档识别方法、装置及设备
CN112000834A (zh) * 2020-08-26 2020-11-27 北京百度网讯科技有限公司 文档处理方法、装置、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110135411B (zh) 名片识别方法和装置
CN107239786B (zh) 一种字符识别方法和装置
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
US11106891B2 (en) Automated signature extraction and verification
CN109543501B (zh) 图像处理装置、图像处理方法和存储介质
CN102236800B (zh) 经历ocr过程的文本的单词识别
US20180232573A1 (en) Information processing apparatus, control method, and storage medium
CN111340037B (zh) 文本版面分析方法、装置、计算机设备和存储介质
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
US11983910B2 (en) Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network
US20150206033A1 (en) Method of identifying pattern training need during verification of recognized text
US20220019834A1 (en) Automatically predicting text in images
US20170099403A1 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
CN110738238A (zh) 一种证件信息的分类定位方法及装置
CN110825874A (zh) 一种中文文本分类方法和装置及计算机可读存储介质
US10803309B2 (en) Identifying versions of a form
CN112560767A (zh) 文档签名识别方法、装置及计算机可读存储介质
KR102050422B1 (ko) 문자 인식 장치 및 방법
US11394919B2 (en) Image processing apparatus, image processing method and medium
US11582435B2 (en) Image processing apparatus, image processing method and medium
CN112784825A (zh) 图片中文字的识别方法、关键字检索方法、装置及设备
US11354890B2 (en) Information processing apparatus calculating feedback information for partial region of image and non-transitory computer readable medium storing program
CN116563869B (zh) 页面图像文字处理方法、装置、终端设备和可读存储介质
CN110765826A (zh) 一种可移植文档格式pdf中的乱码识别方法和装置
CN110163203B (zh) 字符识别方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination