CN113221797B - 一种印刷文件的防伪识别方法、装置以及设备 - Google Patents

一种印刷文件的防伪识别方法、装置以及设备 Download PDF

Info

Publication number
CN113221797B
CN113221797B CN202110565619.7A CN202110565619A CN113221797B CN 113221797 B CN113221797 B CN 113221797B CN 202110565619 A CN202110565619 A CN 202110565619A CN 113221797 B CN113221797 B CN 113221797B
Authority
CN
China
Prior art keywords
characters
words
file
printed
marking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110565619.7A
Other languages
English (en)
Other versions
CN113221797A (zh
Inventor
邓园园
张秋水
季冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Kelude Technology Co ltd
Original Assignee
Xiamen Kelude Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Kelude Technology Co ltd filed Critical Xiamen Kelude Technology Co ltd
Priority to CN202110565619.7A priority Critical patent/CN113221797B/zh
Publication of CN113221797A publication Critical patent/CN113221797A/zh
Application granted granted Critical
Publication of CN113221797B publication Critical patent/CN113221797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了一种印刷文件的防伪识别方法,所述方法包括:通过对印刷文件进行扫描以获取对应的文件电子版;对所述文件电子版中的文字进行识别,利用人工智能分割对每一句子按照词组进行分词;判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记,并进一步确定所述印刷文件被篡改。能够实现对印刷文件的防伪识别,有效提高识别的效率和准确率,以确保文件的真实性。

Description

一种印刷文件的防伪识别方法、装置以及设备
技术领域
本发明涉及文件管理技术领域,尤其涉及一种印刷文件的防伪识别方法、装置以及设备。
背景技术
印刷文件是通过把文字、图画等制成印版,加上油墨印压,通常印在纸张上形成文件。印刷文件中包括合同文件、证明文件等等,这些重要文件在出具时必须内容真实、准确。然而,例如合同文件通常是双方或数方进行签字盖章后扫描发送给对方,扫描件由于经历了对被扫描文件的扫描、录入电脑、转换格式或字体、传输、接受以及打印等过程,从技术上是可以被篡改。而现有中对印刷文件的信息识别通常是通过人工核实,存在检测效率低以及准确率低等问题。
发明内容
有鉴于此,本发明的目的在于提出一种印刷文件的防伪识别方法、装置以及设备,能够实现对印刷文件的防伪识别,有效提高识别的效率和准确率,以确保文件的真实性。
为实现上述目的,本发明提供一种印刷文件的防伪识别方法,所述方法包括:
通过对印刷文件进行扫描以获取对应的文件电子版;
对所述文件电子版中的文字进行识别,利用人工智能分割对每一句子按照词组进行分词;
判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记,并进一步确定所述印刷文件被篡改。
优选的,在对所述文件电子版中的文字进行识别之后还包括:
基于所识别的文字进行字数统计并与预设值进行比较,若二者不同,则初步确定所述印刷文件被篡改。
优选的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤包括:
获取每一文字的字体,判断每一所述词组中是否存在不同字体的文字,是则对文字的所在位置进行标记。
优选的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤包括:
获取每一文字的字体,判断相邻的所述词组间是否存在不同字体的文字,是则对文字的所在位置进行标记。
优选的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤包括:
获取每一文字的字号,判断每一所述词组中是否存在不同字号的文字,是则对文字的所在位置进行标记。
优选的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤包括:
获取每一文字的字号,判断相邻的所述词组间是否存在不同字号的文字,是则对文字的所在位置进行标记。
优选的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤包括:
获取相邻文字间的间距,判断每一所述词组中是否存在不同间距的文字,是则对文字的所在位置进行标记。
优选的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤包括:
获取相邻文字间的间距,判断相邻的所述词组间是否存在不同间距的文字,是则对文字的所在位置进行标记。
为实现上述目的,本发明还提供一种印刷文件的防伪识别装置,所述装置包括:
扫描单元,用于通过对印刷文件进行扫描以获取对应的文件电子版;
分词单元,用于对所述文件电子版中的文字进行识别,利用人工智能分割对每一句子按照词组进行分词;
判断单元,用于判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记,并进一步确定所述印刷文件被篡改。
为了实现上述目的,本发明又提出一种印刷文件的防伪识别设备,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序能够被所述处理器执行时实现如上述实施例所述的一种印刷文件的防伪识别方法。
有益效果:
以上方案,通过对文件电子版中的文字进行识别,利用人工智能分割对每一句子进行分词,并基于所分割的词组进行判断是否不同文本格式的文字,由于文本格式均具有各自的特征,因此利用文本格式对所要判断的文字进行识别,能够快速、准确的识别出词组中是否存在不同文本格式的文字,识别准确率高且成本费用低。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种印刷文件的防伪识别方法的流程示意图。
图2为本发明一实施例对句子进行分词的结果示意图。
图3为本发明一实施例对句子识别到不同字体的结果示意图。
图4为本发明一实施例提供的一种印刷文件的防伪识别装置的结构示意图。
图5是本发明一实施例提供的印刷文件的防伪识别设备的结构示意图。
发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以下结合实施例详细阐述本发明的内容。
参照图1所示为本发明一实施例提供的一种印刷文件的防伪识别方法的流程示意图。
本实施例中,该方法包括:
S11,通过对印刷文件进行扫描以获取对应的文件电子版。
在本实施例中,印刷文件至少包括合同文件,因此合同文件需要通过打印后盖章再通过扫描或者拍照等方式获取文件电子版,以便于传递、打印和存储。
S12,对所述文件电子版中的文字进行识别,利用人工智能分割对每一句子按照词组进行分词。
在本实施例中,分词是指将一个句子中的所有词汇相互分隔开来,可通过在预设的词典库中进行词汇的查找、比对以进行对每一个句子进行词汇的分割,拆分成单个字词的方式,从而达到分词的效果。
请参照图2所示,通过在步骤S12中对文件电子版所识别的部分文字“未经对方许可,任何一方均不得向非必要第三方泄露本合同的任何内容、签订及履行情况。如一方未经对方同意披露上述应保密的信息而给对方造成损失的,则应承担相应的法律责任。”进行分词,其中将该段文字定义为文件原文。图2中为对上述句子进行分词的结果示意图,并且,图2中该段文字定义为未识别到存在不同的文本格式的情况。
其中,在对所述文件电子版中的文字进行识别之后还包括:
基于所识别的文字进行字数统计并与预设值进行比较,若二者不同,则初步确定所述印刷文件被篡改。
在本实施例中,通过对所识别的文字进行字数统计从而可根据统计的字数值与文件原文的字数预设值进行比较,从而可根据二者字数的不同初步判断文件被篡改。通过比较字数的操作便捷简单、且可根据字数的变多或变少以直观判断文件的大体信息。
S13,判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记,并进一步确定所述印刷文件被篡改。
在本实施例中,文本格式包括字体、字号、字形、字符间距以及字体颜色等等,根据对句子中的词组进行分割后,逐一对词组的字体、字号、字形、字符间距以及字体颜色进行判断,从而确定文件是否存在被篡改的痕迹。
进一步的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤可通过对字体进行判断,包括:
S13-1,获取每一文字的字体,判断每一所述词组中是否存在不同字体的文字,是则对文字的所在位置进行标记。
S13-2,获取每一文字的字体,判断相邻的所述词组间是否存在不同字体的文字,是则对文字的所在位置进行标记。
在具体实施中,参照图3所示,基于对每一词组进行分词后,进一步通过判断单个词组内的文字字体或判断相邻词组间的文字字体是否存在不同的字体,是则对文字的所在位置进行标记。在图3的该段文字中存在三处字体不同,分别为“甲方”、“乙方”、“乙方”,该三处所在各自的词组内均存在文字字体的不同,并且与相邻的词组的字体也不同,从而对这三处的所在位置进行标记,以便进一步识别是否被篡改。进一步的,通过与上述原文对应位置进行比较,可确定该三处是被篡改。
再进一步的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤可通过对字号进行判断,包括:
S13-3,获取每一文字的字号,判断每一所述词组中是否存在不同字号的文字,是则对文字的所在位置进行标记。
S13-4,获取每一文字的字号,判断相邻的所述词组间是否存在不同字号的文字,是则对文字的所在位置进行标记。
更进一步的,所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤可通过对字符间距进行判断,包括:
S13-5,获取相邻文字间的间距,判断每一所述词组中是否存在不同间距的文字,是则对文字的所在位置进行标记。
S13-6,获取相邻文字间的间距,判断相邻的所述词组间是否存在不同间距的文字,是则对文字的所在位置进行标记。
在具体实施中,还可进一步判断每一词组或者相邻词组间是否存在不同字号或不同间距的的文字,若是则对文字的所在位置进行标记。具体实现方式可参照对字体进行判断的例子,在此不再赘述。
特别的,在获取相邻文字间的间距时,当识别到有标点符号时,则对标点符号两边的文字不进行间距的判断。通过对标点符号两边的文字不进行判断能够减少由于标点符号的存在所产生的误差,从而提高识别精度。
参照图4所示为本发明一实施例提供的一种印刷文件的防伪识别装置的结构示意图。
本实施例中,该装置40包括:
扫描单元41,用于通过对印刷文件进行扫描以获取对应的文件电子版。
分词单元42,用于对所述文件电子版中的文字进行识别,利用人工智能分割对每一句子按照词组进行分词。
判断单元43,用于判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记,并进一步确定所述印刷文件被篡改。
其中,在另一实施例中,该装置40还包括:
统计单元,用于在基于所识别的文字进行字数统计并与预设值进行比较,若二者不同,则初步确定所述印刷文件被篡改。
该装置40的各个单元模块可分别执行上述方法实施例中对应步骤,故在此不对各单元模块进行赘述,详细请参见以上对应步骤的说明。
本发明实施例还提供一种印刷文件的防伪识别设备,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序能够被所述处理器执行以实现如上述实施例所述的印刷文件的防伪识别方法。
如图5所示,所述印刷文件的防伪识别设备可包括但不仅限于处理器、存储器。本领域技术人员可以理解,所述示意图仅仅是印刷文件的防伪识别设备的示例,并不构成对印刷文件的防伪识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述印刷文件的防伪识别设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述印刷文件的防伪识别设备的控制中心,利用各种接口和线路连接整个印刷文件的防伪识别设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述印刷文件的防伪识别设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述印刷文件的防伪识别设备集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例中的实施方案可以进一步组合或者替换,且实施例仅仅是对本发明的优选实施例进行描述,并非对本发明的构思和范围进行限定,在不脱离本发明设计思想的前提下,本领域中专业技术人员对本发明的技术方案作出的各种变化和改进,均属于本发明的保护范围。

Claims (3)

1.一种印刷文件的防伪识别方法,其特征在于,所述方法包括:
通过对印刷文件进行扫描以获取对应的文件电子版;
对所述文件电子版中的文字进行识别,利用人工智能分割对每一句子按照词组进行分词;
判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记,并进一步确定所述印刷文件被篡改;
在对所述文件电子版中的文字进行识别之后还包括:
基于所识别的文字进行字数统计并与预设值进行比较,若二者不同,则初步确定所述印刷文件被篡改;
所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤包括:
获取每一文字的字体、字号或相邻文字间的间距,判断每一所述词组中是否存在不同字体、字号或间距的文字,是则对文字的所在位置进行标记;
获取每一文字的字体、字号或相邻文字间的间距,判断相邻的所述词组间是否存在不同字体、字号或间距的文字,是则对文字的所在位置进行标记;
在获取相邻文字间的间距时,当识别到有标点符号时,则对标点符号两边的文字不进行间距的判断。
2.一种印刷文件的防伪识别装置,其特征在于,所述装置包括:
扫描单元,用于通过对印刷文件进行扫描以获取对应的文件电子版;
分词单元,用于对所述文件电子版中的文字进行识别,利用人工智能分割对每一句子按照词组进行分词;
判断单元,用于判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记,并进一步确定所述印刷文件被篡改;
在对所述文件电子版中的文字进行识别之后还包括:
基于所识别的文字进行字数统计并与预设值进行比较,若二者不同,则初步确定所述印刷文件被篡改;
所述判断所述词组中是否存在不同文本格式的文字,是则对文字的所在位置进行标记的步骤包括:
获取每一文字的字体、字号或相邻文字间的间距,判断每一所述词组中是否存在不同字体、字号或间距的文字,是则对文字的所在位置进行标记;
获取每一文字的字体、字号或相邻文字间的间距,判断相邻的所述词组间是否存在不同字体、字号或间距的文字,是则对文字的所在位置进行标记;
在获取相邻文字间的间距时,当识别到有标点符号时,则对标点符号两边的文字不进行间距的判断。
3.一种印刷文件的防伪识别设备,其特征在于,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序能够被所述处理器执行以实现如权利要求1所述的一种印刷文件的防伪识别方法。
CN202110565619.7A 2021-05-24 2021-05-24 一种印刷文件的防伪识别方法、装置以及设备 Active CN113221797B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110565619.7A CN113221797B (zh) 2021-05-24 2021-05-24 一种印刷文件的防伪识别方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110565619.7A CN113221797B (zh) 2021-05-24 2021-05-24 一种印刷文件的防伪识别方法、装置以及设备

Publications (2)

Publication Number Publication Date
CN113221797A CN113221797A (zh) 2021-08-06
CN113221797B true CN113221797B (zh) 2024-01-19

Family

ID=77098075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110565619.7A Active CN113221797B (zh) 2021-05-24 2021-05-24 一种印刷文件的防伪识别方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN113221797B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1266520A (zh) * 1998-06-10 2000-09-13 巴克利斯银行公开有限公司 安全事务系统
DE102005013962A1 (de) * 2003-10-01 2006-10-05 Wirnitzer, Bernhard, Prof. Dr. Dokumentenpapier mit aufgedrucktem Sicherheitselement und Verfahren zum Erstellen fälschungsgeschützter Dokumente
JP2006319729A (ja) * 2005-05-13 2006-11-24 Hitachi Information Systems Ltd 改ざん検証機能付き証明書及び該証明書を用いた改ざん検証方法並びに改ざん検証プログラム
CN101281581A (zh) * 2007-09-27 2008-10-08 北京数字证书认证中心有限公司 一种检验纸制文档内容是否被篡改的方法
CN104699669A (zh) * 2015-03-31 2015-06-10 中译语通科技(北京)有限公司 一种文本字数统计的方法及装置
CN106033543A (zh) * 2015-03-11 2016-10-19 株式会社理光 文档修改检测方法、文档原稿提供装置、文档复制件检测装置、以及文档修改检测系统
CN107463274A (zh) * 2017-07-31 2017-12-12 深圳市金立通信设备有限公司 一种输入文字的方法、终端及计算机可读介质
CN109543444A (zh) * 2018-10-25 2019-03-29 深圳壹账通智能科技有限公司 一种文件签署方法、装置、存储介质和服务器
CN109635278A (zh) * 2018-11-20 2019-04-16 北京小谛机器人科技有限公司 语义表示方法及装置
CN111046627A (zh) * 2018-10-12 2020-04-21 北京金山办公软件股份有限公司 一种中文文字显示方法及系统
CN112017079A (zh) * 2020-08-26 2020-12-01 深圳市唯德科创信息有限公司 专利文档的元件信息提取方法、处理装置以及存储介质
CN112115422A (zh) * 2020-08-10 2020-12-22 北京华雨天成文化传播有限公司 检测著作权文件修改的方法、装置及设备
CN112784220A (zh) * 2020-06-12 2021-05-11 深圳市迪博企业风险管理技术有限公司 一种纸质合同防篡改校验方法及系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1266520A (zh) * 1998-06-10 2000-09-13 巴克利斯银行公开有限公司 安全事务系统
DE102005013962A1 (de) * 2003-10-01 2006-10-05 Wirnitzer, Bernhard, Prof. Dr. Dokumentenpapier mit aufgedrucktem Sicherheitselement und Verfahren zum Erstellen fälschungsgeschützter Dokumente
JP2006319729A (ja) * 2005-05-13 2006-11-24 Hitachi Information Systems Ltd 改ざん検証機能付き証明書及び該証明書を用いた改ざん検証方法並びに改ざん検証プログラム
CN101281581A (zh) * 2007-09-27 2008-10-08 北京数字证书认证中心有限公司 一种检验纸制文档内容是否被篡改的方法
CN106033543A (zh) * 2015-03-11 2016-10-19 株式会社理光 文档修改检测方法、文档原稿提供装置、文档复制件检测装置、以及文档修改检测系统
CN104699669A (zh) * 2015-03-31 2015-06-10 中译语通科技(北京)有限公司 一种文本字数统计的方法及装置
CN107463274A (zh) * 2017-07-31 2017-12-12 深圳市金立通信设备有限公司 一种输入文字的方法、终端及计算机可读介质
CN111046627A (zh) * 2018-10-12 2020-04-21 北京金山办公软件股份有限公司 一种中文文字显示方法及系统
CN109543444A (zh) * 2018-10-25 2019-03-29 深圳壹账通智能科技有限公司 一种文件签署方法、装置、存储介质和服务器
CN109635278A (zh) * 2018-11-20 2019-04-16 北京小谛机器人科技有限公司 语义表示方法及装置
CN112784220A (zh) * 2020-06-12 2021-05-11 深圳市迪博企业风险管理技术有限公司 一种纸质合同防篡改校验方法及系统
CN112115422A (zh) * 2020-08-10 2020-12-22 北京华雨天成文化传播有限公司 检测著作权文件修改的方法、装置及设备
CN112017079A (zh) * 2020-08-26 2020-12-01 深圳市唯德科创信息有限公司 专利文档的元件信息提取方法、处理装置以及存储介质

Also Published As

Publication number Publication date
CN113221797A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
CN109934244B (zh) 格式类别学习系统以及图像处理装置
WO2022057707A1 (zh) 文本识别方法、图像识别分类方法、文档识别处理方法
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
CN111325092B (zh) 一种动车票识别方法、装置、计算机装置及计算机可读存储介质
WO2022126978A1 (zh) 发票信息抽取方法、装置、计算机设备及存储介质
US12131565B2 (en) On-device partial recognition systems and methods
CN102567938B (zh) 用于西文水印处理的水印图像分块方法和装置
CN110738119A (zh) 一种票据识别方法、装置、设备及可读介质
CN112308046A (zh) 图像的文本区域定位方法、装置、服务器及可读存储介质
CN112487859A (zh) 信息处理装置、信息处理方法和计算机可读介质
JP2015126486A (ja) 画像処理装置
JP2022066321A (ja) 情報処理装置及びプログラム
CN112149401A (zh) 一种基于ocr的文档对比识别方法和系统
JP2010218249A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
CN113221797B (zh) 一种印刷文件的防伪识别方法、装置以及设备
EP3151159A1 (en) Information processing apparatus, information processing method and program
CN108334800B (zh) 印章图像的处理装置、方法以及电子设备
CN111695414A (zh) 文档处理方法及装置、电子设备、计算机可读存储介质
JP2007241355A (ja) 画像処理装置及び画像処理プログラム
CN115083024A (zh) 基于区域划分的签名识别方法、装置、介质及设备
Kumar et al. Line based robust script identification for indianlanguages
CN114612919A (zh) 一种票据信息处理系统及方法、装置
CN113343663A (zh) 一种票据结构化方法及装置
CN112257718A (zh) 一种关于放射科胶片的文本识别方法及装置
JP2004280654A (ja) 画像処理装置、記録媒体、プログラム並びに画像処理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant