CN108334800B - 印章图像的处理装置、方法以及电子设备 - Google Patents
印章图像的处理装置、方法以及电子设备 Download PDFInfo
- Publication number
- CN108334800B CN108334800B CN201710042059.0A CN201710042059A CN108334800B CN 108334800 B CN108334800 B CN 108334800B CN 201710042059 A CN201710042059 A CN 201710042059A CN 108334800 B CN108334800 B CN 108334800B
- Authority
- CN
- China
- Prior art keywords
- seal
- seals
- candidate
- stamp
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 title abstract description 15
- 238000003672 processing method Methods 0.000 claims abstract description 14
- 239000000284 extract Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 56
- 238000010586 diagram Methods 0.000 description 15
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 6
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 6
- 229910052802 copper Inorganic materials 0.000 description 6
- 239000010949 copper Substances 0.000 description 6
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 206010033799 Paralysis Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 238000010422 painting Methods 0.000 description 3
- 208000021090 palsy Diseases 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 240000003421 Dianthus chinensis Species 0.000 description 1
- 241001237097 Dianthus hyssopifolius Species 0.000 description 1
- 235000013535 Dianthus superbus Nutrition 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
- Image Input (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种印章图像的处理装置、方法以及电子设备。所述处理方法包括:在两个或以上印章所对应的相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;基于所述候选印章的印章内容确定两个或以上的所述候选印章是否为相关印章;以及在确定为相关印章的情况下,为两个或以上的候选印章建立印章和印章之间的关系。由此,不但能够挖掘和建立印章之间的关联,从而获得大量新的信息;而且能够大大地提高印章和文档之间关系信息的准确性,从而获得更加可靠的信息。
Description
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种印章图像的处理装置、方法以及电子设备。
背景技术
印章是古籍文档中的一类重要信息来源。目前,通过基于图像识别的印章匹配技术,可以建立印章和书籍(也可以称为文档)之间的关系。例如,离线地对大量书画作品提取印章图像,获得这些印章图像的特征并存储在印章库中;还可以利用被检索到的印章图像的相关信息,进一步定位被检索的书画作品。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
但是,发明人发现:目前的研究主要集中在印章和书籍(或文档)之间,但印章与印章之间的相互关系没有得到有效的挖掘。
本发明实施例提供了一种印章图像的处理装置、方法以及电子设备。通过印章和文档之间的关系,进一步挖掘建立印章之间的关联;从而能够获得更加准确的信息。
根据本实施例的第一方面,提供了一种印章图像的处理装置,包括:
印章图像抽取单元,其从扫描的文档图像中抽取多个印章图像,其中抽取出的印章图像的属性至少包括对应文档的标识;
印章与文档关系建立单元,其基于图像匹配建立印章和文档之间的关系;
候选印章确定单元,其统计两个或以上印章所对应的相同文档的数量,在相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;
印章内容识别单元,其基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;
相关印章确定单元,其基于所述印章内容确定两个或以上的所述候选印章是否为相关印章;以及
印章与印章关系建立单元,其在确定所述两个或以上的候选印章为所述相关印章的情况下,为所述两个或以上的候选印章建立印章和印章之间的关系。
根据本实施例的第二方面,提供了一种印章图像的处理方法,包括:
从扫描的文档图像中抽取多个印章图像,其中抽取出的印章图像的属性至少包括对应文档的标识;
基于图像匹配建立印章和文档之间的关系;
统计两个或以上印章所对应的相同文档的数量,在相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;
基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;
基于所述印章内容确定两个或以上的所述候选印章是否为相关印章;以及
在确定所述两个或以上的候选印章为所述相关印章的情况下,为所述两个或以上的候选印章建立印章和印章之间的关系。
根据本实施例的第三方面,提供了一种电子设备,所述电子设备包括如上所述的印章图像的处理装置。
本发明实施例的有益效果在于:在两个或以上印章所对应的相同文档的数量大于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;并基于所述候选印章的印章内容确定两个或以上的所述候选印章是否为相关印章;以及在确定为相关印章的情况下,为两个或以上的候选印章建立印章和印章之间的关系。由此,不但能够挖掘建立印章之间的关联,从而获得大量新的信息;而且能够大大地提高印章之间关系信息的准确性,从而获得更加准确的信息。
参照后文的说明和附图,详细公开了本发明实施例的特定实施方式,指明了本发明实施例的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。
针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
附图说明
所包括的附图用来提供对本发明实施例的进一步的理解,其构成了说明书的一部分,用于例示本发明的实施方式,并与文字描述一起来阐释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例1的印章图像的处理方法的一示意图;
图2是本发明实施例1的印章图像的一示例图;
图3是本发明实施例1的印章图像的另一示例图;
图4是本发明实施例1的印章和文档关联的一示例图;
图5是本发明实施例1的印章图像的处理方法的另一示意图;
图6是本发明实施例2的印章图像的处理装置的一示意图;
图7是本发明实施例2的印章与文档关系建立单元的一示意图;
图8是本发明实施例3的电子设备的一示意图。
具体实施方式
参照附图,通过下面的说明书,本发明实施例的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本发明的特定实施方式,其表明了其中可以采用本发明实施例的原则的部分实施方式,应了解的是,本发明不限于所描述的实施方式,相反,本发明实施例包括落入所附权利要求的范围内的全部修改、变型以及等同物。下面结合附图对本发明的各种实施方式进行说明。这些实施方式只是示例性的,不是对本发明的限制。
实施例1
本发明实施例提供一种印章图像的处理方法。图1是本发明实施例的印章图像的处理方法的一示意图,如图1所示,印章图像的处理方法100包括:
步骤101,从扫描的文档图像中抽取多个印章图像,其中抽取出的印章图像的属性至少包括对应文档的标识;
步骤102,基于图像匹配建立印章和文档之间的关系;
步骤103,统计两个或以上印章所对应的相同文档的数量,在相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;
步骤104,基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;
步骤105,基于所述印章内容确定两个或以上的所述候选印章是否为相关印章;以及
步骤106,在确定所述两个或以上的候选印章为所述相关印章的情况下,为所述两个或以上的候选印章建立印章和印章之间的关系。
在本实施例中,对于文档(例如古籍)图像的印章图像提取,例如可以通过基于颜色的分析方法来实现。例如,印章所使用的印泥一般为红色,因此可以对图像提取颜色通道中的红色部分,然后通过二值化得到红色印章的范围,并在该范围中进行印章图像的提取。
在本实施例中,可以将印章图像所对应文档的标识作为该印章图像的一个属性。例如,如果某一印章图像P1从文档2的图像中抽取出来,则可以将文档2的标识(例如编号或名称)作为该印章图像P1的文档属性。
在本实施例中,可以预先建立印章库,例如对大量书画作品提取印章图像,获得这些印章图像的特征并存储在该印章库中,此外还可以通过人工标注的方式获得这些印章图像的语义信息。
图2是本发明实施例的印章图像的一示例图,示出了某一印章图像(例如采用印章1表示)的情况,例如通过专家识别可以获知该印章1的印章内容(即印文)为“古里瞿氏”。
图3是本发明实施例的印章图像的另一示例图,示出了某一印章图像(例如采用印章2表示)的情况,例如通过专家识别可以获知该印章2的印章内容(即印文)为“铁琴铜剑楼”。
在印章库中,可以将这些印章图像的特征以及对应的印文关联起来。由此,通过将某个印章图像与印章库中的图像进行匹配,可以获得对应的印文;或者通过将某个印文与印章库中的文字进行比较,可以获得对应的印章图像。
在本实施例中,对于大量甚至海量的印章和文档,可以基于图像匹配建立印章和文档之间的关系。
例如,可以对抽取出的印章图像进行两两图像匹配。对于某两个印章图像进行匹配后可以获得某一相似度分数,在所述相似度分数大于某一分数阈值(例如可以根据经验值先设定)的情况下,确定所述两个印章图像来自同一印章;然后可以将所述两个印章图像的属性进行合并。
在例如,可以对抽取出的印章图像与印章库进行图像匹配。对于某个印章图像与所述印章库中的印章图像进行图像匹配后可以获得某一相似度分数。在所述相似度分数大于某一分数阈值(例如可以根据经验值先设定)的情况下,确定所述两个印章图像来自同一印章;然后可以将该印章图像的属性合并到所述印章库中的该印章图像的属性中。
由此,可以生成印章和文档的关联图。
图4是本发明实施例的印章和文档关联的一示例图,如图4所示,例如印章1(对应印文为“古里瞿氏”)可以与文档1(对应名称为“蒙史一卷”)、文档2(对应名称为“怀古堂印稿二卷”)、文档3(对应名称为“贤良进卷八卷”)、文档4(对应名称为“清馆印谱初集一卷续集一卷”)、文档5(对应名称为“使规一卷使缅附录一卷”)关联。
如图4所示,例如印章2(即对应印文为“铁琴铜剑楼”)可以与文档1(对应名称为“蒙史一卷”)、文档2(对应名称为“怀古堂印稿二卷”)、文档3(对应名称为“贤良进卷八卷”)、文档4(对应名称为“清馆印谱初集一卷续集一卷”)关联。
如图4所示,文档对应的属性还可以包括相关作者或编者等,例如张灏(明)、严澄(明)等等。此外,图4仅示例性示出了印章和文档的关联图的部分内容,但本发明不限于此。
在本实施例中,可以统计两个或以上印章所对应的相同文档的数量,在相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章。
例如,图4中印章1(即对应印文为“古里瞿氏”)和印章2(即对应印文为“铁琴铜剑楼”)均对应于文档1、2、3和4,即相同文档的数量为4。如果预设的数量阈值为3,则该相同文档的数量大于该数量阈值,可以认为这两个印章是候选的相关印章。
在本实施例中,相关印章的例如可以是如下情况:印章的主人是同一个人,或者属于同一个家族,或者属于同一个藏书机构,等等;但本发明不限于此,还可以是其他的相关情况。
即,可以利用例如相关印章会共同出现在多个文档中的这样的特点。如果两个印章同时出现在N(大于或等于预设阈值Nthre)个文档中,则可以判断这两个印章是候选的相关印章。通过合并的方式可以找到所有候选的相关印章。
在本实施例中,可以基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;然后基于所述印章内容确定两个或以上的所述候选印章是否为相关印章。
在一个实施方式中,可以将两个或以上候选印章所对应的印章内容通过搜索引擎进行搜索;在所述两个或以上候选印章所对应的印章内容都出现在相关搜索结果中的情况下,确定所述两个或以上候选印章是相关印章。
例如,可以将印章1对应的印文“古里瞿氏”和印章2对应的印文“铁琴铜剑楼”通过搜索引擎(例如Google,百度,或者某一知识库等)进行搜索,如果这两个印文都出现在相关搜索结果(例如同一网页,或者同一知识库的相应章节、段落等)中,则确定所述两个或以上印章所对应的印章内容相关。
以百度搜索为例,可以在百度中搜索“古里瞿氏铁琴铜剑楼”,表1示例性示出了部分搜索结果:
表1
如表1所示,搜索返回的结果中,这些关键词都出现在了同一网页的同一段落中。因此可以确定印章1和印章2是相关印章。值得注意的是,表1仅示意性说明了搜索结果的一个例子,但本发明不限于此。
在另一个实施方式中,可以基于语义对两个或以上候选印章所对应的印章内容进行分析;在所述两个或以上候选印章所对应的印章内容的语义相同或相似的情况下,确定所述两个或以上候选印章是相关印章。
例如,可以通过人工分析(例如有经验的专家)或机器分析(例如文本理解)等确定是否是相关印章。例如,使用文本理解可以发现印章1(即对应印文为“古里瞿氏”)的主人是“瞿绍基”,他是“铁琴铜剑楼”(对应印章2)的创始人,因此可以确定印章1和印章2是相关印章。
在本实施例中,在确定两个或以上的候选印章为相关印章的情况下,可以为所述两个或以上的候选印章建立印章和印章之间的关系。例如可以为印章加上“相关印章”的属性,并添加对应的相关印章的标识。
在本实施例中,还可以基于印章和印章之间的关系更新印章和文档之间的关系。例如,把相关印章合并为一个大类,同时把对应的文档也进行合并,从而构建出一个该印章类所包含的文档集合。
由此,可以挖掘和建立印章之间的关联,从而获得大量新的信息。例如,图4所示的实例中,如果确定了印章1和印章2之间的相关关系,则即使图4中印章2和文档5没有关联,但也可以通过印章1和文档5的关系以及印章1和印章2的关系,将印章2和文档5关联起来,从而获得新的信息。
此外,在候选印章的基础上,再通过印章内容进行进一步确认是否为相关印章,可以提高印章和文档之间关系信息的准确性,从而获得的信息更加可靠。例如,图4所示的实例中,印章1和文档1之间的联系是通过图像匹配建立的,由于图像识别可能存在的误差,这种联系的可靠性可能仅有50%。如果确定了印章1和印章2之间的相关关系,并且印章2和文档1之间也存在联系,则可以认为印章1和文档1之间的联系是比较可靠的,例如可靠性可以提高到90%。
图5是本发明实施例的印章图像的处理方法的另一示意图,以两个印章为例进行更加详细的说明。如图5所示,印章图像的处理方法500可以包括:
步骤501,从扫描的文档图像中抽取多个印章图像,其中抽取出的印章图像的属性至少包括对应文档的标识;
步骤502,基于图像匹配建立印章和文档之间的关系;
步骤503,选择某两个印章;
步骤504,判断两个印章所对应的相同文档的数量是否大于或等于阈值;在相同文档的数量大于或等于预设的数量阈值的情况下,执行步骤505;在相同文档的数量没有大于预设的数量阈值的情况下可以执行步骤503,重新选择两个印章。
步骤505,将所述两个印章作为相关联的候选印章;
步骤506,基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;
步骤507,基于印章内容判断这两个候选印章是否为相关印章;如果是则执行步骤508;如果不是则可以执行步骤503,重新选择两个印章。
例如,可以通过搜索引擎对印章内容进行搜索,或者也可以基于语义对印章内容进行分析;本发明不限于此。
步骤508,为所述两个候选印章建立印章和印章之间的关系。
步骤509,判断是否满足预设条件,如果是则执行步骤510,否则执行步骤503,重新选择两个印章。
例如,是否超过预定时间,或者是否超过预定的处理次数,或者是否所有印章均被处理到,等等。
步骤510,基于印章和印章之间的关系更新印章和文档之间的关系。
值得注意的是,以上图5仅对本发明实施例进行了示意性说明,但本发明不限于此。例如可以适当地调整各个步骤之间的执行顺序,此外还可以增加其他的一些步骤或者减少其中的某些步骤。本领域的技术人员可以根据上述内容进行适当地变型,而不仅限于上述附图5的记载。
由上述实施例可知,在两个或以上印章所对应的相同文档的数量大于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;并基于所述候选印章的印章内容确定两个或以上的所述候选印章是否为相关印章;以及在确定为相关印章的情况下,为两个或以上的候选印章建立印章和印章之间的关系。由此,不但能够挖掘和建立印章之间的关联,从而获得大量新的信息;而且能够大大地提高印章和文档之间关系信息的准确性,从而获得更加可靠的信息。
实施例2
本发明实施例提供一种印章图像的处理装置,本发明实施例对应于实施例1的印章图像的处理方法,相同的内容不再赘述。
图6是本发明实施例的印章图像的处理装置的一示意图,如图6所示,印章图像的处理装置600包括:
印章图像抽取单元601,其从扫描的文档图像中抽取多个印章图像,其中抽取出的印章图像的属性至少包括对应文档的标识;
印章与文档关系建立单元602,其基于图像匹配建立印章和文档之间的关系;
候选印章确定单元603,其统计两个或以上印章所对应的相同文档的数量,在相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;
印章内容识别单元604,其基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;
相关印章确定单元605,其基于所述印章内容确定两个或以上的所述候选印章是否为相关印章;以及
印章与印章关系建立单元606,其在确定所述两个或以上的候选印章为所述相关印章的情况下,为所述两个或以上的候选印章建立印章和印章之间的关系。
如图6所示,印章图像的处理装置600还可以包括:
印章与文档关系更新单元607,其基于所述印章和印章之间的关系更新所述印章和文档之间的关系。
图7是本发明实施例的印章与文档关系建立单元的一示意图,如图7所示,印章与文档关系建立单元602可以包括:
印章匹配单元701,其对抽取出的每两个印章图像进行图像匹配,或者对抽取出的某个印章图像与所述印章库中的印章图像进行图像匹配,以获得一相似度分数。
如图7所示,印章与文档关系建立单元602还可以包括:
相同印章确定单元702,其在所述相似度分数大于或等于预设的分数阈值的情况下,确定所述两个印章图像来自同一印章;以及
属性合并单元703,其将所述两个印章图像的属性进行合并。
在本实施例中,相关印章确定单元605具体可以用于:将所述两个或以上候选印章所对应的印章内容通过搜索引擎进行搜索;在所述两个或以上候选印章所对应的印章内容都出现在相关搜索结果中的情况下,确定所述两个或以上候选印章是所述相关印章。
在本实施例中,相关印章确定单元605具体还可以用于:基于语义对所述两个或以上候选印章所对应的印章内容进行分析;在所述两个或以上候选印章所对应的印章内容的语义相同或相似的情况下,确定所述两个或以上候选印章是所述相关印章。
值得注意的是,以上仅对与本发明相关的各部件或模块进行了说明,但本发明不限于此,对于印章图像的处理装置的其他部件或模块,还可以参考相关技术。
由上述实施例可知,在两个或以上印章所对应的相同文档的数量大于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;并基于所述候选印章的印章内容确定两个或以上的所述候选印章是否为相关印章;以及在确定为相关印章的情况下,为两个或以上的候选印章建立印章和印章之间的关系。由此,不但能够挖掘和建立印章之间的关联,从而获得大量新的信息;而且能够大大地提高印章和文档之间关系信息的准确性,从而获得更加可靠的信息。
实施例3
本发明实施例还提供一种电子设备,包括有如实施例2所述的印章图像的处理装置,其内容被合并于此。该电子设备例如可以是计算机、服务器、工作站、膝上型计算机、智能手机,等等;但本发明不限于此。
图8是本发明实施例的电子设备的一示意图。如图8所示,电子设备800可以包括:中央处理器(CPU)810和存储器820;存储器820耦合到中央处理器810。其中该存储器820可存储各种数据;此外还存储信息处理的程序,并且在中央处理器100的控制下执行该程序。
在一个实施方式中,印章图像的处理装置600的功能可以被集成到中央处理器810中。其中,中央处理器810可以被配置为实现如实施例1所述的印章图像的处理方法。
在另一个实施方式中,印章图像的处理装置600可以与中央处理器810分开配置,例如可以将印章图像的处理装置600配置为与中央处理器810连接的芯片,通过中央处理器810的控制来实现印章图像的处理装置600的功能。
例如,中央处理器810可以被配置为进行如下的控制:从扫描的文档图像中抽取多个印章图像;基于图像匹配建立印章和文档之间的关系;统计两个或以上印章所对应的相同文档的数量,在相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;基于所述印章内容确定两个或以上的所述候选印章是否为相关印章;以及在确定所述两个或以上的候选印章为所述相关印章的情况下,为所述两个或以上的候选印章建立印章和印章之间的关系。
此外,如图8所示,电子设备800还可以包括:输入输出(I/O)设备830和显示器840等;其中,上述部件的功能与现有技术类似,此处不再赘述。值得注意的是,电子设备800也并不是必须要包括图8中所示的所有部件;此外,电子设备800还可以包括图8中没有示出的部件,可以参考现有技术。
本发明实施例还提供一种计算机可读程序,其中当在电子设备中执行所述程序时,所述程序使得计算机在所述电子设备中执行实施例1所述的印章图像的处理方法。
本发明实施例还提供一种存储有计算机可读程序的存储介质,其中所述计算机可读程序使得计算机在电子设备中执行实施例1所述的印章图像的处理方法。
本发明以上的装置和方法可以由硬件实现,也可以由硬件结合软件实现。本发明涉及这样的计算机可读程序,当该程序被逻辑部件所执行时,能够使该逻辑部件实现上文所述的装置或构成部件,或使该逻辑部件实现上文所述的各种方法或步骤。本发明还涉及用于存储以上程序的存储介质,如硬盘、磁盘、光盘、DVD、flash存储器等。
结合本发明实施例描述的方法/装置可直接体现为硬件、由处理器执行的软件模块或二者组合。例如,图6中所示的功能框图中的一个或多个和/或功能框图的一个或多个组合(例如,候选印章确定单元和相关印章确定单元等),既可以对应于计算机程序流程的各个软件模块,亦可以对应于各个硬件模块。这些软件模块,可以分别对应于图1所示的各个步骤。这些硬件模块例如可利用现场可编程门阵列(FPGA)将这些软件模块固化而实现。
软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域已知的任何其它形式的存储介质。可以将一种存储介质耦接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息;或者该存储介质可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该软件模块可以存储在移动终端的存储器中,也可以存储在可插入移动终端的存储卡中。例如,若设备(如移动终端)采用的是较大容量的MEGA-SIM卡或者大容量的闪存装置,则该软件模块可存储在该MEGA-SIM卡或者大容量的闪存装置中。
针对附图中描述的功能方框中的一个或多个和/或功能方框的一个或多个组合,可以实现为用于执行本申请所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或者其任意适当组合。针对附图描述的功能方框中的一个或多个和/或功能方框的一个或多个组合,还可以实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、与DSP通信结合的一个或多个微处理器或者任何其它这种配置。
以上结合具体的实施方式对本发明进行了描述,但本领域技术人员应该清楚,这些描述都是示例性的,并不是对本发明保护范围的限制。本领域技术人员可以根据本发明的精神和原理对本发明做出各种变型和修改,这些变型和修改也在本发明的范围内。
Claims (10)
1.一种印章图像的处理装置,其特征在于,所述处理装置包括:
印章图像抽取单元,其从扫描的文档图像中抽取多个印章图像,其中抽取出的印章图像的属性至少包括对应文档的标识;
印章与文档关系建立单元,其基于图像匹配建立印章和文档之间的关系;
候选印章确定单元,其统计两个或以上印章所对应的相同文档的数量,在相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;
印章内容识别单元,其基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;
相关印章确定单元,其基于所述印章内容确定两个或以上的所述候选印章是否为相关印章;以及
印章与印章关系建立单元,其在确定所述两个或以上的候选印章为所述相关印章的情况下,为所述两个或以上的候选印章建立印章和印章之间的关系。
2.根据权利要求1所述的处理装置,其中,所述处理装置还包括:
印章与文档关系更新单元,其基于所述印章和印章之间的关系更新所述印章和文档之间的关系。
3.根据权利要求1所述的处理装置,其中,所述印章与文档关系建立单元包括:
印章匹配单元,其对抽取出的每两个印章图像进行图像匹配,或者对抽取出的某个印章图像与所述印章库中的印章图像进行图像匹配,以获得一相似度分数。
4.根据权利要求3所述的处理装置,其中,所述印章与文档关系建立单元还包括:
相同印章确定单元,其在所述相似度分数大于或等于预设的分数阈值的情况下,确定两个印章图像来自同一印章;以及
属性合并单元,其将所述两个印章图像的属性进行合并。
5.根据权利要求1所述的处理装置,其中,所述相关印章确定单元具体用于:将所述两个或以上候选印章所对应的印章内容通过搜索引擎进行搜索;在所述两个或以上候选印章所对应的印章内容都出现在相关搜索结果中的情况下,确定所述两个或以上候选印章是所述相关印章。
6.根据权利要求1所述的处理装置,其中,所述相关印章确定单元具体用于:基于语义对所述两个或以上候选印章所对应的印章内容进行分析;在所述两个或以上候选印章所对应的印章内容的语义相同或相似的情况下,确定所述两个或以上候选印章是所述相关印章。
7.一种印章图像的处理方法,其特征在于,所述处理方法包括:
从扫描的文档图像中抽取多个印章图像,其中抽取出的印章图像的属性至少包括对应文档的标识;
基于图像匹配建立印章和文档之间的关系;
统计两个或以上印章所对应的相同文档的数量,在相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;
基于预设的印章库对所述候选印章的图像进行内容识别,获取所述候选印章的图像所对应的印章内容;
基于所述印章内容确定两个或以上的所述候选印章是否为相关印章;以及
在确定所述两个或以上的候选印章为所述相关印章的情况下,为所述两个或以上的候选印章建立印章和印章之间的关系。
8.根据权利要求7所述的处理方法,其中,基于所述印章内容确定两个或以上的所述候选印章是否为相关印章包括:
将所述两个或以上候选印章所对应的印章内容通过搜索引擎进行搜索;
在所述两个或以上候选印章所对应的印章内容都出现在相关搜索结果中的情况下,确定所述两个或以上候选印章是所述相关印章。
9.根据权利要求7所述的处理方法,其中,基于所述印章内容确定两个或以上的所述候选印章是否为相关印章包括:
基于语义对所述两个或以上候选印章所对应的印章内容进行分析;
在所述两个或以上候选印章所对应的印章内容的语义相同或相似的情况下,确定所述两个或以上候选印章是所述相关印章。
10.一种电子设备,包括如权利要求1至6任一项所述的印章图像的处理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710042059.0A CN108334800B (zh) | 2017-01-20 | 2017-01-20 | 印章图像的处理装置、方法以及电子设备 |
JP2018003969A JP2018116701A (ja) | 2017-01-20 | 2018-01-15 | 印鑑画像の処理装置、方法及び電子機器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710042059.0A CN108334800B (zh) | 2017-01-20 | 2017-01-20 | 印章图像的处理装置、方法以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108334800A CN108334800A (zh) | 2018-07-27 |
CN108334800B true CN108334800B (zh) | 2021-09-24 |
Family
ID=62922958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710042059.0A Active CN108334800B (zh) | 2017-01-20 | 2017-01-20 | 印章图像的处理装置、方法以及电子设备 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2018116701A (zh) |
CN (1) | CN108334800B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368339B (zh) * | 2019-11-06 | 2020-12-01 | 胡金钱 | 电子签章载入方法和装置 |
CN112784835B (zh) * | 2021-01-21 | 2024-04-12 | 恒安嘉新(北京)科技股份公司 | 圆形印章的真实性识别方法、装置、电子设备及存储介质 |
CN114898382B (zh) * | 2021-10-12 | 2023-02-21 | 北京九章云极科技有限公司 | 一种图像处理方法及装置 |
CN114581651B (zh) * | 2022-03-10 | 2024-11-05 | 浙江大学 | 一种基于ar眼镜的书画关联比对分析系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101488214A (zh) * | 2008-01-15 | 2009-07-22 | 中国科学院软件研究所 | 一种扩展防伪数字水印和电子印章信息量的方法 |
AU2009101052A4 (en) * | 2009-10-15 | 2009-12-17 | Darbyshire, Adam Mr | Remote Witnessing System |
CN103258197A (zh) * | 2012-02-17 | 2013-08-21 | 柯尼卡美能达商用科技株式会社 | 图像处理装置及其控制方法 |
CN105989307A (zh) * | 2015-03-20 | 2016-10-05 | 株式会社理光 | 电子印章、用于电子印章的方法、以及认证系统 |
CN106250385A (zh) * | 2015-06-10 | 2016-12-21 | 埃森哲环球服务有限公司 | 用于文档的自动化信息抽象处理的系统和方法 |
-
2017
- 2017-01-20 CN CN201710042059.0A patent/CN108334800B/zh active Active
-
2018
- 2018-01-15 JP JP2018003969A patent/JP2018116701A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101488214A (zh) * | 2008-01-15 | 2009-07-22 | 中国科学院软件研究所 | 一种扩展防伪数字水印和电子印章信息量的方法 |
AU2009101052A4 (en) * | 2009-10-15 | 2009-12-17 | Darbyshire, Adam Mr | Remote Witnessing System |
CN103258197A (zh) * | 2012-02-17 | 2013-08-21 | 柯尼卡美能达商用科技株式会社 | 图像处理装置及其控制方法 |
CN105989307A (zh) * | 2015-03-20 | 2016-10-05 | 株式会社理光 | 电子印章、用于电子印章的方法、以及认证系统 |
CN106250385A (zh) * | 2015-06-10 | 2016-12-21 | 埃森哲环球服务有限公司 | 用于文档的自动化信息抽象处理的系统和方法 |
Non-Patent Citations (2)
Title |
---|
Logo and seal based administrative document image retrieval: A survey;Alireza Alaei et al;《Computer Science Review》;20161130;全文 * |
印鉴提取和识别的研究及应用;宋成璐;《中国优秀硕士学位论文全文数据库信息科技辑》;20161015;第2016年卷(第10期);I138-378 * |
Also Published As
Publication number | Publication date |
---|---|
CN108334800A (zh) | 2018-07-27 |
JP2018116701A (ja) | 2018-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110135411B (zh) | 名片识别方法和装置 | |
US12019675B2 (en) | Recognizing text in image data | |
US8818033B1 (en) | System and method for detecting equations | |
US8838657B1 (en) | Document fingerprints using block encoding of text | |
US8843815B2 (en) | System and method for automatically extracting metadata from unstructured electronic documents | |
US20150095769A1 (en) | Layout Analysis Method And System | |
CN111291572B (zh) | 一种文字排版方法、装置及计算机可读存储介质 | |
CN108334800B (zh) | 印章图像的处理装置、方法以及电子设备 | |
EP2291812A2 (en) | Forum web page clustering based on repetitive regions | |
CN113033269B (zh) | 一种数据处理方法及装置 | |
CN112560849B (zh) | 基于神经网络算法的文理分割方法及系统 | |
CN101719142A (zh) | 基于分类字典的稀疏表示图片文字检测方法 | |
CN111310750B (zh) | 一种信息处理方法、装置、计算设备及介质 | |
CN106815253B (zh) | 一种基于混合数据类型数据的挖掘方法 | |
CN110532449B (zh) | 一种业务文档的处理方法、装置、设备和存储介质 | |
CN113255369B (zh) | 文本相似度分析的方法、装置及存储介质 | |
CN114550193A (zh) | 文档完整性检测方法、系统和电子设备 | |
CN112364640B (zh) | 实体名词链接方法、装置、计算机设备和存储介质 | |
CN113936187A (zh) | 文本图像合成方法、装置、存储介质及电子设备 | |
CN114155547B (zh) | 一种图表识别方法、装置、设备及存储介质 | |
KR101800975B1 (ko) | 필기체가 인식되어 생성된 전자문서의 공유 방법 및 그 장치 | |
CN114818627A (zh) | 一种表格信息抽取方法、装置、设备及介质 | |
CN115329754A (zh) | 一种文本主题提取方法、装置、设备及存储介质 | |
CN109739981B (zh) | 一种pdf文件类别判定方法及文字提取方法 | |
CN112100336A (zh) | 一种档案的保存时间鉴定方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |