CN104412277A - 比较两个含有图形元素和文本元素的文件的设备和方法 - Google Patents
比较两个含有图形元素和文本元素的文件的设备和方法 Download PDFInfo
- Publication number
- CN104412277A CN104412277A CN201380035062.XA CN201380035062A CN104412277A CN 104412277 A CN104412277 A CN 104412277A CN 201380035062 A CN201380035062 A CN 201380035062A CN 104412277 A CN104412277 A CN 104412277A
- Authority
- CN
- China
- Prior art keywords
- text
- file
- graphic element
- files
- comparing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 23
- 230000000052 comparative effect Effects 0.000 claims description 14
- 230000005055 memory storage Effects 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- VEMKTZHHVJILDY-UHFFFAOYSA-N resmethrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/156—Query results presentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
Abstract
为避免阻塞次要错误及其导致的再也识别不到准确的错误,提供了一种用于比较两个包含图形元素和文本元素的文件的设备,其包含针对两个文件的存储器、用于将两个文件分割成图形元素和文本元素的装置、用于进行文本识别的装置、用于从图形元素中产生位图的位图形装置、用于比较已提取的文本的装置、用于比较位图的装置以及用于优选地一并输出两个比较结果的装置。
Description
发明领域
本发明涉及一种用于比较两个含有图形元素和文本元素的文件的装置。
背景技术
现有技术中已知的相应的设备为文本验证工具(TVT)或对象验证工具(OVT)。就OVT而言,通过逐个像素地比较两个文件来进行对象的比较,为此,如果必要的话要预先渲染这两个文件。对于这些文件的纯图形元素来说,由于能检测到当时任何像素的偏移并立即将该偏移作为错误提供,因此可获得很好的结果。由于在文本改变的过程中,会产生行中断或更改的字母或单词空格,即使没有发生改变其也会直接导致各个像素的偏移,并且该偏移会作为错误提供,因此这样的OVT注定不适用于文本的比较。后者不会在文本验证的过程中发生,在这种情况下,首先从各个文件中提取文本,为此可使用例如本身已知的OCR程序。同样地,对于文本识别,首先通过从更复杂的文件中进行提取的方式来对文本进行分割,这些更复杂的文件例如是具有恰当地定义为文本的文件元素的pdf、PostScript、Word文件。另外,针对TVT而言,依据文件类型还要对文本串流或文本流进行定级从而允许内容或文本的比较,这对多栏文本、或其他段落号或行号位于文本前的文本、或页眉、页脚项或页边码位于顶部或底部的文本来说尤为必要。然而,此后通过这种文本比较工具能够迅速且精确地检测到并提供任意文本的变化。不过这种文本比较工具的缺陷在于:不能比较图形,从而最终无论是否存在相同的图像,全局的比较在这里顶多是可能的。
因此,在这两种情况下,均阻塞了次要错误的发生,从而再也检测不到确切的错误。据此,本发明的任务是避免所说的该类方法和设备的这个缺陷。
发明内容
作为解决方案,本发明提供了具有独立权利要求的特征的设备和方法。
因此,用于比较两个包含图形和文本元素的文件的设备的特征在于,其包括:针对两个文件的存储器、用于将两个文件分割成图形元素和文本元素的装置、用于进行文本识别的装置、用于从图形元素中产生位图(Rastergrafiken)的位图形装置、用于比较已提取的文本的装置、用于比较位图的装置以及用于优选一并输出两个比较结果的装置。
用于比较两个包含图形元素和文本元素的文件的方法的特征在于:将图形元素和文本元素在两个文件中进行分割;该方法的特征还在于:如果必要的话,从图形元素中产生各个位图,位图形彼此进行图形比较;如果必要的话,从文本元素中对各个文本进行识别,文本彼此进行文本比较。
因此,通过前述的图形元素和文本元素的分割操作,可以首次分别对各个元素进行适用于此目的的查看或适用于此目的的比较,其优势在于相应的对比也会得到相应的有意义的结果及能进行有意义地解释的结果。
就此而言,能理解的是,位图的产生仅在相应的文件尚未具有位图格式时是必要的。同样地,当文件已经具有以纯格式提供的文本时,可以不需要进行相应的文本识别。然而,尤其是在日常专业的商务活动例如在准备证据副本及其讨论期间,由于此时所采用的文件经常为图形容器格式,例如pdf文件或PostScript文件,因此更有可能涉及照片。
基本上,针对图形元素和文本元素的分割而言有利的是先对文本元素进行分割并优选地将其置于单独的层。例如,这可通过应用文本识别程序(例如OCR),并经由例如以位图格式存在的文件来实现。然后将在这种情况下识别出来的文本恰当地置于单独的层中,并且优选地将其从图形层中移除出去。如果必要的话,也可以其它方式准备仅包含图形的层,例如通过将所有不属于文本元素的元素移至恰当的图形层中的方式。如果文本以图形容器格式提供,例如,可对相应地标记为文本元素的图形容器格式的区域进行标识,然后将它们置于单独的文本层中。
因此进行了直接的文本识别,为此,在必要时经由其自身已知的表格给以图形容器格式提供的符号分配字母,以便于识别这样的文本,然后通过进行文本流处理将文本转换成nhro(自然的人类阅读顺序)文本。由此,将栏或表格符号中的文本等整合成在当前的上下文环境中具有含义的单元,这最终可从TVT中的现有技术中充分得知。具体说,可以理解的是,可使这些文本的阅读或流动顺序与各种语言相适应,例如先从左对右然后仅从上至下,或者先从上至下然后仅从右至左。然后,对文本的任何变化进行编辑,并以人们能立即理解和明白的方式提供该变化。
因此,如果相应的文本识别装置还包括用于从文本元素中提取文本的装置以及用于提供文本流的装置的话,这也是有利的。
在这种情况下,文本识别可得到文本层中的文本,或甚至得到单独的nhro文本层中的文本。
就已包含单独的文本的适当的容器格式而言,可以理解的是,可省去复杂的文本识别,因为这些文本可以从各个容器格式中选择性地提取。然而实际上,进行比较的文件中的至少一个文件不会以此种格式存在,或即使会以这种格式存在也不会包含单独的文本,因此必须首先执行前文所述的复杂的文本识别。
如果图形元素尚未以位图格式存在,则当将这些图形元素渲染为位图(即转换为位图)时,这是有利的。就此而言,能理解的是,必要时使相应的位图在各个文件的主层里或图形层里或附加的位图层里提供。
对于渲染而言,具体说,位图形装置可包括位图形引擎和/或甚至包括位图形处理器。由此,可快速且操作方面上可靠地以期望精度进行相应的位图处理或相应的渲染。
优选的是,将一并提供比较结果,这可通过例如是叠加适当的层的方式来实现。具体说,可将比较结果显示在作为输出装置的监视器上。
同样地,可想到的是,优选将比较结果一并保存到文件中,然后使该文件可为例如客户所用,以验证例如证据副本中的所发生的变化。因此,当输出装置包括存储器和用于将比较结果保存至存储器中的结果文件中的存储装置时,这是有利的。
当存储装置以待比较的两个文件中的至少一个文件的格式来保存结果文件时,可尤其有利地进一步处理比较结果。因此,可保证对打开以及必要时评价该结果文件必要的相关的程序对于已准备了待比较的文件中的至少一个文件的人而言是可获得的。
能理解的是,如果必要的话,可对如前所述的或如权利要求中所述的解决方案的特征进行合并,以便能适当地累积实现这些优点。
附图说明
基于以下特别参照附图对示例性的实施例进行的说明,可解释本发明的进一步的优点、目标和特征,其中:
图1在下部示出了根据本发明的处理过程,在上部示出了根据现有技术的处理过程;
图2示出了包含图形元素和文本元素的两个待比较文件,以及根据传统的对象验证方法的比较结果;
图3示出了根据本发明的处理过程以及基于图2中待比较的两个文件的结果;
图4示出了包含图形元素和文本元素的示例性的pdf文件的打印图像;
图5示出了图4的打印图像中以结构示意的形式所示的文件;
图6示出了图4和图5中以文本格式的形式所示的文件;
图7示出了包含中文文本元素的文件的比较示例;
图8示出了包含阿拉伯文本元素的文件的比较示例;以及
图9示出了包含图形元素的文件的比较示例。
具体实施方式
通过对进行比较的且具有图形元素和文本元素的文件10,20进行分割,分别将文件分割成图形层11,21和文本层12,22,首先可执行单独的文本比较和单独的图形比较,然后相应地得到合理且能理解的结果。如果必要的话,两个待比较的文件10,20甚或是仅这两个文件10,20中的一个文件在第一步骤中进行文本识别,例如OCR,或进行另一处理,在该处理中,搜索或创建包含文本的对象,从而以这种方式首先从纯图形文件10,20中准备其中具有以容器格式存在的文本元素的文件10,20。
在分割之后,渲染并比较图形层11,21,其中在单独的层32中提供图形比较的结果。
在文本层12,22中,首先进行文本识别和文本流处理,因此对于文本比较而言,各个文本13,23是可得的,然后在层31中提供文本比较的结果。
以这种方式,可快速且操作可靠地进行文档的比较或文件的比较,尤其在证据副本的情况下,要一并做出针对变化的特定于客户的要求以及该变化的记录。
通过重叠层31和层32,如果必要的话,可通过反转统一记录相应错误的图像32,也能直接编辑整幅图像。
如图2中所示,后者在对象验证中是不可能的,这是因为在这种情况下会阻塞错误的发生。同样地,能直接理解的是文本验证不可能进行图形的比较。
就此而言,例如可将文件转换为诸如是pdf的容器格式。在这种格式中,文本元素和图形元素43,44是可理解的。因此,在图4的打印图像中所示的、且包含作为图形元素44的圆和作为文本元素43的“Hello World”(“你好世界”)的文件中,可发现文本与图形分割开来,特别地该文本能从图5中所示的该文件的结构示意中推导出来。并非那么显然的是,相应的信息项也包含在各个文件的文本显示中(参见图6),从而可将文本元素以计算的方式恰当地与图形元素分开,并且如前所述地,可对文本元素进行检查。
就此而言,能理解的是文本元素绝对不限于拉丁字符。同样地,如图7和图8中的示例的方式所示,能相应地检查并比较其它诸如阿拉伯文或中文的书面语言,其中-虽然根据语言或字体-阅读方向应当适应此目的,但是由于文本的适当嵌入,通常来讲这并不代表任何问题。同样在这种情况下,如果必要的话,也可对丢失的或错误的部分45进行适当地标记,因此可进行更简单且更操作可靠的比较。
如图9中的示例的方式所示,也可对图形中的错误或有缺陷的部分45进行适当地标记。
附图标记列表:
10 文件 31 针对文本比较的结果的层
11 图形层 32 针对图形比较的结果的层
12 文本层 43 文件的文本区域
13 文本 44 文件的图形区域
20 文件 45 丢失或错误的文本
21 图形层
22 文本层
23 文本
Claims (12)
1.一种用于比较两个包含图形元素和文本元素的文件的设备,其特征在于,包括:针对这两个文件的存储器、用于将这两个文件分割成图形元素和文本元素的装置、用于进行文本识别的装置、用于从图形元素中产生位图的位图形装置、用于比较已提取的文本的装置、用于比较位图的装置以及用于优选一并输出两个比较结果的装置。
2.根据权利要求1所述的设备,其特征在于,所述位图形装置包括位图形引擎和/或位图形处理器。
3.根据权利要求1或2所述的设备,其特征在于,输出装置包括存储器和用于将比较结果保存在所述存储器中的结果文件中的存储装置。
4.根据权利要求3所述的设备,其特征在于,所述存储装置以待比较的两个文件中的至少一个文件的格式保存所述结果文件。
5.根据权利要求1至4中任一项所述的设备,其特征在于,输出装置包括监视器。
6.根据权利要求1至5中任一项所述的设备,其特征在于,文本识别装置包括用于从文本元素中提取文本的装置以及用于提供文本流的装置。
7.一种用于比较两个包含图形元素和文本元素的文件的方法,其特征在于,将图形元素和文本元素在两个文件中进行分割;其特征还在于,如果必要的话,从图形元素中产生各个位图,位图形彼此进行图形比较;如果必要的话,从文本元素中对各个文本进行识别,文本彼此进行文本比较。
8.根据权利要求7所述的方法,其特征在于,一并提供两个比较结果。
9.根据权利要求8所述的方法,其特征在于,将比较结果一并保存到一个文件中。
10.根据权利要求7至9中任一项所述的方法,其特征在于,将图形元素中的至少一个渲染成位图。
11.根据权利要求7至10中任一项所述的方法,其特征在于,对于图形元素和文本元素的分割,首先将文本元素置于单独的层中。
12.根据权利要求7至11中任一项所述的方法,其特征在于,通过进行文本流处理产生用于文本识别的具有自然的人类阅读顺序nhro的文本。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102012008512A DE102012008512A1 (de) | 2012-05-02 | 2012-05-02 | Vorrichtung und Verfahren zum Vergleich zweier Grafik- und Textelemente enthaltenden Dateien |
DE102012008512.5 | 2012-05-02 | ||
PCT/DE2013/000233 WO2013163978A1 (de) | 2012-05-02 | 2013-05-02 | Vorrichtung und verfahren zum vergleich zweier grafik- und textelemente enthaltenden dateien |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104412277A true CN104412277A (zh) | 2015-03-11 |
CN104412277B CN104412277B (zh) | 2021-08-27 |
Family
ID=48576665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380035062.XA Active CN104412277B (zh) | 2012-05-02 | 2013-05-02 | 比较两个含有图形元素和文本元素的文件的设备和方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10102223B2 (zh) |
EP (1) | EP2845145B1 (zh) |
JP (1) | JP6390858B2 (zh) |
CN (1) | CN104412277B (zh) |
CA (1) | CA2872830C (zh) |
DE (2) | DE102012008512A1 (zh) |
PL (1) | PL2845145T3 (zh) |
WO (1) | WO2013163978A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2921989A1 (en) | 2014-03-17 | 2015-09-23 | Université de Genève | Method for object recognition and/or verification on portable devices |
DE102015108236A1 (de) | 2015-05-26 | 2016-12-01 | Briends GmbH | Verfahren zur Verknüpfung von gedruckten Texten mit digitalen Inhalten |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1394313A (zh) * | 2000-11-02 | 2003-01-29 | 密刻爱你有限公司 | 电子文档中嵌入和提取文本的方法 |
CN1741034A (zh) * | 2004-08-25 | 2006-03-01 | 富士施乐株式会社 | 字符识别装置和字符识别方法 |
CN1900933A (zh) * | 2005-07-21 | 2007-01-24 | 富士施乐株式会社 | 图像搜索系统、图像搜索方法和存储介质 |
CN101853246A (zh) * | 2010-06-14 | 2010-10-06 | 深圳市万兴软件有限公司 | 一种文档格式的转换方法及装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3414455C2 (de) * | 1983-04-26 | 1996-04-25 | Wollang Peter Michael | Verfahren und Vorrichtung zum Lesen und Verarbeiten von Information, die aus dekodierbarer Schriftinformation und/oder nichtdekodierbarer Graphikinformation besteht |
US5142619A (en) * | 1990-02-21 | 1992-08-25 | International Business Machines Corporation | Method and apparatus for visually comparing files in a data processing system |
IL103016A (en) * | 1992-09-01 | 1996-11-14 | Scitex Corp Ltd | Graphic separation system and method |
US6397213B1 (en) * | 1999-05-12 | 2002-05-28 | Ricoh Company Ltd. | Search and retrieval using document decomposition |
DE10132625A1 (de) | 2001-07-05 | 2003-01-23 | Oce Printing Systems Gmbh | Verfahren, Computerprogrammprodukt und Gerätesystem zum visuellen Überprüfen von Bilddaten |
US7236632B2 (en) | 2003-04-11 | 2007-06-26 | Ricoh Company, Ltd. | Automated techniques for comparing contents of images |
JP3862694B2 (ja) | 2003-11-20 | 2006-12-27 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
US7257771B2 (en) * | 2004-05-26 | 2007-08-14 | Texterity, Inc. | System and method for converting a page description file to a composite representation thereof for fast Web viewing |
JP2007172077A (ja) | 2005-12-19 | 2007-07-05 | Fuji Xerox Co Ltd | 画像検索システム及び方法及びプログラム |
US7801392B2 (en) | 2005-07-21 | 2010-09-21 | Fuji Xerox Co., Ltd. | Image search system, image search method, and storage medium |
JP2008054147A (ja) * | 2006-08-28 | 2008-03-06 | Fuji Xerox Co Ltd | 画像処理装置および画像処理プログラム |
US8019882B2 (en) * | 2008-06-27 | 2011-09-13 | Microsoft Corporation | Content identification for peer-to-peer content retrieval |
US8335754B2 (en) * | 2009-03-06 | 2012-12-18 | Tagged, Inc. | Representing a document using a semantic structure |
US9514103B2 (en) | 2010-02-05 | 2016-12-06 | Palo Alto Research Center Incorporated | Effective system and method for visual document comparison using localized two-dimensional visual fingerprints |
US8769392B2 (en) * | 2010-05-26 | 2014-07-01 | Content Catalyst Limited | Searching and selecting content from multiple source documents having a plurality of native formats, indexing and aggregating the selected content into customized reports |
US8917275B2 (en) * | 2010-06-14 | 2014-12-23 | Microsoft Corporation | Automated contrast verifications |
US8223189B2 (en) * | 2010-07-09 | 2012-07-17 | Dialogic Corporation | Systems and methods of providing video features in a standard telephone system |
US8472727B2 (en) * | 2011-01-07 | 2013-06-25 | Yuval Gronau | Document comparison and analysis for improved OCR |
-
2012
- 2012-05-02 DE DE102012008512A patent/DE102012008512A1/de not_active Withdrawn
-
2013
- 2013-05-02 JP JP2015509304A patent/JP6390858B2/ja active Active
- 2013-05-02 CN CN201380035062.XA patent/CN104412277B/zh active Active
- 2013-05-02 WO PCT/DE2013/000233 patent/WO2013163978A1/de active Application Filing
- 2013-05-02 DE DE112013002295.8T patent/DE112013002295A5/de active Pending
- 2013-05-02 EP EP13727028.6A patent/EP2845145B1/de active Active
- 2013-05-02 PL PL13727028T patent/PL2845145T3/pl unknown
- 2013-05-02 CA CA2872830A patent/CA2872830C/en active Active
- 2013-05-02 US US14/398,362 patent/US10102223B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1394313A (zh) * | 2000-11-02 | 2003-01-29 | 密刻爱你有限公司 | 电子文档中嵌入和提取文本的方法 |
CN1741034A (zh) * | 2004-08-25 | 2006-03-01 | 富士施乐株式会社 | 字符识别装置和字符识别方法 |
CN1900933A (zh) * | 2005-07-21 | 2007-01-24 | 富士施乐株式会社 | 图像搜索系统、图像搜索方法和存储介质 |
CN101853246A (zh) * | 2010-06-14 | 2010-10-06 | 深圳市万兴软件有限公司 | 一种文档格式的转换方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US10102223B2 (en) | 2018-10-16 |
EP2845145B1 (de) | 2019-04-17 |
DE112013002295A5 (de) | 2015-04-23 |
PL2845145T3 (pl) | 2019-10-31 |
EP2845145A1 (de) | 2015-03-11 |
DE102012008512A1 (de) | 2013-11-07 |
JP6390858B2 (ja) | 2018-09-19 |
CN104412277B (zh) | 2021-08-27 |
JP2015520891A (ja) | 2015-07-23 |
WO2013163978A1 (de) | 2013-11-07 |
CA2872830A1 (en) | 2013-11-07 |
US20150213060A1 (en) | 2015-07-30 |
CA2872830C (en) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100454293C (zh) | 文档编辑方法和文档编辑设备 | |
US20110164813A1 (en) | Apparatus and method for digitizing documents | |
US8208737B1 (en) | Methods and systems for identifying captions in media material | |
US20120137207A1 (en) | Systems and methods for converting a pdf file | |
US20170099403A1 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
JP2008071173A (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
KR100905857B1 (ko) | 정보 처리 장치 및 정보 처리 장치의 제어 방법 | |
CN109726369B (zh) | 一种基于标准文献的智能模板化题录技术实现方法 | |
CN113610068B (zh) | 基于试卷图像的试题拆解方法、系统、存储介质及设备 | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US7661063B2 (en) | Document processing apparatus and control method thereof | |
CN104412277A (zh) | 比较两个含有图形元素和文本元素的文件的设备和方法 | |
CN101901341B (zh) | 从可移植电子文档中提取光栅图像的方法和设备 | |
JP6080586B2 (ja) | 文字認識システム、文字認識プログラム及び文字認識方法 | |
JP5483467B2 (ja) | 帳票読取装置、角印検出方法、および、角印検出プログラム | |
CN112100978B (zh) | 基于电子书的排版处理方法、电子设备及存储介质 | |
US8923625B2 (en) | Original image searching device, original image searching method, and computer readable medium | |
JPH1063744A (ja) | 文書のレイアウト解析方法及びシステム | |
US10526750B2 (en) | Processing print media including marked portions and unmarked portions | |
JP2009223391A (ja) | 画像処理装置及び画像処理プログラム | |
JP3823005B2 (ja) | ビットマップフォント作成装置および文書復元装置 | |
US10659654B2 (en) | Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document | |
JP4651407B2 (ja) | 画像処理装置およびコンピュータプログラムおよび記憶媒体 | |
JP2011146852A (ja) | 制御装置及び制御方法 | |
JP2007299321A (ja) | 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |