CN102375981B - 图像处理装置 - Google Patents

图像处理装置 Download PDF

Info

Publication number
CN102375981B
CN102375981B CN201110036936.6A CN201110036936A CN102375981B CN 102375981 B CN102375981 B CN 102375981B CN 201110036936 A CN201110036936 A CN 201110036936A CN 102375981 B CN102375981 B CN 102375981B
Authority
CN
China
Prior art keywords
character
inscape
data
processing apparatus
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110036936.6A
Other languages
English (en)
Other versions
CN102375981A (zh
Inventor
松隈千紘
上条裕义
大谷和宏
小柳胜也
安达真太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN102375981A publication Critical patent/CN102375981A/zh
Application granted granted Critical
Publication of CN102375981B publication Critical patent/CN102375981B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明涉及图像处理装置。该图像处理装置包括字符识别部件、确定部件和生成部件。当生成包含第一数据和第二数据的文档数据时,其中所述第一数据表示所述文档并表示混合了所述字符的所述构成要素,所述第二数据包含由所述字符识别部件识别出的字符的字符码数据并表示显示该字符码数据表示的所述字符的字符块,确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度,来确定在显示由所述文档数据表示的文档时,是将所述第二数据表示的字符块隐藏在所述第一数据表示的所述构成要素的后面,还是将所述第二数据表示的字符块显示在所述第一数据表示的所述构成要素的前面。

Description

图像处理装置
技术领域
本发明涉及图像处理装置。
背景技术
日本特开(JP-A)2001-358925号公报公开一种技术,该技术在文档处理中根据输入的多值图像数据来创建二值图像数据,根据创建的二值图像数据识别字符码和字符位置,使用识别的字符位置数据从多值图像中去除字符,并输出其中在去除了字符的图像数据上叠加了编码后的字符数据的合成图像。
发明内容
根据上述情形而作出本发明,本发明提供一种图像处理装置。
根据本发明的第一方面,提供一种图像处理装置。该图像处理装置包括:字符识别部件,其基于通过将包含其中混合了字符的构成要素的文档作为图像来读取而获取的图像数据,对混合在构成要素中的字符执行字符识别;确定部件,当生成表示所述文档并且包含第一数据和第二数据的文档数据时,其中所述第一数据表示混合了所述字符的所述构成要素,所述第二数据包含由所述字符识别部件识别出的字符的字符码数据并表示显示该字符码数据表示的所述字符的字符块,该确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、所述构成要素中的所述字符的尺寸、或所述构成要素的类型中的至少一个,来确定在显示由所述文档数据表示的文档时,是将所述第二数据表示的字符块隐藏在所述第一数据表示的所述构成要素的后面,还是将所述第二数据表示的字符块显示在所述第一数据表示的所述构成要素的前面;以及生成部件,其生成所述文档数据,对于所述文档数据,已经根据所述确定部件的确定结果而设置了当显示所述文档时在所述字符块与所述构成要素之间的显示的前/后关系。
根据本发明的第二方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素的所述字符周围的背景区域的亮度小于第一阈值、或者所述字符周围的背景区域的亮度的分散度等于或大于第二阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
根据本发明的第三方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素中的所述字符的字符数量等于或大于第三阈值,或者如果所述构成要素中的所述字符的行数量等于或大于第四阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
根据本发明的第四方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素的所述字符的区域的亮度等于或大于第五阈值,则所述确定部件确定将所述字符块显示在所述构成要素的前面。
根据本发明的第五方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述字符识别部件的所述字符识别的精度小于第六阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
根据本发明的第六方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素中的所述字符的尺寸等于或大于第七阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
根据本发明的第七方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素的类型是被指定为隐藏所述字符块的类型的类型,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
根据本发明的第八方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,所述确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、或所述构成要素中的所述字符的尺寸中的至少一个与对应的阈值的比较结果,来确定将所述字符块隐藏在所述构成要素的后面还是将所述字符块显示在所述构成要素的前面,并且,如果所述构成要素的类型是被指定为隐藏所述字符块的类型的类型,则预先改变所述阈值,使得与确定了所述构成要素的类型不是被指定为隐藏所述字符块的类型的类型时的情况相比,确定将所述字符块隐藏在所述构成要素的后面的概率高。
根据本发明的第九方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,所述确定部件将所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、所述构成要素中的所述字符的尺寸、或所述构成要素的类型中的至少一个与存储在存储部件中的阈值或设置信息进行比较,并且基于比较结果来确定将所述字符块隐藏在所述构成要素的后面还是将所述字符块显示在所述构成要素的前面。所述图像处理装置还包括第一改变部件,该第一改变部件根据来自用户的指示而改变存储在所述存储部件中的所述阈值或所述设置信息,其中,改变所述阈值或所述设置信息的指示是从用户经由指示部件发出的。
根据本发明的第十方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述确定部件确定了将所述字符块隐藏在所述构成要素的后面,则所述生成部件生成表示如下的字符块的数据作为所述第二数据:所述字符块分别按照预定的字符颜色和背景颜色,来显示所述字符码数据表示的所述字符和所述字符周围的背景区域,并且,如果所述确定部件确定了将所述字符块显示在所述构成要素的前面,则所述生成部件生成表示如下的字符块的数据作为所述第二数据:所述字符块分别按照与处于混合在所述构成要素中的状态下的所述字符的字符颜色或者所述背景区域的背景颜色相同或相似的颜色,来显示所述字符码数据表示的所述字符和所述字符周围的背景区域。
根据本发明的第十一方面,提供本发明的第十方面的图像处理装置。在该图像处理装置中,指定当所述确定部件确定了将所述字符块隐藏在所述构成要素的后面时所述字符块的所述字符颜色和所述背景颜色的颜色指定信息预先存储在所述存储部件中;并且所述图像处理装置还包括第二改变部件,在所述确定部件确定了将所述字符块隐藏在所述构成要素的后面之后,在从用户经由指示部件发出了改变所述字符块的所述字符颜色或所述背景颜色中的至少一个的指示的情况下,该第二改变部件根据来自用户的指示而改变所述颜色指定信息。
根据本发明的第十二方面,提供本发明的第一方面的图像处理装置。该图像处理装置还包括:输入接收部件,当所述确定部件的确定结果是特定的确定结果时,该输入接收部件从用户接收去除指示信息的输入,所述去除指示信息指示从所述文档数据中去除所述第二数据。在该图像处理装置中,当通过所述输入接收部件接收到所述去除指示信息的输入并且所述确定部件的确定结果与所述去除指示信息中设置的特定确定结果相匹配时,所述生成部件生成去除了所述第二数据的数据作为所述文档数据。
根据本发明的第十三方面,提供本发明的第十二方面的图像处理装置。在该图像处理装置中,当生成去除了所述第二数据的数据作为所述文档数据时,所述生成部件生成将混合在所述构成要素中的状态下的所述字符表示为图像的字符图像数据,并且生成如下的数据作为所述文档数据:所述数据包含生成的所述字符图像数据,并将在显示所述文档时在表示所述字符图像数据的字符图像与所述构成要素之间的显示的前/后关系设置为,使得在显示所述文档时将所述字符图像显示在所述构成要素的前面。
根据本发明的第十四方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,至少所述第一数据具有能够设置任何信息作为所述构成要素的属性信息的格式。所述图像处理装置还包括属性设置部件,该属性设置部件将由所述字符识别部件识别出的字符的字符码数据设置到所述第一数据,作为所述构成要素的属性信息。
附图说明
基于下面附图,详细地描述本发明的示例性实施方式,在附图中:
图1是示出根据示例性实施方式的计算机系统的概略构造的框图;
图2是示出读取/文件编制处理的内容的流程图;
图3是示出前/后确定处理的内容的流程图;
图4是文档文件生成处理的内容的流程图;
图5是示出设置改变处理的内容的流程图;
图6是示出在字符识别处理中的字符颜色和背景颜色的确定的图像的图;
图7是示出基于混合了字符的对象的对象类型的字符框的前面/后面确定(阈值变化)的概念图;
图8A和图8B是示出基于字符识别的精度的字符框的前面/后面确定的概念图;
图9是示出基于字符的字体尺寸的字符框的前面/后面确定的概念图;
图10A和图10B是基于字符数量/行数量的字符框的前面/后面确定的概念图;
图11是示出基于字符的亮度的字符框的前面/后面确定的概念图;以及
图12A至12D是示出基于字符的背景颜色的亮度和背景亮度的分散度的字符框的前面/后面确定的概念图。
具体实施方式
下面参考附图将详细地描述本发明示例性实施方式的示例。图1示出根据本示例性实施方式的计算机系统10的概略构造。计算机系统10由连接到由LAN等构成的网络12的图像读取/打印装置14和由PC(个人计算机)等构成的多个终端装置24构成。
图像读取/打印装置14可以由组合了作为复印机的功能、作为打印机的功能和作为扫描仪的功能的装置构成,并包括本体控制器16,本体控制器16由微计算机等构成并包含CPU 16A、存储器16B、非易失性存储单元16C(由HDD(硬盘驱动器)、闪存等构成)和网络接口单元16D。另外,图像读取器18光学读取所设置的待读取文档(纸质原始文档)并输出读取的图像数据,图像打印单元20在记录纸上打印由输入的打印图像数据表示的图像,操作面板22设置有由LCD等构成的显示单元22A和由数字键、触摸板等构成的操作单元22B,它们各自连接到本体控制器16。
本体控制器16的网络接口单元16D连接到网络12以控制经由网络与终端装置24的通信。通过控制图像读取/打印装置14的各个单元的操作而向用户提供各种服务(例如,文档的复制和打印(从终端装置24接收的文档数据所表示的文档的打印))的本体控制程序、以及用于由CPU 16A执行稍后描述的读取/文件编制处理的读取/文件编制程序各自安装在本体控制器16的存储单元16C中,作为由CPU 16A执行的程序。
上述读取/文件编制程序是根据本发明的示例性图像处理程序,在本示例性实施方式中,通过由图像读取/打印装置14的本体控制器16的CPU 16A执行读取/文件编制程序,图像读取/打印装置14充当根据本发明的图像处理装置。
各个终端装置24包括CPU 24、存储器24B、由HDD(硬盘驱动器)或闪存等构成的非易失性存储单元24C以及网络接口单元24D,并经由网络接口单元24D连接到网络12。另外,显示器26、键盘28和鼠标30连接到终端装置24。
下面,作为本示例性实施方式的操作,将参考图2来描述通过由图像读取/打印装置14的本体控制器16的CPU 16A执行读取/文件编制程序而实现的读取/文件编制处理。在待读取的原始文档(文档)设置到图像读取器18时,当用户经由操作面板22的操作单元22B发出读取原始文档(文档)并基于读取结果生成/输出原始文档(文档)的文档文件(“扫描到文件”服务的执行)的指示时,执行读取/文件编制处理。
在读取/文件输出处理中,首先,在步骤S40,设置到图像读取器18的原始文档(文档)由图像读取器18读取为图像,并且将表示通过读取而获得的文档读取结果的图像数据(例如按照位图格式的图像数据)存储在存储单元16C中。在随后的步骤42中,执行对象分离处理,所述对象分离处理基于存储在存储单元16C中的图像数据,从所读取的文档的图像中分离/提取各种对象(构成要素),如字符、照片、图例(CG)、表格和划线。
如日本特开(JP-A)2006-203582号公报或特开(JP-A)2006-203583号公报所公开的,对象分离处理例如可以通过应用如下的技术实现:将图像分为多个块,基于针对各个块创建的L*a*b*颜色空间中的L*、a*和b*的直方图的形状、或者各个块的L*、a*和b*的方差或平均值,将各个块分类为多种块中的一种(例如,“彩色图案块”、“彩色字符和周边基底块”、“单色图案块”、“单色字符和周边基底块”、“单色基底块”和“未知属性块”),并将分为相同类的相邻块整合为单个区域,以将读取的文档的图像分为类别相互不同的多个区域(构成要素)。
在步骤44中,进行字符识别处理,所述字符识别处理通过搜索由步骤42的对象分离处理从读取的文档的图像中分离出的多个个体对象中的一个对象中存在的字符、并对根据搜索而提取出的字符执行模式匹配,从而确定所提取的字符的字符码数据、字体类型、字体尺寸、位置等。因此,不仅识别出在对象类型为“字符”(对象仅由字符构成)的对象的对象类型“字符”中存在的字符,而且识别出在对象类型并非“字符”、例如为“照片”、“CG”和“表格”的对象中混合的字符,从而确定它们的字符码数据、字体类型、字体尺寸等。在字符识别处理中,如图6所示,作为示例,也针对各个字符确定字符的颜色和背景区域的颜色(包围各个字符的矩形区域内的除了字符以外的区域的颜色)。
在步骤46,基于在步骤44中的字符识别处理的结果,确定是否存在对象类型并非“字符”并且混合了字符的对象(在字符识别处理中从其中提取了字符的对象)。如果该确定结果是否定的,则处理进行到步骤50,并且如果在步骤46中的确定结果是肯定的,则处理进行到步骤48。在该情况下,当显示文档文件表示的文档时,在进行到步骤50之前,执行前/后确定处理,该前/后确定处理确定混合了字符的对象和显示在字符识别处理中识别出的字符的字符框(根据本发明的字符块的示例)中的哪一个设置在前面。稍后将描述前/后确定处理。在步骤50,执行文档文件生成处理,该处理生成表示所读取的文档的文档文件,稍后还将描述文档文件生成处理。接着,在步骤52,在读取/文件输出处理终止之前,将在文档文件生成处理中生成的文档文件传输给用户预先指定的传输目的地(例如由用户操作的终端装置24),或在附加到电子邮件之后发送输出。
顺便提及,根据日本特开2001-358925号公报中描述的技术,执行对混合在图像中的字符的字符识别,并从图像中去除这些字符,接着输出如下的合成图像:其中,将通过字符识别而识别出的字符码表示的字符设置在已经从其中去除了字符的图像的前面。但是,根据该技术,如果去除了字符的部分的图像(混合了字符的对象)是照片图像,则难以按照在照片图像中不出现不自然的方式来设置去除了字符的部分的颜色和浓度,这使得混合了字符的对象(照片图像)的可用性降低。而且,根据在图像(混合了字符的对象)中混合的字符的尺寸、字符的数量、行的数量、或字符的字符识别的精度,设置在混合了字符的对象(照片图像)的前面的字符和已经去除混合了字符的对象(照片图像)的字符的部分可能不对齐。
在根据本示例性实施方式的前/后确定处理中,当显示由文档文件表示的文档时,考虑上述情况来确定混合了字符的对象和字符框中的哪一个设置在前面,下面参考图3描述根据本示例性实施方式的前/后确定处理。首先,在步骤90,从在读取/文件编制处理(图2)的步骤42中的对象分离处理中从读取的文档分离/提取出的多个对象中,选择作为混合了字符的对象(在文件编制处理(图2)的步骤44中的字符识别处理中从其中提取了字符的对象)并且没有执行步骤90以及此后的处理的单个对象,作为混合了字符的处理对象。
在随后的步骤92中,确定混合了字符的处理对象是否为隐藏字符框的对象类型。在本示例性实施方式中,表示在前/后确定处理中用于前/后确定(确定混合了字符的对象和字符框中的哪一个设置在前面)的确定标准的确定标准信息存储在存储单元16C中,并且确定标准信息包含设置规则信息,该设置规则信息针对各个对象类型、针对字符框的设置位置,提供混合了字符的对象的后面和前面中的哪一个是所希望的。通过将混合了字符的处理对象的对象类型与设置规则信息进行核对,以确定对于混合了字符的处理对象的对象类型来说字符框的希望设置位置是否为“后面”,从而实现步骤92中的确定。
作为示例,如图7所示,对象类型为“CG”的混合了字符的对象经常具有单个颜色作为字符的背景颜色,并且,如果字符块(例如,如图7所示,显示“2008/08/12”的字符串的字符块和显示“今天的主题”的字符串的字符块)设置在该类型的混合了字符的对象的前面,则其外观不会变差,由此,通过将字符块设置在前面,在字符块中显示的字符串的字符码数据的可再用性提高。另一方面,如类似地在图7中所示的,对象类型为“照片”的混合了字符的对象具有各种颜色/亮度(浓度)作为字符的背景颜色,并且,如果字符块(例如,如图7所示,显示“8月11日,在花园拍摄”的字符串的字符块)设置在该类型的混合了字符的对象的前面,则其外观将变差。
因此,设置规则信息的初始值(缺省值)按照以下方式设置:例如,对于对象类型为“CG”的混合了字符的对象,字符框的希望设置位置是“前面”,并且,对于对象类型为“照片”的混合了字符的对象,字符框的希望设置位置是“后面”。在本示例性实施方式中,设置规则信息的内容可以由用户改变(稍后将描述细节)。
上述确定标准信息包含八种确定阈值th1至th8,如果在步骤92中的确定结果是否定的,处理进行到步骤94,以从存储单元16C读取确定阈值th1至th8,并在进行到步骤98之前使得存储器16B存储确定阈值th1至th8。另一方面,如果在步骤92中的确定结果是肯定的,则处理进行到步骤96,以从存储单元16C读取确定阈值th1至th8,并使存储器16B存储确定阈值th1至th8。接着,在进行到步骤98之前,将确定阈值th1至th8中的当一些参数的值等于或大于确定阈值时确定为“后面”的确定阈值的值减小,并且将当一些参数的值小于确定阈值时确定为“后面”的确定阈值的值增加。因此,改变确定阈值th1至th8的值,使得字符框隐藏在混合了字符的处理对象的后面的概率高于当步骤92中的确定结果为否定时的情况。
步骤92至步骤96是根据第八方面的由确定单元进行的处理的示例。替代上述步骤94和步骤96的处理,如果在设置规则信息中提供的字符框的希望设置位置是“后面”,则存储在存储单元16C中的确定阈值th1至th8可以按照原样使用,而如果在设置规则信息中提供的字符框的希望设置位置是“前面”,则存储在存储单元16C中的确定阈值th1至th8的值可以按照如下的方式改变:使得字符框设置在混合了字符的处理对象的前面的概率变高,并且,如果在设置规则信息中提供的字符框的希望设置位置是“后面”和“前面”,则存储在存储单元16C中的确定阈值th1至th8的值可以分别地变化(在相反的方向上变化)。
在步骤98,获取对混合了字符的处理对象中混合的字符在字符识别处理(图2中的步骤44)中计算出的字符识别的精度。字符识别的精度是针对各个字符分别计算的,因此,在步骤98,分别地获取对混合了字符的处理对象中混合的全部字符的字符识别的精度,接着,计算获取的精度的平均值,或者计算获取的精度的最小值,作为对混合了字符的处理对象的字符识别的精度。在随后的步骤100,确定在步骤98中获取的对混合了字符的处理对象的字符识别的精度是否小于在存储器16B中存储的8个确定阈值th1至th8中的与字符识别的精度相关的确定阈值th6。在示例性实施方式中,可选地,确定阈值th6也可以由用户改变(稍后将描述细节)。
在字符块中显示字符识别处理中识别出的字符码数据所表示的字符(串)的同时,如果在步骤100中的确定结果是肯定的,作为示例,如图8B所示,在字符块中显示的字符(串)可能不同于混合了字符的处理对象中混合的字符(串)(在图8B中示出的示例中,例如,在混合了字符的处理对象中混合了字符串“ABCDE”,而在字符块中显示字符串“ARCDE”,这两个字符串不同)。因此,如果在步骤100的确定结果是肯定的,则处理进行到步骤124,确定字符框的设置位置是混合了字符的处理对象的“后面”,之后进行到步骤128。
另一方面,如果在步骤100的确定结果是否定的,作为示例,如图8A所示,在字符块中显示的字符(块)很可能与混合了字符的处理对象中混合的字符(串)匹配,因此,处理进行到步骤102,而不确定字符框的设置位置是混合了字符的处理对象的“后面”。上述步骤98和100是根据第五方面的由确定单元进行的处理的示例。
在步骤102,对混合在混合了字符的处理对象中的字符,获取在字符识别处理(图2中的步骤44)中识别的字符的尺寸。也是针对各个字符分别地计算字符的尺寸,因此在步骤102,针对混合在混合了字符的处理对象中的全部字符,分别地获取字符的尺寸,接着,计算所获取的尺寸中的最大尺寸,作为混合在混合了字符的处理对象中的字符的尺寸。在随后的步骤104中,确定在步骤102中获取的混合在混合了字符的处理对象中的字符的尺寸是否为存储在存储器16B中的8个确定阈值th1至th8中的与字符尺寸相关的确定阈值(在大尺寸侧的确定阈值)th7或更大。
作为示例,如图9所示,如果混合在混合了字符的处理对象中的字符的尺寸很大(作为示例,如果为18pt或更大),则由于在字符识别处理中的识别结果的轻微偏差或字体类型的差别,在字符块中显示的字符(串)可能相对于混合在混合了字符的处理对象中的字符(串)不对齐。因此,如果在步骤104中的确定结果是肯定的,则处理进行到步骤124,确定字符框的设置位置是混合了字符的处理对象的“后面”,之后进行到步骤128。步骤104是根据第六方面的由确定单元进行的处理的示例。
如果在步骤104中的确定结果是否定的,则处理进行到步骤106,确定在步骤102中获取的混合在混合了字符的处理对象中的字符的尺寸是否小于存储在存储器16B中的8个确定阈值th1至th8中的与字符尺寸相关的确定阈值(小尺寸侧的确定阈值)th8。作为示例,如图9所示,如果混合在混合了字符的处理对象中的字符的尺寸很小(作为示例,如果为6pt或更小),则在字符块中显示的字符(串)不太可能相对于混合在混合了字符的处理对象中的字符(串)不对齐,因此,如果在步骤106中的确定结果是肯定的,则处理进行到步骤126,确定字符框的设置位置是混合了字符的处理对象的“前面”,之后进行到步骤129。
如果在步骤104和106中的确定结果都是否定的,则处理进行到步骤108。在本示例性实施方式中,可选地,确定阈值th7和th8也可以由用户改变(稍后将描述细节)。上述步骤102至106是根据第六方面的由确定单元进行的处理的示例。
在步骤108,获取在字符识别处理(图2中的步骤44)中识别的、混合在混合了字符的处理对象中的字符的字符数量和行数量。在随后的步骤110中,确定在步骤108获取的、混合在混合了字符的处理对象中的字符的数量是否为存储在存储器16B中的8个确定阈值th1至th8中的与字符数量相关的确定阈值th3或更大。如果在步骤110中的确定结果是否定的,则处理进行到步骤112,确定在步骤108中获取的、混合在混合了字符的处理对象中的字符的行数量是否为存储在存储器16B中的8个确定阈值th1至th8中的与行数量相关的确定阈值th4或更大。
作为示例,如图10A所示,如果混合在混合了字符的处理对象中的字符的字符数量和行数量很大(例如,如果字符的数量是50个字符或更大,或者行的数量是5行或更大),那么,由于在行间的字体尺寸或字体类型的轻微差别的影响,在字符块中显示的字符串的行的宽度或字符的宽度可能相对于混合在混合了字符的处理对象中的字符串不对齐,并且,由于从混合了字符的处理对象的范围偏离的字符块与另一对象的部分重叠,所以这种不对齐可能导致外观变差。因此,如果步骤110和112之一的确定结果是肯定的,则处理进行到步骤124,确定字符框的设置位置为混合了字符的处理对象的“后面”(也参见图10B),之后进行到步骤128。
如果在步骤110和112中的确定结果都是否定的,则处理进行到步骤114。在本示例性实施方式中,可选地,确定阈值th3和th4也可以由用户改变(稍后将描述细节)。上述步骤108至112是根据第三方面的由确定单元进行的处理的示例。
在步骤114,获取在字符识别处理(图2中的步骤44)中确定的混合在混合了字符的处理对象中的字符的字符颜色,并且基于获取的字符颜色来计算混合在混合了字符的处理对象中的字符颜色的亮度。字符颜色的亮度可以在字符之间有所不同,因此在步骤114中,针对混合在混合了字符的处理对象中的全部字符分别地计算字符颜色的亮度,并计算针对各个字符而计算的亮度的平均值,作为混合在混合了字符的处理对象中的字符颜色的亮度。在随后的步骤116中,确定在步骤114中计算出的混合在混合了字符的处理对象中的字符颜色的亮度是否为存储在存储器16B中的8个确定阈值th1至th8中的与字符亮度相关的确定阈值th5或更大。
作为示例,如图11所示,如果在对象类型是CG的对象中混合的字符的矢量化中字符的亮度高于其背景的亮度,则由于损坏了字符边缘的可再现性,例如字符边缘上的缺口,所以外观经常变差。如果字符的背景颜色是单色,即,混合了字符的对象的对象类型是“CG”,在字符识别中识别具有高亮度的字符,并且如果在步骤116中的确定结果是肯定的,则可以确定混合在混合了字符的对象中的字符的边缘的可再现性的概率高。因此,如果在步骤116中的确定结果是肯定的,则处理进行到步骤126,确定字符框的设置位置为混合了字符的处理对象的“前面”,之后进行到步骤128。
如果在步骤116中的确定结果是否定的,则处理进行到步骤118。在本示例性实施方式中,可选地,确定阈值th5也可以由用户改变(稍后将描述细节)。上述步骤114和116是根据第四方面的由确定单元进行的处理的示例。
在步骤118,获取在字符识别处理(图2中的步骤44)中确定的、混合在混合了字符的处理对象中的字符的背景颜色,并且基于获取的背景颜色,各自计算混合在混合了字符的处理对象中的字符的背景颜色的亮度及其分散度。背景颜色的亮度也可以随字符而不同,因此在步骤118中,针对混合在混合了字符的对象中的全部字符分别地计算背景颜色的亮度,并计算针对各字符计算出的亮度的中值(当按照升序或降序重新排列各个字符的背景颜色的亮度时位于中间的亮度值),作为混合在混合了字符的处理对象中的字符的背景颜色的亮度。替代上述中值,还可以使用平均值。背景颜色的亮度的分散度例如可以通过使用下面的公式(1)来计算:
n是混合在混合了字符的处理对象中的字符的总数量,Bi是第i个字符的背景颜色的亮度,B0是混合在混合了字符的处理对象中的字符的背景颜色的亮度的平均值。
在随后的步骤120中,确定在步骤118中计算出的、混合在混合了字符的处理对象中的字符的背景颜色的亮度是否小于存储在存储器16B中的8个确定阈值th1至th8中的与背景颜色的亮度相关的确定阈值th1。如果步骤120中的确定结果是否定的,处理进行到步骤122,确定在步骤118中计算出的、混合在混合了字符的处理对象中的字符的背景颜色的亮度的分散度是否为存储在存储器16B中的8个确定阈值th1至th8中的与背景颜色的亮度的分散度相关的确定阈值th2或更大。
作为示例,如图12A所示,如果混合在混合了字符的处理对象中的字符的背景颜色的亮度低或者背景颜色的亮度的分散度大,则可以将混合了字符的处理对象判断为“照片”或近似于照片的对象。作为示例,如图12B所示,如果将以某颜色设置为背景颜色的字符块设置在这种类型的对象的前面,那么,因为字符块的背景颜色和混合了字符的对象的颜色不同,所以外观变差。另外,作为示例,如图12C所示,如果将背景被设置为透明的字符块设置在“照片”或者近似于照片的对象的前面,那么,因为由于字体类型或字体尺寸的差异而造成的在字符块中显示的字符(串)相对于混合在混合了字符的处理对象中的字符(串)不对齐,所以外观变差。
因此,如果步骤120和122之一的确定结果是肯定的,则处理进行到步骤124,确定字符框的设置位置是混合了字符的处理对象的“后面”(也参见图12D),之后进行到步骤128。如果在步骤120和122中的确定结果都是否定的,则处理进行到步骤126,确定字符框的设置位置是混合了字符的处理对象的“前面”,之后进行到步骤128。步骤118至122是根据第二方面的由确定单元进行的处理的示例。
在步骤128,确定是否已经针对从读取的文档中分离并提取的混合了字符的全部对象都执行了步骤90及其后的步骤中的处理。如果确定结果是否定的,则处理返回到步骤90,重复步骤90至128,直到在步骤128中的确定结果变为肯定。因此,针对从读取的文档中分离并提取出的混合了字符的全部对象中的每一个,进行上述前/后确定。接着,当针对从读取的文档中分离并提取出的混合了字符的全部对象都进行了上述前/后确定时,在步骤128中的确定结果为肯定,终止前后确定处理。
下面,参考图4描述文档文件生成处理。在文档文件生成处理中,首先,在步骤140,从在读取/文件编制处理(图2)的步骤42的对象分离处理中从读取的文档中分离并提取出的多个对象中,提取单个对象的数据,作为处理对象。在步骤142,基于在步骤140中提取的处理对象的数据,生成表示处理对象并且按照与处理对象的对象类型对应的格式的对象数据(例如,如果对象类型是“字符”,则为包含字符码数据并按照可以由文档处理软件来处理的格式的文档数据;如果对象类型是“照片”或“图例(CG)”,则为按照可以由图像编辑软件来处理的格式的图像数据;如果对象类型是“表格”,则为按照可以由电子制表软件来处理的格式的表格数据;并且如果对象类型是“划线”,则为按照可以由图形软件来处理的格式的矢量数据)。
在随后的步骤144中,确定处理对象是否为混合了字符的对象。如果确定结果是否定的,则处理进行到步骤166,并且如果确定结果是肯定的,则处理进行到步骤146以获取对混合在混合了字符的处理对象中的字符的字符识别处理(图2中的步骤44)的处理结果。在步骤148,获取对混合在混合了字符的处理对象中的字符的前/后确定处理(图3)的确定结果(确定混合了字符的处理对象和字符框的哪一个设置在前面的结果:前/后关系确定结果)。
在随后的步骤150中,查询存储在存储单元16C中的设置信息,并且确定在查询到的设置信息中是否设置了字符框的任何删除条件。在本示例性实施方式中,用户能够预先发出如下指示:当满足某删除条件(“字符框设置在混合了字符的对象的前面”、“字符框隐藏在混合了字符的对象的后面”、和“字符框设置在混合了字符的对象的前面或后面”中的一个)时删除对应的字符框,并且,当用户发出了这样的指示时,将用户的指示设置到设置信息,作为删除条件信息。通过确定是否对设置信息设置了删除条件信息,而做出步骤150中的确定。如果在步骤150中的确定结果是否定的,则处理进行到步骤154,而如果在步骤150中的确定结果是肯定的,则处理进行到步骤152,以确定在前/后关系确定处理(图3)中对混合了字符的处理对象和字符框的前/后关系确定结果是否与设置在删除条件信息中的删除条件相匹配。
如果在步骤152中的确定结果是否定的,则处理进行到步骤154,以根据在前/后确定处理(图3)中的前/后关系确定结果来获取关于字符颜色/背景颜色的信息,作为关于字符块的字符颜色/背景颜色的信息。即,在本示例性实施方式中,存储在存储单元16C中的设置信息包含提供了当前/后关系确定结果是“后面(字符框隐藏在混合了字符的对象的后面)”时的字符颜色/背景颜色的字符颜色/背景颜色信息(在该字符颜色/背景颜色信息中,作为初始值(缺省值),将字符颜色设置为黑色,并且将背景颜色设置为透明),并且,如果在前/后确定处理(图3)中的前/后关系确定结果是“后面”,则在步骤154中,从存储在存储单元16C中的设置信息中提取上述字符颜色/背景颜色信息。字符颜色/背景颜色信息是根据第十一方面的颜色指定信息的示例。如果在前/后确定处理(图3)中的前/后关系确定结果是“前面(字符框设置在混合了字符的对象的前面)”,则在步骤154中,获取在字符识别处理(图2中的步骤44)中对混合在混合了字符的处理对象中的字符确定的字符颜色/背景颜色。根据在前/后确定处理(图3)中的前/后关系确定结果来切换字符框的字符颜色/背景颜色是根据第十方面的由生成单元进行的处理的示例。
在随后的步骤156中,获取在字符识别处理(图2中的步骤44)中对混合在混合了字符的处理对象中的字符确定的诸如字符码数据、字体类型、字体尺寸和位置的信息,并且,按照获取的字体类型/尺寸并且按照在步骤154中获取的字符颜色来显示所获取的字符码数据表示的字符(串),并且还在用步骤154中获取的背景颜色对背景区域进行着色的情况下生成字符框的数据。字符框的数据还包含通过字符识别处理所确定的字符码数据,并且,如果在显示器等中显示包括字符框的文档的同时执行选择字符框的操作,则可以复制在字符框中显示的字符(串)的字符码数据(可以进一步粘贴复制的字符码数据),并且,如果执行搜索字符(串)的操作,则还搜索在字符框中显示的字符(串)。
在步骤158,基于在步骤156中获取的、表示混合了字符的处理对象中的字符的位置的信息,将使得在字符框中显示的字符与混合在处理对象中的字符重叠的位置设置为在步骤156中生成了数据的字符框在文档中的设置位置。在步骤160,根据在前/后确定处理(图3)中的前/后关系确定结果而设置,设置限定在混合了字符的处理对象与在步骤156中生成了数据的字符框之间的前/后关系的信息,之后进行到步骤166。
另一方面,如果在步骤150和152中的确定结果都是肯定的(如果设置了字符框的删除条件并且在前/后确定处理(图3)中的前/后关系确定结果与删除条件匹配),则处理从步骤152进行步骤162。在该情况下,不生成字符框(的数据),并且禁止使用字符框的字符码数据的上述复制/粘贴以及字符搜索。
因此,在步骤162,获取在字符识别处理(图2中的步骤44)中对混合在混合了字符的处理对象中的字符确定的字符码数据,并且将获取的字符码数据作为属性信息设置到混合了字符的处理对象的对象数据。因此,如果在显示器中显示包含混合了字符的处理对象的文档的同时执行使显示器等显示混合了字符的对象的属性信息的操作,则可以使用显示的属性信息来复制/粘贴字符码数据。上述步骤162是根据第十四方面的由属性设置单元进行的处理的示例。
在随后的步骤164中,基于混合了字符的处理对象的位图数据等,生成如下的字符图像数据(例如,按照png等的格式的图像数据):其表示处于混合在混合了字符的处理对象中的状态下的字符区域,并且,按照如下的方式设置生成的字符图像数据和混合了字符的处理对象之间的前/后关系:在混合了字符的处理对象的前面显示字符图像数据,之后进行到步骤166。在该情况下,在显示器中显示包含混合了字符的处理对象的文档的同时,替代字符码数据,可以使用字符图像数据(诸如复制/粘贴)。替代按照png等格式的图像数据,可以使用按照矢量格式表示字符的矢量数据。
上述步骤164是根据第十三方面的由生成单元进行的处理的示例。如果在步骤152中的确定结果为肯定则仅执行步骤162和164(不生成字符框的数据)是根据第十二方面的由生成单元进行的处理的示例。
在步骤166,确定是否已经对在对象分离处理(图2中的步骤42)中从读取的文档中分离并提取出的全部对象执行了上述处理。如果确定结果是否定的,则处理返回到步骤166,并重复步骤140至步骤166,直到在步骤166中的确定变为肯定。因此,针对从读取的文档分离并提取出的全部对象,至少生成对象数据(步骤142),并且,针对混合了字符的对象,进一步对其执行步骤146及其后的处理。如果在步骤166中的确定结果是肯定的,则处理进行到步骤168,以生成包含上述处理生成的全部数据(各个对象的数据、在步骤156中生成的字符框的数据、以及在步骤164中生成的字符图像数据)的文档文件,之后终止文档文件生成处理。
随后,将参考图5描述当用户经由操作面板22的操作单元22B发出如下的指示时执行的设置改变处理:所述指示要改变在前/后确定处理中查询的确定标准信息或者在文档文件生成处理中查询的设置信息。
在设置改变处理中,首先,在步骤60,确定用户指定的改变对象是否为在前/后确定处理中查询的确定标准信息。如果确定结果是肯定的,则处理进行到步骤62,使得操作面板22的显示单元22A显示确定标准改变画面,从该确定标准改变画面可以发出改变包含在确定标准信息中的设置规则信息或确定阈值th1至th8的指示。在随后的步骤64,确定用户的输入是否完成,并重复步骤64,直到在步骤64中的确定结果变为肯定。当完成了用户的输入时,在步骤64中的确定结果为肯定,并且处理进行到步骤66,在构成确定标准信息的各项信息中,将用户经由操作面板22的显示单元22A显示的确定标准改变画面而指示改变的信息,改变为用户经由确定标准改变画面而指示的值(内容),之后终止设置改变处理。上述步骤62至步骤66是根据第九方面的第一改变单元进行的处理的示例。
如果在步骤60中的确定结果是否定的,则处理进行到步骤68,以确定用户指定的改变对象是否为在文档文件生成处理中查询并包含在设置信息中的字符颜色/背景颜色信息。如果该确定结果是肯定的,则处理进行到步骤70,使操作面板22的显示单元22A显示字符颜色/背景颜色改变画面,该字符颜色/背景颜色改变画面能够发出改变字符颜色/背景颜色信息的指示。在随后的步骤72,确定用户的输入是否完成,并重复步骤72,直到该确定结果变为肯定。当完成了用户的输入时,在步骤72的确定结果为肯定,并且处理进行到步骤74,将在设置信息中包含的字符颜色/背景颜色信息,改变为用户经由操作面板22的显示单元22A显示的字符颜色/背景颜色改变画面而指示的值(内容),之后终止设置改变处理。上述步骤70至步骤74是根据第十一方面的第二改变单元进行的处理的示例。
如果在步骤68的确定结果是否定的,则确定用户希望设置针对字符块的删除条件,并且使操作面板22的显示单元22A显示能够设置针对字符块的删除条件的删除条件设置画面。在随后的步骤78中,确定是否完成了用户对删除条件的设置输入,重复步骤78,直到该确定结果为肯定。当完成了用户的设置输入时,在步骤78的确定结果为肯定,并且处理进行到步骤80,将在设置信息中包含的删除条件信息改变为用户经由操作面板22的显示单元22A显示的删除条件设置画面而指示的内容,之后终止设置改变处理。
在上面的描述中,描述了这样的方面:其中,通过使用全部确定阈值th1至th8以及混合了字符的对象的对象类型来进行前/后确定,但是本发明不限于此,毫无疑问,在本发明的范围中也包括以下方面:其中,通过使用全部确定阈值th1至th8以及混合了字符的对象的对象类型的一部分(至少一种类型)来进行前/后确定。
在上面的描述中,描述了这样的方面:其中基于混合了字符的对象的对象类型是否为字符框的隐藏对象来切换确定阈值th1至th8的值,但本发明不限于此,如上所述,可以单独使用混合了字符的对象的对象类型,以基于混合了字符的对象的对象类型来确定混合了字符的对象和字符框中的哪一个设置在前面。该方面对应于第七方面的本发明。
在上面的描述中,将矩形的字符框例示为根据本发明的字符块,但本发明不限于此,并且毫无疑问,根据本发明的字符块可以具有除了矩形以外的外形。
在上面的描述中,描述了这样的方面:其中,作为根据本发明的图像处理程序的读取/文件编制程序预先存储在图像读取/打印装置14的本体控制器16的存储单元16C中,但根据本发明的图像处理程序也可以按照以下形式提供:其中程序记录在诸如CD-ROM和DVD-ROM的记录介质中。同样,在上面的描述中,描述了以下方面:其中,作为根据本发明的图像处理程序的读取/文件编制程序由图像读取/打印装置14的本体控制器16的存储单元16C执行,但本发明不限于此,并且程序可以被构成为由诸如终端装置24的不同电子装置执行。

Claims (14)

1.一种图像处理装置,该图像处理装置包括:
字符识别部件,其基于通过将包含其中混合了字符的构成要素的文档作为图像来读取而获取的图像数据,对混合在所述构成要素中的所述字符执行字符识别;
确定部件,当生成表示所述文档并且包含第一数据和第二数据的文档数据时,其中所述第一数据表示混合了所述字符的所述构成要素,所述第二数据包含由所述字符识别部件识别出的字符的字符码数据并表示显示所述字符码数据表示的所述字符的字符块,该确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、所述构成要素中的所述字符的尺寸、或所述构成要素的类型中的至少一项,来确定在显示所述文档数据表示的文档时,是将所述第二数据表示的字符块隐藏在所述第一数据表示的所述构成要素的后面,还是将所述第二数据表示的字符块显示在所述第一数据表示的所述构成要素的前面;以及
生成部件,其生成所述文档数据,对于所述文档数据,已经根据所述确定部件的确定结果而设置了在显示所述文档时在所述字符块与所述构成要素之间的显示的前/后关系。
2.根据权利要求1所述的图像处理装置,其中,如果所述构成要素的所述字符周围的背景区域的亮度小于第一阈值、或者所述字符周围的背景区域的亮度的分散度等于或大于第二阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
3.根据权利要求1所述的图像处理装置,其中,如果所述构成要素中的所述字符的字符数量等于或大于第三阈值,或者如果所述构成要素中的所述字符的行数量等于或大于第四阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
4.根据权利要求1所述的图像处理装置,其中,如果所述构成要素的所述字符的区域的亮度等于或大于第五阈值,则所述确定部件确定将所述字符块显示在所述构成要素的前面。
5.根据权利要求1所述的图像处理装置,其中,如果所述字符识别部件的所述字符识别的精度小于第六阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
6.根据权利要求1所述的图像处理装置,其中,如果所述构成要素中的所述字符的尺寸等于或大于第七阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
7.根据权利要求1所述的图像处理装置,其中,如果所述构成要素的类型是被指定为隐藏所述字符块的类型,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
8.根据权利要求1所述的图像处理装置,其中,所述确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、或所述构成要素中的所述字符的尺寸中的至少一个与对应的阈值的比较结果,来确定是将所述字符块隐藏在所述构成要素的后面还是将所述字符块显示在所述构成要素的前面,并且,如果所述构成要素的类型是被指定为隐藏所述字符块的类型,则预先改变所述阈值,使得与确定了所述构成要素的类型不是被指定为隐藏所述字符块的类型时的情况相比,将所述字符块确定为隐藏在所述构成要素的后面的概率高。
9.根据权利要求1所述的图像处理装置,其中:
所述确定部件将所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、所述构成要素中的所述字符的尺寸、或所述构成要素的类型中的至少一项与存储在存储部件中的阈值或设置信息进行比较,并且基于比较结果来确定是将所述字符块隐藏在所述构成要素的后面还是将所述字符块显示在所述构成要素的前面;并且
所述图像处理装置还包括第一改变部件,该第一改变部件根据来自用户的指示而改变存储在所述存储部件中的所述阈值或所述设置信息,其中,改变所述阈值或所述设置信息的指示是从用户经由指示部件发出的。
10.根据权利要求1所述的图像处理装置,其中,如果所述确定部件确定了将所述字符块隐藏在所述构成要素的后面,则所述生成部件生成表示如下的字符块的数据作为所述第二数据:所述字符块分别按照预定的字符颜色和背景颜色,来显示所述字符码数据表示的所述字符和所述字符周围的背景区域,并且,如果所述确定部件确定了将所述字符块显示在所述构成要素的前面,则所述生成部件生成表示如下的字符块的数据作为所述第二数据:所述字符块分别按照与处于混合在所述构成要素中的状态下的所述字符的字符颜色或者所述背景区域的背景颜色相同或相似的颜色,来显示所述字符码数据表示的所述字符和所述字符周围的背景区域。
11.根据权利要求10所述的图像处理装置,其中:
如下的颜色指定信息预先存储在存储部件中:所述颜色指定信息指定在所述确定部件确定了将所述字符块隐藏在所述构成要素的后面时所述字符块的所述字符颜色和所述背景颜色;并且
所述图像处理装置还包括第二改变部件,在所述确定部件确定了将所述字符块隐藏在所述构成要素的后面之后从用户经由指示部件发出了改变所述字符块的所述字符颜色或所述背景颜色中的至少一个的指示的情况下,该第二改变部件根据来自用户的指示而改变所述颜色指定信息。
12.根据权利要求1所述的图像处理装置,该图像处理装置还包括:
输入接收部件,当所述确定部件的确定结果是特定的确定结果时,该输入接收部件从用户接收去除指示信息的输入,所述去除指示信息指示从所述文档数据中去除所述第二数据,其中,
当所述输入接收部件接收到所述去除指示信息的输入并且所述确定部件的确定结果与在所述去除指示信息中设置的特定的确定结果相匹配时,所述生成部件生成去除了所述第二数据的数据作为所述文档数据。
13.根据权利要求12所述的图像处理装置,其中,当生成去除了所述第二数据的数据作为所述文档数据时,所述生成部件生成将处于混合在所述构成要素中的状态下的所述字符表示为图像的字符图像数据,并且生成如下的数据作为所述文档数据:所述数据包含生成的所述字符图像数据,并将在显示所述文档时表示所述字符图像数据的字符图像与所述构成要素之间的显示的前/后关系设置为,使得在显示所述文档时将所述字符图像显示在所述构成要素的前面。
14.根据权利要求1所述的图像处理装置,其中:
至少所述第一数据具有能够设置任何信息作为所述构成要素的属性信息的格式;并且
所述图像处理装置还包括属性设置部件,该属性设置部件将由所述字符识别部件识别出的字符的字符码数据作为所述构成要素的属性信息设置到所述第一数据。
CN201110036936.6A 2010-08-12 2011-02-12 图像处理装置 Active CN102375981B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-180984 2010-08-12
JP2010180984A JP5636807B2 (ja) 2010-08-12 2010-08-12 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
CN102375981A CN102375981A (zh) 2012-03-14
CN102375981B true CN102375981B (zh) 2015-09-09

Family

ID=45564508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110036936.6A Active CN102375981B (zh) 2010-08-12 2011-02-12 图像处理装置

Country Status (3)

Country Link
US (1) US8447143B2 (zh)
JP (1) JP5636807B2 (zh)
CN (1) CN102375981B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5111226B2 (ja) * 2008-05-02 2013-01-09 キヤノン株式会社 画像処理方法、画像処理装置、及び、そのプログラムならびにコンピュータ読み取り可能な記憶媒体
TWI526706B (zh) 2011-10-05 2016-03-21 原相科技股份有限公司 影像系統
JP6175981B2 (ja) * 2013-08-23 2017-08-09 富士ゼロックス株式会社 情報処理装置及びプログラム
JP6759914B2 (ja) * 2016-09-15 2020-09-23 富士ゼロックス株式会社 画像処理装置、画像形成装置およびプログラム
JP6948959B2 (ja) * 2018-02-09 2021-10-13 株式会社日立ソリューションズ・クリエイト 画像処理システム及び画像処理方法
CN110163050B (zh) * 2018-07-23 2022-09-27 腾讯科技(深圳)有限公司 一种视频处理方法及装置、终端设备、服务器及存储介质
CN112640412B (zh) 2018-09-06 2023-03-10 富士胶片株式会社 图像处理装置、方法及记录介质
JP7379876B2 (ja) * 2019-06-17 2023-11-15 株式会社リコー 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1674035A (zh) * 2004-03-22 2005-09-28 佳能株式会社 图像处理设备和图像处理方法
JP2007041709A (ja) * 2005-08-01 2007-02-15 Canon Inc 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US7006881B1 (en) * 1991-12-23 2006-02-28 Steven Hoffberg Media recording device with remote graphic user interface
US6850252B1 (en) * 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US7128270B2 (en) * 1999-09-17 2006-10-31 Silverbrook Research Pty Ltd Scanning device for coded data
US6874420B2 (en) * 1999-10-22 2005-04-05 Cc1, Inc. System and method for register mark recognition
JP4150842B2 (ja) * 2000-05-09 2008-09-17 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4189506B2 (ja) 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
JP2002150306A (ja) * 2000-09-04 2002-05-24 Minolta Co Ltd 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP3899800B2 (ja) * 2000-09-28 2007-03-28 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
US7305105B2 (en) * 2005-06-10 2007-12-04 Ecole polytechnique fédérale de Lausanne (EPFL) Authentication of secure items by shape level lines
US8090402B1 (en) * 2003-09-26 2012-01-03 Iwao Fujisaki Communication device
US7124041B1 (en) * 2004-09-27 2006-10-17 Siemens Energy & Automotive, Inc. Systems, methods, and devices for detecting circuit faults
JP4501696B2 (ja) 2005-01-20 2010-07-14 富士ゼロックス株式会社 画像処理装置及びプログラム
JP4462047B2 (ja) 2005-01-20 2010-05-12 富士ゼロックス株式会社 画像処理装置及びプログラム
US7358502B1 (en) * 2005-05-06 2008-04-15 David Appleby Devices, systems, and methods for imaging

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1674035A (zh) * 2004-03-22 2005-09-28 佳能株式会社 图像处理设备和图像处理方法
JP2007041709A (ja) * 2005-08-01 2007-02-15 Canon Inc 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Also Published As

Publication number Publication date
US8447143B2 (en) 2013-05-21
US20120038659A1 (en) 2012-02-16
JP5636807B2 (ja) 2014-12-10
JP2012044257A (ja) 2012-03-01
CN102375981A (zh) 2012-03-14

Similar Documents

Publication Publication Date Title
CN102375981B (zh) 图像处理装置
US8711419B2 (en) Preserving user applied markings made to a hardcopy original document
EP1473924B1 (en) Image processing apparatus and method therefor
CN100448257C (zh) 图像处理装置及其方法
US20110249299A1 (en) Preserving user applied markings made to a hardcopy original document
CN100407756C (zh) 图像处理装置及图像处理方法
US20110197121A1 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
US8391607B2 (en) Image processor and computer readable medium
US20070133031A1 (en) Image processing apparatus and image processing method
JP2010033541A (ja) 画像処理装置及び画像処理方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP7379876B2 (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
JP2007129557A (ja) 画像処理システム
JP2006135664A (ja) 画像処理装置及びプログラム
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
CN100588218C (zh) 图像形成装置和电子邮件传送服务器
JP2007034613A (ja) 画像処理装置及びその方法
JP2007068127A (ja) 画像再生装置、画像再生方法、プログラム及び記録媒体
US20100245862A1 (en) Image-processing device, image-forming device, image-processing method, and computer readable medium
JP2019153230A (ja) 情報処理装置及び情報処理プログラム
JP5767549B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2006202197A (ja) 画像管理システム
JP7497620B2 (ja) 文書データ生成装置、画像形成装置、及び文書データ生成プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Tokyo, Japan

Patentee after: Fuji film business innovation Co.,Ltd.

Address before: Tokyo, Japan

Patentee before: Fuji Xerox Co.,Ltd.