CN103699891B - 图像处理装置及图像处理方法 - Google Patents

图像处理装置及图像处理方法 Download PDF

Info

Publication number
CN103699891B
CN103699891B CN201310435947.0A CN201310435947A CN103699891B CN 103699891 B CN103699891 B CN 103699891B CN 201310435947 A CN201310435947 A CN 201310435947A CN 103699891 B CN103699891 B CN 103699891B
Authority
CN
China
Prior art keywords
character
character string
link
image processing
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310435947.0A
Other languages
English (en)
Other versions
CN103699891A (zh
Inventor
樫本阳介
村上隆
相场雅彰
大岸良辅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Publication of CN103699891A publication Critical patent/CN103699891A/zh
Application granted granted Critical
Publication of CN103699891B publication Critical patent/CN103699891B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Abstract

本发明提供一种图像处理装置及图像处理方法。本发明的图像处理装置具备:图像读入部,其读入信息作为图像数据;字符识别部,其识别包含在图像数据中的字符;群组化部,其将识别出的各个字符基于表示字符的形态的字符信息,按照字符串进行群组化;字符提取部,其基于群组化后的字符串的重要度,提取作为链接的对象的字符串;字符检索部,其从识别出字符的图像数据之中,检索提取的字符串中的字体相同的字符串;以及链接设定部,其基于重要度使检索到的字体相同的字符串相互链接。根据本发明,能够从包含在图像数据中的字符串之中使重要的字符串有效地获得链接。

Description

图像处理装置及图像处理方法
技术领域
本发明涉及一种根据由扫描器读入的图像数据来生成超链接结构的数据的图像处理装置及图像处理方法。
背景技术
作为超链接结构的数据的生成手法,已知有基于目录及索引页的数据来生成超链接的关联技术。该关联技术是使成为记载于目录或索引页的用语的参照目的地的页编号与记载该用语的通常页的页编号相互链接的技术。
根据关联技术,阅览图像数据的用户能够直接使页从目录及索引页向参照目的地的通常页移动。
然而,在关联技术中,仅使显示在目录(索引页)和通常页上的页编号彼此相互链接。因此,无法使未记载于目录或索引页的用语、或用户选择的任意的用语等获得链接。
因此,本发明的课题在于提供一种使包括在图像数据中的用语有效地获得链接的技术。
本发明的图像处理装置具备:图像读入部,其读入信息作为图像数据;字符识别部,其识别包含在图像数据中的字符;群组化部,其将由字符识别部识别出的各个字符,基于表示字符的形态的字符信息,按照字符串进行群组化;字符提取部,其基于群组化后的字符串的重要度,提取作为链接的对象的字符串;字符检索部,其从识别出字符的图像数据之中,检索由字符提取部提取的字符串中的字体相同的字符串;以及链接设定部,其基于重要度使由字符检索部检索到的字体相同的字符串相互链接。
本发明的图像处理方法包括:(i)经由图像读入部,读入信息作为图像数据,(ii)经由字符识别部识别包含在所述图像数据中的字符,(iii)经由群组化部将由所述字符识别部识别出的各个所述字符基于表示所述字符的形态的字符信息,按照字符串进行群组化,(iv)经由字符提取部基于所述群组化后的所述字符串的重要度,提取作为链接的对象的所述字符串,(v)经由字符检索部从识别出所述字符的所述图像数据之中,检索由所述字符提取部提取的所述字符串中的字体相同的所述字符串,(vi)经由链接设定部基于所述重要度使由所述字符检索部检索到的所述字体相同的所述字符串相互链接。
根据本发明,能够从包含在图像数据中的字符串之中使重要的字符串有效地获得链接。
附图说明
图1示出本发明的实施方式涉及的图像处理装置的结构。
图2示出本发明的实施方式涉及的图像处理装置的功能性的结构。
图3示出通过扫描部读入的图像数据的一例。
图4示出群组化的字符串的一览。
图5示出重要语列表。
图6示出通过字符检索部检索到的字符串。
图7示出将包含在图像数据中的字符串链接的状态。
图8示出用于通过本发明的第一实施方式的图像处理装置使包含在图像数据中的字符串获得链接的次序。
图9示出显示有用于指定字符串的链接目的地的图像的状态的操作面板。
图10示出用于通过本发明的第二实施方式的图像处理装置使包含在图像数据中的字符串获得链接的次序。
图11示出根据用户的操作而进行了重要度的变更及链接的限制之后字符检索部对字符串的检索结果。
图12示出基于图11所示的检索结果将包含在图像数据中的字符串链接的状态。
具体实施方式
以下,说明本发明的图像处理装置及图像处理程序的实施方式。
I.第一实施方式
图1示出本发明的第一实施方式涉及的图像处理装置1的结构。在图1中,从右前上方示出图像处理装置1,能看见相对于用户的图像处理装置1的前表面和图像处理装置1的右侧面。
图像处理装置1例如是数字复合机、所谓的多功能周边设备(MultifunctionPeripheral)。图像处理装置1具备主干内排纸型的装置主体10,在装置主体10的中央部分形成有排纸托盘12。
在装置主体10的上侧搭载有原稿进给装置14,在利用图像处理装置1作为复印机、传真机、网络扫描器时,从原稿进给装置14搬运原稿,其图像面由光学式的扫描部(图像读入部)16光学性地读取。
在扫描部16的跟前侧设置有操作面板18。在操作面板18配置有包括供于用户的各种操作的多个操作键的操作部18a,且设有包括显示各种信息的显示画面的显示部18b。
在装置主体10的下部配置有前插式的用纸供给装置20。详细而言,沿着装置主体10的高度方向配置上下双层的供纸盒20a、20b,各供纸盒20a、20b均构成为相对于装置主体10能够拆装。在装置主体10的右侧面还配置有开闭式的手动托盘22。
本实施方式的图像处理装置1具有OCR(Optical Character Reader光学字符读出器)功能,能够从由扫描部16读取的图像,识别字符。
图2示出图像处理装置1的功能性的结构。在图2中,以利用OCR功能用于实现图像处理的结构为中心进行说明。
图像处理装置1作为用于实现上述的图像处理的结构,具备扫描部16、操作面板(操作显示部)18、控制部24及数据保存部26。控制部24具有字符识别部28、群组化部30、字符提取部32、字符检索部34、链接设定部36。
控制部24是作为计算机而动作的要素,具有CPU(中央运算处理装置)、ROM(只读存储器)等硬件资源。控制部24使用该硬件资源来执行程序,控制上述的扫描部16、操作面板18、字符识别部28、群组化部30、字符提取部32、字符检索部34、链接设定部36及数据保存部26。
字符识别部28识别由扫描部16读取的图像数据中包含的字符。用于识别字符的处理例如按照上述的基于OCR功能的字符的识别次序来进行。
群组化部30将由字符识别部28识别的各个字符,基于表示字符的形态的字符信息,按字符串进行群组化。群组化后的字符串例如为单词或语句等,通过字符的组合而具有特定的意思。该字符信息表示例如字体的种类、字体大小、字符颜色、标记设定、粗体字、斜体字、下划线、空白等。
字符提取部32基于被群组化的字符串的重要度,提取作为链接的对象的字符串。该重要度例如根据字符串的字体大小、字符颜色、标记设定、粗体字、斜体字、下划线、缩进、段落编号等来决定。
字符检索部34从识别出字符的图像数据之中检索由字符提取部32提取的字符串中的字体彼此相同的字符串。
链接设定部36基于重要度而使由字符检索部34检索到的字符串相互链接。具体而言,将由字符检索部34检索到的字符串中的对于各字符串的重要度高的字符串设定作为链接目的地。
数据保存部26保存与通过字符识别部28识别的图像数据中的字符相关的信息、与通过群组化部30群组化的字符串相关的信息、与通过字符提取部32提取的字符串相关的信息、及字符检索部34对字符串的检索结果。
操作面板(操作显示部)18由上述的操作部18a及显示部18b构成。在本实施方式中,显示部18b显示用于使字符串获得链接的设定信息。显示部18b显示用于对由字符提取部32提取的字符串的列表进行更新的图像作为设定信息。或者显示用于指定由字符检索部34检索到的字符串的链接目的地的图像。
操作部18a接受用户对显示在显示部18b上的设定信息的操作。操作部18a由用户直接操作,除了上述的操作键之外,触摸面板上的操作区域等也相当于操作部18a的结构。
图3示出由扫描部16读入的图像数据的一例。在图3中,说明用于通过字符识别部28识别包含在图像数据内的字符的手法。
在图3中,作为向扫描部16读入的图像数据的一例,显示3页量的图像。在该图像数据中,在多页上显示“用语说明”、“HP作成”、“超链接”等单词。图3中所示的单词按照每页而字符的大小或字体等字符信息互不相同。
字符识别部28一字符一字符地识别图像数据所示的字符。字符识别部28识别字符的手法例如按照基于OCR功能的用于识别字符的次序(OCR处理)进行。
字符识别部28识别字符的手法例如通过以下的次序进行。
(1)按每页来解析图像的布局,将图像分割成字符区域、图像区域及框线区域。
(2)对于各区域,解析图像,并将解析的信息保存于数据保存部26。
(3)将字符区域以行、列、及倾斜的方式分解。
(4)以分解的行及列的各线单位,对像素进行计数,由此提取字符。
(5)在确定了提取的字符的大小、字体、字符的变形、模糊等的基础上,进行标准化、特征提取、匹配、字符识别等处理。
如此,字符识别部28通过上述(1)~(5)的次序,能够1字符1字符地识别包含在字符区域中的字符。
图4示出通过群组化部30群组化的字符串的一览。在图4中,示出图3中所示的第一页(P1)的图像数据中包含的字符串。
通过字符识别部28识别的各个字符由群组化部30按字符串进行群组化。该群组化基于表示字符的形态的字符信息进行。具体而言,群组化部30以字体的种类、字体样式、字体大小、字符颜色、标记设定、粗体字、斜体字、下划线、空白等表示字符的形态的字符信息为基准,将包含在图像数据中的字符的排列群组化成一个字符串。
在图3中的图像数据中,在第一页(P1)的从上方起的第一行显示了“目”“录”这两个字符。群组化部30在上述字符信息均相同时,将上述“目”及“录”的排列群组化作为1个字符串。
群组化后的字符串保存在数据保存部26中。而且,在数据保存部26中保存有与字符串关联的信息。数据保持部26将字符串及与之关联的信息登记在例如图4中所示的“群组化列表”中,由此来保存上述信息。
在群组化列表中,登记有与字符串建立对应的例如“页编号”、“页内位置”、“群组编号”、“字符信息”、“重要度”等关联信息。
在图4中的“字符信息”一栏中,示出字体样式(粗体字、斜体字及标准)及字体大小(pt)作为字符信息。字符信息除了它们的组合以外,也可以将字体的种类(哥特体、明朝体等)、字符颜色、标记设定、粗体字、斜体字、下划线、空白等进行各种组合而构成。
而且,在图4中的“重要度”一栏中,按照每个群组表示字符串的重要度的值由数字表示。该重要度基于各字符串的字体大小、字符颜色、标记设定、粗体字、斜体字、下划线、缩进、段落编号等而决定。
图4中所示的重要度示出了随着值上升而字符串的重要度升高。相对于此,字符提取部32基于字符串的重要度而提取作为链接的对象的字符串来作为重要语。
图5示出重要语列表。重要语列表表示通过字符提取部32从被群组化的字符串之中提取的字符串。以下,将通过字符提取部32提取的字符串适当称为“重要语”。
字符提取部32基于图4中所示的字符串的重要度,来判断是否提取字符串。例如,字符提取部32分别提取与图4中所示的重要度“2”对应的“用语说明”及“HP作成”的字符串作为重要语。另一方面,关于重要度“0”表示的“目录”的字符串,不作为重要语提取。由字符提取部32提取的字符串保存在数据保存部26中。
图6示出由字符检索部34检索到的字符串。而且,图7示出通过链接设定部36将包含在图像数据中的字符串链接的状态。需要说明的是,在图6中,示出图3中所示的3页量的图像数据中包含的重要语的检索结果。而且,图7中所示的箭头表示字符串的链接目的地。
字符检索部34从识别出字符的图像数据之中检索由字符提取部32提取的重要语中的字体彼此相同的字符串。在此,“字体”表示字符的骨架,能够以各种形态(字体的种类、字体样式、字体大小、字符颜色、标记设定、粗体字、斜体字、下划线、空白等)来表示相同的字体的字符串。例如,字符检索部34从图3中所示的3页量的图像数据之中检索通过字符提取部32作为重要语提取的图5中所示的“用语说明”。
在上述的例子中,通过字符检索部34的检索,来确定字体与提取的重要语相同的字符串包含在第一页(P1)及第二页(P2)中。字符检索部34将其检索结果保存于数据保存部26。
在数据保存部26中,例如,利用图6中所示的“检索结果列表”来管理上述的检索结果,并将检索到的包含在各页中的字符串和与之关联的信息相互建立对应而登记在检索结果列表中。
在检索结果列表中,登记有与字符串建立对应的例如“页编号”、“页内位置”、“群组编号”、“字符信息”、“重要度”等关联信息。
对于字符检索部34的检索结果,链接设定部36基于重要度而使检索到的字符串相互链接。具体而言,链接设定部36使图6中所示的重要语中的包含在图像数据的第一页和第二页中的“用语说明”相互链接。而且,使包含在第一页和第三页中的“HP作成”相互链接。而且,链接设定部36使包含在图像数据的第二页和第三页中的“超链接”相互链接。
另外,链接设定部36关于包含在各页中的字符串的链接,将通过字符检索部34检索到的字体相同的字符串中的对于各字符串的重要度高的字符串设定作为链接目的地。例如,包含在第一页及第二页中的“用语说明”的重要度分别为“2”和“4”,对于包含在第二页中的字符串的重要度比包含在第一页中的字符串的重要度高。此时,链接设定部36将重要度高的字符串、即包含在第二页中的“用语说明”设定作为包含在第一页中的“用语说明”的链接目的地。
另外,链接设定部36对于登记在检索结果列表中的“HP作成”及“超链接”的字符串,也与“用语说明”同样地,基于重要度来设定链接目的地。需要说明的是,关于图6中所示的“链接自由”,由于不存在链接目的地,因此未设定链接。
如此,通过使包含在各页中的重要语相互链接,例如在将图像数据显示在操作面板18的显示部18b或与图像处理装置1连接的未图示的PC的显示器等上时,用户仅通过单击重要语,就能够参照链接目的地的重要语。
根据第一实施方式的图像处理装置1,使包含在图像数据中的字符串相互链接。因此,没有限定为仅记载于目录或索引页的单词或语句,能够使记载于各页的字符串相互链接。而且,由于基于重要度来提取作为链接的对象的字符串,因此能够防止对于不必要的字符串设定链接的情况。
以上是第一实施方式中的图像处理装置1的基本结构。而且在本实施方式中,利用计算机(控制部24)来执行安装于图像处理装置1的程序,由此能够使上述的图像处理装置1动作。而且通过以下的说明,明确可知图像处理装置1的计算机执行的次序例。
图8示出用于通过第一实施方式的图像处理装置1使包含在图像数据中的字符串获得链接的次序。以下,按照次序进行说明。
步骤S100:扫描部16读入载置于原稿进给装置14的原稿的图像面(信息)作为图像数据。读入的图像数据保存于数据保存部26。
步骤S102:控制部24判断下一页的原稿是否载置于原稿进给装置14。若原稿被载置(是),则再次执行步骤S100的次序。上述的次序反复进行直至读取全部页的原稿。
步骤S104:而且,若原稿未载置于原稿进给装置14(步骤S102“否”),即对于全部页的原稿的读入完成时,则控制部24使字符识别部28执行读入的图像数据的解析。字符识别部28按照OCR处理的次序来识别包含在图像数据中的字符。
步骤S106:对于由字符识别部28识别的字符,群组化部30将各个字符基于字符信息按每个字符串进行群组化。被群组化后的字符串保存在数据保存部26(群组化列表)中。
步骤S108:字符提取部32基于被群组化后的字符串的重要度,来提取作为链接的对象的字符串。提取的字符串(重要语)保存于数据保存部26。控制部24针对图像数据的每页来执行从步骤S104到步骤S108的次序。这些次序执行至对于全部页完成为止(步骤S110“是”)。
步骤S112:关于从步骤S104到步骤S108的次序,若没有下一页(步骤S110“否”),即,当上述的次序对于全部页执行时,字符检索部34从识别出字符的图像数据之中检索由字符提取部32提取的字符串中的字体彼此相同的字符串(即重要语)。关于该次序,也针对图像数据的每页进行,针对全部页执行(步骤S114“是”)。
步骤S116:关于步骤S112的次序,若没有下一页(步骤S114“否”),即,当上述的次序针对全部页执行后,链接设定部36基于重要度而使由字符检索部34检索到的字符串相互链接。具体而言,将由字符检索部34检索到的字符串中的对于各字符串的重要度高的字符串设定作为链接目的地。
如此,根据第一实施方式的图像处理装置1及图像处理程序,不是使页编号彼此链接,而是使包含在图像数据的各页中的字符串相互链接。因此,不仅能够使记载在目录或索引中的单词或语句,而且能够使记载在各种页中的字符串相互链接。
另外,在链接设定部36中,将对于各字符串的重要度高的字符串设定作为链接目的地。其结果是,阅览图像数据的用户能够迅速地参照写有重要的单词或语句的部位。
II.第二实施方式
接下来,说明第二实施方式的图像处理装置1及图像处理程序。在第二实施方式中,根据用户的操作,进行提取的重要语的变更及链接目的地的设定。关于图像处理装置1的基本结构,与第一实施方式相同,对于相同的构件,标注同一符号,并适当省略重复的说明。
图9示出显示有用于指定字符串的链接目的地的图像的状态的操作面板18。
在操作面板18的显示部18b显示有用于指定由字符检索部34检索的字符串的链接目的地的图像。在图9中所示的显示部18b显示有三个包括检索到的“超链接”的字符串的图像数据。
各图像数据作为图像视图,与“超链接”的字符串一起,以将包含其周围的字符的区域去除的状态显示。而且,对应于各图像视图而分配数字。
另外,在图像视图的附近(右侧)显示有与包含在各图像数据中的“超链接”的字符串相关的页编号及字符信息作为“Information”。在该“Information”的附近,用于指定链接目的地的链接目的地信息对应于各图像视图而以下拉形式显示。在图9中,作为链接目的地信息,示出了向各图像视图分配的编号“No1”及“No2”或“未链接”等信息。
用户进行下拉操作,而能够分别指定显示在各图像视图中的“超链接”的链接目的地。因此,图9中所示的各下拉菜单相当于作为操作部18a的结构。
在操作面板18的上下方向排列的3个图像视图中,与正中(No2)的图像视图对应的下拉菜单上显示“No1”作为链接目的地信息。这表示指定包含在“No1”的图像视图中的字符串作为包含在“No2”的图像视图中的字符串的链接目的地。
与包含在上述“No2”的图像视图中的字符串同样地,用户对包含在“No1”、“No3”的图像视图中的字符串,也能够指定链接目的地。而且,也可以一并指定各字符串的链接目的地。
当用户的操作完成时,链接设定部36将指定的字符串设定作为链接目的地。
以上是第二实施方式中的用于指定链接目的地的基本的手法。需要说明的是,该手法与根据用户的操作而提取重要语的手法相同。即,在操作面板18的显示部18b上显示用于对由字符提取部32提取的字符串进行更新的图像。
对于显示后的图像,用户通过对操作面板18进行操作,而能够将显示在显示部18b上的重要语删除,或者新追加重要语而更新重要语列表。更新后的信息保存于数据保存部26。相对于此,字符检索部34检索保存于数据保存部26的更新后的重要语列表中包含的字符串。
接下来,说明使第二实施方式的图像处理装置1的计算机执行的次序例。
图10表示用于通过第二实施方式的图像处理装置1使包含在图像数据中的字符串获得链接的次序。图10的步骤S200~S210、S214、S216、及S220分别与图8的步骤S100~S110、S112、S114、及S116同样地执行。以下,适当省略与图8中的流程图所示的次序重复的说明。
步骤S212:当通过字符提取部32提取重要语时,控制部24将用于对提取后的字符串的重要语列表进行更新的图像显示在显示部18b上。由此,用户对操作面板18进行操作而能够更新重要语列表。而且,通过用户的操作完成而被更新后的重要语列表在数据保存部26中保存(更新)。
步骤S214:字符检索部34检索根据用户的操作而被更新后的重要语列表中包含的字符串。检索后的结果保存于数据保存部26。该次序按照图像数据的每页进行,在对全部页的检索完成之前反复进行(步骤S216“是”)。
步骤S218:当对于全部页字符检索部34对重要语的检索完成时(步骤S216“否”),控制部24将用于指定由字符检索部34检索的字符串的链接目的地的图像显示在显示部18b上。由此,用户对操作面板18进行操作而能够指定重要语的链接目的地。
步骤S220:当用户的操作完成时,链接设定部36将指定的字符串设定作为链接目的地。
根据第二实施方式的图像处理装置1及图像处理程序,对于自动提取的重要语,用户能够将其删除,或者追加未提取的单词或语句。而且,用户能够自由地变更重要语的链接目的地。因此,对于由用户判断为重要的单词或语句,根据用户的愿望而能够进行链接。而且,能够自动地设定重要语的提取或链接目的地,并反映用户的愿望,因此能够提高阅览图像数据的用户的操作性。
III.第三实施方式
接下来,说明第三实施方式的图像处理装置1及图像处理程序。在第三实施方式中,根据用户的操作来变更重要度,或通过重要度的值来限制作为链接的对象的字符串。关于图像处理装置1的基本结构,与第一实施方式及第二实施方式相同,对于相同的构件标注同一符号,并适当省略重复的说明。
图11示出根据用户的操作而进行了重要度的变更及链接的限制后字符检索部34对字符串的检索结果。而且,图12示出基于图11所示的检索结果而通过链接设定部36将包含在图像数据中的字符串链接后的状态。
用户通过对操作面板18进行操作,而能够变更各字符串的重要度,操作面板18显示有用于对由字符检索部34检索到的字符串的重要度进行变更的图像。
例如,在操作面板18的显示部18b上显示有与图6中所示的检索结果相关的信息及与链接限制相关的信息。相对于此,用户能够变更各字符串的重要度。而且,链接设定部36基于根据用户的操作而变更的重要度来设定链接目的地。
在图11中所示的检索结果列表中反映了变更后的重要度,并将从上方起的第二行的“用语说明”的重要度从“2”变更为“4”。相对于此,将从上方起的第四行的“用语说明”的重要度从“4”变更为“3”。这种情况下,如图12所示,链接设定部36将包含在第一页的图像数据中的“用语说明”设定为包含在第二页的图像数据中的“用语说明”的链接目的地。如此,通过变更重要度,而能够根据用户的愿望来变更字符串的链接目的地。
另外,在第三实施方式中,根据重要度来限制链接。该链接的限制与上述的重要度的变更同样地,能够根据用户的操作进行设定。或者可以自动设定。
在图11中所示的检索结果列表中设有“链接限制”一栏,对于未限制链接的字符串,表示“无”,对于限制链接的字符串,表示“有”。
在图11中的“链接限制”一栏中,对于重要度为“2”以上的字符串,表示“无”,对于小于“2”即重要度为“1”的字符串,表示“有”。在图11中所示的检索结果列表中,从下方起的第一行所示的“超链接”的字符串由于重要度为“1”,因此限制链接。因此,如图12所示,在第二页与第三页的图像数据中包含的“超链接”的字符串未相互链接。
在第三实施方式中,通过变更字符串的重要度而能够变更字符串的链接目的地。而且,根据重要度来限制链接,由此能够抑制对于重要语的链接的个数过多的情况。
本发明不受上述的实施方式的制约,能够进行各种变形来实施。例如,第一实施方式~第三实施方式所示的图像处理装置1并不限于复合机,可以是具备OCR功能的扫描器或个人计算机等。
另外,在第二实施方式中,在用于使包含在图像数据中的字符串获得链接的次序中,可以省略在显示部18b上显示用于对重要语的列表进行更新的图像的次序(步骤S212),或者可以省略显示用于指定链接目的地的图像的次序(步骤S218)。
根据本发明的实施方式,不仅将记载于目录或索引的单词或语句作为链接的对象提取,而且将记载于各种页的重要语作为链接的对象提取,因此能够从包含在图像数据中的字符串之中使重要的字符串有效地获得链接。

Claims (6)

1.一种图像处理装置,生成超链接结构的数据,所述图像处理装置具备:
图像读入部,其读入信息作为图像数据;
字符识别部,其识别包含在所述图像数据中的字符;
群组化部,其将由所述字符识别部识别出的各个所述字符,基于表示所述字符的形态的字符信息,按照字符串进行群组化;
字符提取部,其基于所述群组化后的所述字符串的重要度,提取作为链接的对象的所述字符串;
字符检索部,其从识别出所述字符的所述图像数据之中,检索由所述字符提取部提取的所述字符串中的字体相同的所述字符串;
链接设定部,其基于所述重要度使由所述字符检索部检索到的所述字体相同的所述字符串相互链接,
显示部,其显示用于使所述字符串获得链接的设定信息;以及
操作部,其接受用户对显示在所述显示部上的所述设定信息的操作,
所述显示部将所述设定信息与从所述图像数据的整个区域通过所述字符检索部检索出的所述字符串一起显示为所述图像数据的区域中的将包含被检索出的所述字符串的周围的区域去除的图像视图,
所述链接设定部将根据所述用户的操作而指定的、所述图像视图所包含的所述字符串设定为通过所述字符检索部检索出的所述字符串的链接目的地。
2.根据权利要求1所述的图像处理装置,其中,
所述链接设定部将由所述字符检索部检索到的所述字体相同的所述字符串中对于各字符串的所述重要度高的所述字符串设定作为链接目的地。
3.根据权利要求1所述的图像处理装置,其中,
所述显示部将所述设定信息还显示为用于对由所述字符提取部提取的所述字符串的列表进行更新的图像,
所述字符检索部检索根据所述用户的操作而更新后的所述列表中包含的所述字符串。
4.根据权利要求1所述的图像处理装置,其中,
所述显示部将所述设定信息还显示为用于对所述字符串的所述重要度进行变更的图像,
所述链接设定部基于根据所述用户的操作而变更后的所述重要度,来设定所述链接。
5.根据权利要求1~4中任一项所述的图像处理装置,其中,
所述链接设定部基于所述重要度来限制对所述字符串的链接目的地的设定。
6.一种图像处理方法,用于通过图像处理装置生成超链接结构的数据,所述方法包括:
经由图像读入部读入信息作为图像数据,
经由字符识别部识别包含在所述图像数据中的字符,
经由群组化部将由所述字符识别部识别出的各个所述字符基于表示所述字符的形态的字符信息,按照字符串进行群组化,
经由字符提取部基于所述群组化后的所述字符串的重要度,提取作为链接的对象的所述字符串,
经由字符检索部从识别出所述字符的所述图像数据之中,检索由所述字符提取部提取的所述字符串中的字体相同的所述字符串,
经由显示部将用于使所述字符串获得链接的设定信息与通过所述字符检索部检索出的所述字符串一起显示为所述图像数据的区域中的、将包含被检索出的所述字符串的周围的区域去除的图像视图,
经由操作部接受用户对显示在所述显示部上的所述设定信息的操作,
经由链接设定部将根据所述用户的操作而指定的、所述图像视图所包含的所述字符串设定为通过所述字符检索部检索出的所述字符串的链接目的地,
经由所述链接设定部基于所述重要度使由所述字符检索部检索到的所述字体相同的所述字符串相互链接。
CN201310435947.0A 2012-09-27 2013-09-23 图像处理装置及图像处理方法 Expired - Fee Related CN103699891B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012214138A JP5753828B2 (ja) 2012-09-27 2012-09-27 画像処理装置及び画像処理プログラム
JP2012-214138 2012-09-27

Publications (2)

Publication Number Publication Date
CN103699891A CN103699891A (zh) 2014-04-02
CN103699891B true CN103699891B (zh) 2017-04-12

Family

ID=50338557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310435947.0A Expired - Fee Related CN103699891B (zh) 2012-09-27 2013-09-23 图像处理装置及图像处理方法

Country Status (3)

Country Link
US (1) US8773704B2 (zh)
JP (1) JP5753828B2 (zh)
CN (1) CN103699891B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6394069B2 (ja) * 2014-05-26 2018-09-26 京セラドキュメントソリューションズ株式会社 文書処理装置及び文書処理プログラム
JP6447066B2 (ja) * 2014-12-01 2019-01-09 株式会社リコー 画像処理装置、画像処理方法、及びプログラム
CN105260381A (zh) * 2015-09-08 2016-01-20 百度在线网络技术(北京)有限公司 基于图像识别的数据维护方法和装置
CN106469132A (zh) * 2016-08-31 2017-03-01 深圳天珑无线科技有限公司 数据处理的方法及装置
JP7016612B2 (ja) * 2017-02-10 2022-02-07 株式会社東芝 画像処理装置及びプログラム
CN107220648B (zh) 2017-04-11 2018-06-22 平安科技(深圳)有限公司 理赔单据的字符识别方法及服务器
JP7135446B2 (ja) * 2018-05-30 2022-09-13 京セラドキュメントソリューションズ株式会社 電子機器
US11184493B2 (en) * 2019-07-10 2021-11-23 Ricoh Company, Ltd. Information processing system, information processing method, and apparatus for extending a workflow
JP2023023590A (ja) * 2021-08-05 2023-02-16 京セラドキュメントソリューションズ株式会社 画像処理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689203A (zh) * 2007-06-29 2010-03-31 佳能株式会社 图像处理设备、图像处理方法和计算机程序
CN102222079A (zh) * 2010-04-07 2011-10-19 佳能株式会社 图像处理设备及图像处理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756869B2 (en) * 2004-04-30 2010-07-13 The Boeing Company Methods and apparatus for extracting referential keys from a document
JP2006065588A (ja) * 2004-08-26 2006-03-09 Sharp Corp 情報閲覧装置、情報閲覧プログラム及び情報閲覧プログラム記録媒体
JP2006085234A (ja) * 2004-09-14 2006-03-30 Fuji Xerox Co Ltd 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP4780169B2 (ja) 2008-09-30 2011-09-28 ブラザー工業株式会社 データ生成装置、スキャナ、及びコンピュータプログラム
JP5676942B2 (ja) * 2010-07-06 2015-02-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689203A (zh) * 2007-06-29 2010-03-31 佳能株式会社 图像处理设备、图像处理方法和计算机程序
CN102222079A (zh) * 2010-04-07 2011-10-19 佳能株式会社 图像处理设备及图像处理方法

Also Published As

Publication number Publication date
US20140085669A1 (en) 2014-03-27
CN103699891A (zh) 2014-04-02
JP2014067370A (ja) 2014-04-17
US8773704B2 (en) 2014-07-08
JP5753828B2 (ja) 2015-07-22

Similar Documents

Publication Publication Date Title
CN103699891B (zh) 图像处理装置及图像处理方法
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
JP2005108254A (ja) アイコン生成方法、アイコン選択方法及び文書検索方法
US20090030882A1 (en) Document image processing apparatus and document image processing method
US20060045340A1 (en) Character recognition apparatus and character recognition method
CN103209279B (zh) 图像读取装置、移动终端设备和图像读取方法
CN106407450A (zh) 文件搜索方法及装置
JP2014013534A (ja) 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム
KR100268367B1 (ko) 화성 처리 방법과 장치
KR20070009338A (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
JP5661549B2 (ja) 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2011065255A (ja) データ処理装置、データ名生成方法及びコンピュータプログラム
JP2016018454A (ja) 画像処理装置および画像処理装置の制御方法
JP4576211B2 (ja) 文書情報検索システム
JP3711636B2 (ja) 情報検索装置および方法
WO2014170965A1 (ja) 文書処理方法、文書処理装置および文書処理プログラム
JP4446715B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2020123233A (ja) 情報処理装置及びプログラム
CN111475679A (zh) Html文档处理方法、页面显示方法和设备
US11755818B2 (en) Computer-readable recording medium storing design document management program, design document management method, and information processing apparatus
JP2017068307A (ja) 情報検索装置及びその制御方法、情報検索用プログラム
US20210067640A1 (en) Information processing apparatus and non-transitory computer readable medium
CN114528513A (zh) 搜索引擎优化方法及装置、电子设备及可读存储介质
CN115410206A (zh) 信息处理装置、记录介质及信息处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170412

Termination date: 20200923