CN101282395A - 图像处理系统及图像处理方法 - Google Patents
图像处理系统及图像处理方法 Download PDFInfo
- Publication number
- CN101282395A CN101282395A CNA2008100845572A CN200810084557A CN101282395A CN 101282395 A CN101282395 A CN 101282395A CN A2008100845572 A CNA2008100845572 A CN A2008100845572A CN 200810084557 A CN200810084557 A CN 200810084557A CN 101282395 A CN101282395 A CN 101282395A
- Authority
- CN
- China
- Prior art keywords
- mentioned
- positive
- negative
- image processing
- view data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 70
- 238000003672 processing method Methods 0.000 title claims description 8
- 230000014509 gene expression Effects 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 8
- 230000002596 correlated effect Effects 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 abstract 1
- 101100345318 Arabidopsis thaliana MFP2 gene Proteins 0.000 description 21
- 238000012015 optical character recognition Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 10
- 239000012467 final product Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000005520 cutting process Methods 0.000 description 5
- 238000007639 printing Methods 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
- H04N1/3873—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0008—Connection or combination of a still picture apparatus with another apparatus
- H04N2201/001—Sharing resources, e.g. processing power or memory, with a connected apparatus or enhancing the capability of the still picture apparatus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Facsimiles In General (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
- Facsimile Scanning Arrangements (AREA)
Abstract
本发明提供一种图像处理系统,图像处理系统具有计算机和连接于该计算机的图像处理装置。图像处理装置的控制部执行下述控制:用扫描部对透明薄板的单面整体和另一面的整体进行光学读取,用通信部向计算机发送所取得的正反面的图像数据。计算机的控制部执行下述控制:分别对通信部所接收的正反面的图像数据,通过文字识别来取得与透明薄板上的各原稿的收纳范围相对应的每个数据区域的文字信息,基于表示单面原稿和另一面原稿的正反面的位置关系的、预先建立了关联的正反面信息,将所识别的双面的文字信息,按照每个数据区域,使正反面建立关联地存储到数据存储部。
Description
技术领域
本发明涉及图像处理系统和图像处理方法,更详细而言,涉及同时对多张名片等具有正反面的原稿读取其图像信息、进行文字识别的图像处理系统及图像处理方法。
背景技术
一直以来,在原稿读取装置中对名片等尺寸小的原稿进行光学读入时,由于装置结构方面的限制而很难进行自动原稿输送,以每次在原稿台上载置一张的方式进行原稿的读入。
在日本特开平8-289102号公报所记载的图像处理系统中,读取插入有规定尺寸的名片的盒整体的图像信息,转换为图像数据,并通过接口单元向计算机侧传输该图像数据,在计算机侧,根据该被输送来被接收的图像数据,按照所插入的各个名片的范围区域来进行图像分析,并将上述图像分析后的图像数据按照该用纸来进行管理。作为上述盒体使用透明的薄板(以下称为透明薄板)。
然而,在日本特开平8-289102号公报所记载的系统中,透明薄板收纳有多张以正反面成对儿的方式存储着信息的名片等原稿,由通用的扫描仪逐单面(或一次双面)地读入透明薄板的正反面,并进行OCR(Optical Character Reader)/数据库化,正面和反面也可分别作为独立的数据进行处理。因此,对同时读取了图像数据的多张原稿,还是需要全部通过手工操作来将表示正反面信息的数据重新整理成一个数据的操作。
发明内容
本发明就是鉴于如上述的实际情况而做出的,其目的在于提供一种可以对收纳有多张以正反面成对儿的方式打印了信息的原稿的透明薄板,毫不费力地以在同一原稿的正反面之间建立关联的方式来存储信息的图像处理系统和图像处理方法。
为了解决上述问题,本发明所涉及的图像处理系统,具有计算机和连接于该计算机的图像处理装置,其特征在于,
上述图像处理装置具有:读取部,其对可收纳多张规定大小原稿的透明薄板进行光学读取,并转换成图像数据;发送部,其向上述计算机发送正反面的图像数据,该正反面的图像数据由利用上述读取部对上述透明薄板的单面整体进行光学读取而取得的单面图像数据、和利用上述读取部对上述透明薄板的另一面整体进行光学读取而取得的另一面图像数据构成,
上述计算机,具有:接收部,其接收从上述图像处理装置发送来的正反面的图像数据;文字识别部,其分别对由上述接收部所接收的正反面的图像数据,通过文字识别取得与上述透明薄板上的各原稿的收纳范围相对应的每个数据区域的文字信息;原稿信息存储部,其基于表示单面原稿和另一面原稿之间的正反面的位置关系的、预先建立了关联的正反面信息,将上述文字识别部所识别的文字信息,按上述每个数据区域以正反面建立关联的方式进行存储。
本发明所涉及的图像处理方法,使用了计算机和连接于该计算机的图像处理装置,其特征在于,包括:读取步骤,由利用上述图像处理装置的读取部对可收纳多张规定大小原稿的透明薄板的单面整体进行光学读取、并转换为单面图像数据的步骤,和光学读取另一面整体并转换为另一面图像数据的步骤构成;发送步骤,上述图像处理装置的发送部向上述计算机发送在上述读取步骤中取得的正反面的图像数据;接收步骤,上述计算机的接收部对在上述发送步骤中从上述图像处理装置发送来的正反面的图像数据进行接收;识别步骤,上述计算机的文字识别部,分别对在上述接收步骤中接收到正反面的图像数据,通过文字识别而取得与上述透明薄板上的各个原稿的收纳范围相对应的每个数据区域的文字信息;存储步骤,上述计算机的原稿信息存储部,基于表示单面原稿和另一面原稿之间的正反面的位置关系的、预先建立了关联的正反面信息,将上述识别步骤中所识别的文字信息,按每个上述数据区域以正反面建立关联的方式进行存储。
附图说明
图1表示本发明的一实施方式所涉及的图像处理系统的一个构成例子的框图。
图2是表示在图1的图像处理系统中进行图像读取的透明薄板的一个例子的图。
图3是用于说明在图1的图像处理系统中所使用的正反面信息的示意图。
图4是表示在图1的图像处理系统中实际读入了透明薄板的双面的一对图像数据的例子的图。
图5是表示根据图4的一对图像数据所生成的数据表格的一个例子的图。
图6是用于说明图1的图像处理系统中的控制的例子的流程图。
图7是用于说明图6的控制例子中的数据登录处理的一个例子的流程图。
具体实施方式
本发明所涉及的图像处理系统是具有计算机和连接于该计算机的图像处理装置的系统。作为该图像处理装置,为至少具有扫描功能和与计算机通信的功能的装置,除了以下所例示的数字复合机以外,也可应用于更多功能或更少功能的复合机、单纯的扫描装置(原稿读取装置)等。此外,作为计算机,只要是可连接到图像处理装置的、在通用的计算机中安装了后述的规定控制程序的计算机即可。计算机和图像处理装置之间的连接,不限于有线/无线,既可以如例示所示地通过LAN等对图像处理装置连接多台计算机,也可以简单地利用USB电缆等进行连接等。
图1是表示本发明的一实施方式所涉及的图像处理系统的一个构成例子的框图,图2是表示在图1的图像处理系统中进行图像读取的透明薄板的一个例子的图,图3是用于说明在图1的图像处理系统中使用的正反面信息的示意图。
在图1中,1为计算机(以下以PC例示),2为数字复合机(以下称为MFP),3表示LAN等网络,在图2中4表示透明薄板,在图3中,5表示正面(奇数页)的图像数据,6表示反面(偶数页)的图像数据。
在图1中例示的PC1,由键盘和指针驱动器等操作部11、液晶屏等显示部12、硬盘等数据存储部13、可经由网络3和MFP2连接的LAN适配器(adapter)等通信部14以及对上述各部分进行控制的控制部15构成。
控制部15,具有后述的名片尺寸分割部15a、OCR部15b以及正反面关联登录部15c,并对进行图像数据的图像分析等PC1的整体进行控制。例如,控制部15,具有CPU、作为程序存储区域的ROM、作为工作区域的RAM等硬件,可以在ROM和硬盘中存储规定的控制程序。由此,利用CPU将存储在ROM等当中的规定控制程序读出到RAM中,并予以执行,可以实现包括各部分15a~15c功能的控制部15的功能。
一方面,在图1中例示的MFP2由经由网络3可与PC1连接的LAN适配器等通信部21、硬盘等数据存储部22、对原稿进行光学读取的扫描部23、可以打印利用扫描部23所读取的图像数据和存储在数据存储部22中的电子文件的打印部24、触摸面板等操作显示部25以及对上述各部分进行控制的控制部26构成。
控制部26具有后述的名片图像发送控制部26a,对扫描、扫描图像数据生成、打印数据生成、打印等MFP2的整体进行控制。例如,控制部26和控制部15相同,具有CPU、ROM、RAM等硬件,通过在ROM中存储规定的控制程序,可以实现包括名片图像发送控制部26a功能的控制部26的功能。
接下来,根据如上述构成的例子来说明本发明的主要的特征部分。首先,在本发明所涉及的图像处理系统中作为扫描对象的透明薄板,是能够利用纵线41和横线42进行划分等、以多张排列的状态收纳规定大小的原稿的薄板。该透明薄板,也可以不用为了实现本发明而另外准备,可以直接地利用市场上出售的透明薄板,该透明薄板在多张排列的状态下易于识别地收纳名片等即可。以下,作为透明薄板,例举了在图2中所例示的可收纳2×5的双面名片(合计可收纳10张名片)的A4尺寸的透明薄板4,不过不限于此,也可以是名片以外的原稿,只要是也可以利用扫描部23来辨认多张原稿的双面彩色的薄板即可。并且,透明薄板一般在横侧或纵侧设置多个用于作为册子进行归档的孔,不过,不限于此。此外,即使多个收纳部位之中的一部分上实际没有收纳原稿,也可以进行本发明的处理。
MFP2,通过使用者将透明薄板4载置于扫描部23并从操作显示部25进行的名片读取操作,对单面整体进行光学读取,并转换为单面图像数据,也可以对另一面进行光学读取并转换为另一面的图像数据。MFP2,进一步经由网络3向PC1发送通过变换而取得的正反面(双面)的图像数据。正反面的图像数据可以定义为由连续读取的透明薄板4的正面(或反面)的图像数据和透明薄板4的反面(或正面)的图像数据构成的组。
MFP2,通过用名片图像发送控制部26a控制扫描部23和通信部21来执行上述处理。此外,名片图像发送控制部26a也可以不将正反图像数据作为组来进行发送,可以进行下述控制,即:当用扫描部23扫描透明薄板4而取得单面的图像数据时,用通信部21进行发送,接下来同样地,在通过扫描取得另一面的图像数据时用通信部21发送。单面的图像数据和另一面的图像数据,既可以按照根据数据的名和标题等进行辨认的方式从MFP2发送,也可以用PC1组合为连续的一对图像数据。
由此,MFP2具有分别用名片图像发送控制部26a和扫描部23例示的读取部、以及用名片图像发送控制部26a和通信部21例示的发送部。
PC1,如在通信部14所示,具有接收部,其接收从MFP2发送的正反面图像数据。此外,PC1还具有文字识别部,其分别对通信部14所接收的正反面图像数据,通过文字识别来取得每个数据区域的文字信息,上述每个数据区域与透明薄板上的各原稿的收纳范围(上述的规定大小的范围)相对应。
在上述文字识别部中,分别对接收的正反面的图像数据,由名片尺寸分割部15a划分为与透明薄板4上的各原稿的收纳范围相对应的每个数据区域,之后OCR部15b按照每个数据区域来执行文字识别。此外,作为上述操作的替代,也可以在文字识别部中,分别对所接收的正反面图像数据,由OCR部15b进行文字识别后,再由名片尺寸分割部15a按照每个数据区域来划分正面的图像数据,也按照每个数据区域来划分反面的图像数据。此外,也可以在MFP2侧预先执行每个数据区域的划分。
此外,PC1具有原稿信息存储部,其如利用正反面关联登录部15c和其登录地址的数据存储部13所例示的那样,基于预先建立关联的正反面信息,以正反面之间建立关联的方式按每个数据区域存储由文字识别部所识别的文字信息。
在这里,正反面信息指表示单面原稿和另一面原稿之间的正反面的位置关系(原稿位置关系)的信息。作为正反面信息,例如图2的透明薄板4,例如在图3中的正面的图像数据5和反面的图像数据6之间,只要对“正面1-1”和其反面的“反面1-2”、“正面1-2”和其反面的“反面1-1”、“正面2-1”和其反面的“反面2-2”等与正反面的位置关系建立对应关系即可。该正反面信息既可以用正反面关联登录部15c存储,或用数据存储部13来存储。
这样,通过对名片的正反面建立关联,可以在文字识别处理后,以正面和反面为1张名片数据的方式来进行数据库化。此外,即使在使用者将透明薄板4的反面载置到原稿台上时反方向载置、并且就这样直接读入的情况下,由于通过后述的文字识别可以知道文字方向,所以可知道逆向载置。此时,既可以建立逆向用的对应关系,也可以在反转了一方的图像数据之后进行处理。此外,也可以作为正反面信息而准备好正向用的对应关系和逆向用的对应关系,从而可有使用者进行选择。
由此,在本发明中使用的PC1,对于接收的图像数据,按照所收纳的各原稿的范围区域,基于建立了关联的正反面信息,进行双面的图像分析(文字识别等),并按照每个该原稿以建立关联的方式存储图像分析后的图像数据。
以下,列举具体的控制例子对本发明的图像处理系统进行说明。图4是表示在图1的图像处理系统中实际读取了透明薄板的双面的一对图像数据的一个例子的图,图中,50是名片组的正面的图像数据,60是名片组的反面的图像数据。图5是表示根据图4的一对图像数据而生成的数据表格的一个例子的图,图中7表示数据表格。图6是用于说明图1的图像处理系统中的控制的例子的流程图,图7是用于说明在图6的控制例子中的数据登录处理的一个例子的流程图。
首先,MFP2的名片图像发送控制部26a,基于使用者从操作显示部25直接设置的或经由PC1而设置的指示来设定模式(步骤S1)。这里所说的设定的模式是指通过正反面建立关联来自动地执行文字识别/存储的模式,当设定为其它的模式时,不执行以下的处理。然后,在设定为这种模式时,作为扫描时操作的一部分,需要使用者选择“是否为需要建立关联的双面原稿(这里为名片)”的设定或,如“名片/双面原稿/2×5张A4薄板”的薄板格式的设定。实际这是因为在不是透明薄板的情况下或虽然使用透明薄板4但是仅收纳各页正面(即在反面放入其它的名片)的情况下,不需要正反面建立关联的缘故。
然后,使用者将透明薄板4载置在原稿台上并根据使用者从操作显示部25进行的名片读取操作,名片图像发送控制部26a开始逐面地读取透明薄板4(步骤S2)。等待上述操作结束(步骤S3)。在这里,因为很多情况下自动原稿输送装置对如透明薄板4这样的薄板不对应,所以,基本上由使用者执行向原稿台的载置以及以反面的再载置。不过,也可以设置对应的自动原稿输送装置,从而一次读取双面。
具体而言,通过对图2所示的2×5的双面名片收纳A4透明薄板4进行逐面的扫描或双面扫描,例如,生成图4所示的正面(奇数页)的图像数据50和反面(偶数页)的图像数据60。并且,在图像数据50、60中,省略了一部分图像内容,基于在图3中说明过的正反面信息在正反面对应的部位标注相同符号E~J来进行标记。
然后,名片图像发送控制部26a,向PC1发送正反面图像数据(步骤S4),等待发送结束(步骤S5)。在步骤S4中,也可以与图像数据一起,将“模式设定”中的选择值用XML等发送到PC侧。PC1侧可以基于上述信息来判断是否是作为“需要建立关联的双面原稿”而扫描的图像,根据需要来执行如后述的正反面建立关联处理。
在PC1侧,名片尺寸分割部15a,基于通信部14从MFP2接收到的图像数据(扫描图像),执行正反面建立关联处理和名片尺寸(图4的例子中m=10)m个区域的划分(区域分割)(步骤S6)。
这里所说的正反面建立关联处理是对所接收的2个图像数据建立关联的处理,即如果接收的图像数据是作为一对的组,则为仅确认该组的处理,不是组而是依次发送来的情况下,将连续的2张图像数据作为正反面的图像数据而建立关联的处理。
然后,OCR部15b设定n=1(步骤S7),对划分出的正面区域n开始OCR分析(步骤S8),等待上述分析结束(步骤S9)。之后,OCR部15b参照图3所例示的正反面信息来对在步骤S8中成为OCR分析对象的区域n检测其反面区域,并对该反面区域开始OCR分析(步骤S10),等待上述分析结束(步骤S11)。正反面关联登录部15c基于在步骤S8、S10中的分析结果(文字识别结果),将对正反面区域n的分析结果如后所述作为一个数据而登录到数据存储部13(步骤S12)中。
在步骤S12中,可以如在数据表格7中所例示的那样,作为地址簿等数据库而登录到数据存储部13中。由此,当正面区域n为读取了图3的“正面1-1”的图像区域(图4的名片图像51)的情况下,将该名片图像51所包含的各信息51a~51e,和作为与其对应的反面区域n(读入了图3的“反面1-2”的图像区域)的名片图像61所包含的各信息61a~61e建立关联,并登录到数据表格7中。在这里,以正面区域n为基准进行了说明,不过,在名片图像61中存在邮件地址信息61f,其正面不存在邮件地址信息。为了对应这种情况,若以信息多的一方(在这里是反面的名片图像61)的区域数为n来执行以下处理,则由于可以知道正面不存在和区域61f相对应的区域,所以,可以在数据表格7中仅登录区域61f的信息。
在步骤S12之后,OCR部15b,判断是否是n=m(步骤S13),若是则结束处理,若否,则对n加1(步骤S14),返回步骤S8,对剩余的区域也重复步骤S8~S13的处理。通过这种重复,可以向数据表格7登录全部的名片图像。例如,在图4中,名片图像52内的各信息和名片图像62内的各信息建立关联、名片图像53内的各信息和名片图像63内的各信息建立关联、名片图像54内的各信息和名片图像64内的各信息建立关联,正面的名片图像E~J内的各信息分别和反面的名片图像E~J内的各信息建立关联,并登录在数据表格7中。
在步骤S12中,如图7中例示的那样,正反面关联登录部15c判断区域n的反面是否是白纸(步骤S21),是白纸的情况下,向数据存储部13仅登录通过文字识别所取得的正面的数据项目(步骤S26),结束处理。例如,图4的反面的名片图像64是白纸,在此情况下执行步骤S26的处理。另一方面,在步骤S21中不是白纸的情况下,使用区域n的双面文字信息来执行向数据存储部13的登录(后述的步骤S22~S25),结束处理。并且与步骤S22~S25的顺序无关。
由此,PC1优选具有白纸判定部,其分别针对所接收的正反面的图像数据,在文字识别之前,按照每个数据区域进行图像分析判断是否是白纸。而且,对于通过该白纸判定部判定为是白纸的数据区域,可以不执行文字识别。然后,正反面关联登录部15c,在与白纸判定部判定为是白纸的数据区域满足正反面关系的数据区域未被判断为是白纸且完成文字识别的情况下,仅存储完成了文字识别的一方的文字信息即可。在进行图像分析时,当检测到一面为白纸的情况下,通过仅存储另一面中的图像数据,如果是没有反面的名片则可以仅存储正面数据,从而可以实现数据的少量化。
此外,在没有设置这种白纸判定部的情况下,正反面关联登录部15c,对于满足正反面关系的数据区域实施双面文字识别后的结果的文字信息组之中一方的文字信息内不存在文字的情况下,仅存储另一方的文字信息即可。在这种方式中,因为在一面为白纸的情况下,以没有文字的状态被识别,所以仅存储另一面中的图像数据,由此,如果是没有反面的名片,则可以仅存储正面的数据,从而可以实现数据的少量化。
在步骤S22中,对区域n,将反面的名字(例如图4的信息61b)翻译为读音假名,与正面的名字(例如图4的信息51b)建立关联并进行登录,在步骤S23中,对区域n,将反面的住所(例如图4的信息61c)翻译为读音假名,与正面的住所(例如图4的信息51c)建立关联,并进行登录。
由此,OCR部15b,也可以在单面图像数据和另一面的图像数据中使所使用语言不同来进行文字识别。由此,即使正面图像数据和反面图像数据语言不同,也可以建立关联并进行登录。但是正面也有“FAX”等英语表述,作为可以利用日语辞典来充分应对的内容来进行处理。
并且,如步骤S22、S23所示,正反面关联登录部15c,当对满足正反面关系的数据区域进行识别后的文字信息组中,各文字信息包含同一内容的信息(项目信息,例如名字信息51b和名字信息61b)的情况下,优选将同一内容的信息建立关联并进行存储。由此,例如可以将名字、住所以及公司名的英语版和日语版建立关联并进行登录。
此外,如步骤S22、S23所示,同一内容的信息之间建立关联,优选执行翻译,将一面的信息翻译为另一面的信息的语言。由此,例如可以将名字、住所及公司名称的英文版的翻译亦即读音假名和日语版建立关联并登录。当然,也可以以将作为翻译源的英语表述保留下来的状态向数据表格7登录。
在步骤S24中,如果在正面和反面有FAX号码、TEL号码、邮件地址等同一数据项目,则仅登录正面(或反面)的数据。由此,正反面关联登录部15c,在对满足正反面关系的数据区域进行识别后的文字信息组中各文字信息包含同一表述的信息的情况下,最好不存储一面的信息。如果在表示同一内容的项目中如邮件地址和FAX号码等正反面表述相同,则可以防止对重复的数据进行重复登录,从而可以防止数据量的增大。此外,当电话号码和FAX号码等包括国家号码的情况下,也可以省略国家号码并进行登录。
在步骤S25中,对于不符合步骤S22~S24的其它数据项目,在正面和反面之间建立关联并进行登录。由此,在PC1的控制部15中,由名片尺寸分割部15a基于扫描图像划分成名片尺寸,由此生成每一张的正面名片图像数据和反面的名片图像数据,正面和反面的名片的图像数据,通过OCR部15b来识别名片所包括的文字信息,并由正反面关联登录部15c使上述识别结果以正面和反面之间建立关联并进行登录。
通过如以上的登录,数据存储部13,如图5中例示的那样,存储有数据表格7,数据表格7包括自动赋予的ID70,并且还包括名字71、名字(读音假名)72、公司73、公司(读音假名)74、住所75、住所(读音假名)76、电话号码77、FAX号码78、以及邮件地址79。并且,如果和信息相对应的读音假名的信息,如名字71和名字(读音假名)72那样相邻存储则容易观察。此外,在图5中,名字71、公司73、住所75的数据是用日语正式地进行表述的文字,也可以使用汉字。
此外,如名片图像52所示,当图像分析的结果存在作为非文字图像而被识别的面部照片等图像数据52P的情况下,作为附加图像进行处理即可,作为数据保存其图像,并在数据表格7中存储保存地址即可。此外,数据存储部13也可以存储所接收的一对图像数据本身,在这种情况下,也可以在数据表格7中添加表示其保存地址的信息。
此外,在图6和图7中,仅对1个薄板的处理进行了说明,但是,实际也可以考虑连续扫描多个薄板的处理。在上述情况下,在发送了多张仅为正面的扫描图像之后、发送多张仅为反面的扫描图像的情况下,在将正面的第一张和反面的第一张建立关联、将正面的第二张和反面的第二张建立关联这种情况下,只要按照页数关联即可。或者也可以重复进行正面、反面的扫描,并将其每2张作为一组建立关联。此外,扫描本身,既可以使用自动原稿输送装置来执行,也可以不使用自动原稿输送装置而通过手工操作载置到原稿台上。
此外,在图6中,将步骤S1~S5作为MFP2侧的处理进行说明,而将步骤S6~S14作为PC1侧的处理进行了说明,也可以在MFP2的操作显示部25的“模式设定”中,选择如所说的“名片/双面原稿/2×5A4薄板”的薄板格式,从而在MFP2侧执行对每张名片的正反面建立关联处理。这里所说的对每张名片的正反面建立关联处理,相当于每一张名片区域的划分处理、将正反面图像合成一个图像数据(也可以仅作为成对的图像数据而建立关联而不进行合成)。不论在哪种情况下,都可以利用上述的文字识别部,分别对所接收的正反面的图像数据,通过文字识别来取得每个数据区域的文字信息,上述每个数据区域和透明薄板上的各原稿的收纳范围相对应,只要在上述的原稿信息存储部中可以基于正反面信息,将所识别的文字信息按照每个数据区域以正反面之间建立关联的方式存储即可。
如上述所述,即使在利用通用扫描仪逐面(或双面一起)地读入收纳有多张名片的透明薄板的正反面的情况下,通过“自动并适当地进行”正反面的建立关联处理,可以将正面和反面作为一张名片的数据进行处理,所以,可以将正反面的数据作为一个数据进行数据库化。即,在向由多张可以在一个薄板中收纳多张名片的透明薄板构成的名片夹中插入名片,一次读入该多张名片,并能自动的进行OCR处理/数据库化的系统中,对收纳了特别是双面打印的名片的透明薄板执行双面扫描,可以使其正反面建立关联。因此,在本发明中,不再需要在以往技术中需要的操作,即对全部名片重新将表示正反面信息的数据整理成一个数据的手工操作。
以上,参照图1至图7,对本发明的图像处理系统的各实施方式进行了说明,为了说明其控制流程,本发明也可以采用使用PC1等计算机和MFP2等图像处理装置的图像处理方法。
此外,本发明也可以采取安装在图像处理装置中的程序和安装在计算机中的程序的方式。这些程序例示为控制部26内的控制程序和控制部15内的控制程序。
例如,MFP2用的程序为安装在具有扫描部23、可以与PC1进行通信的通信部21、以及控制部26的MFP2中的程序,在控制部26中是用于执行下述处理的程序:若自使用者接受到的执行如本发明的透明薄板的读入的操作,则利用扫描部23对透明薄板进行双面读入,并向PC1发送正反面的图像数据。
此外,PC1用的程序是用于安装在具有可与MFP2进行通信的通信部14和控制部15的PC1中的程序。该程序,在控制部15(控制部15内的CUP)内是用于执行下述步骤的程序:接收步骤,从MFP2接收利用MFP2对可收纳多张规定尺寸的原稿的透明薄板的正反面进行光学读取而得到的正反面图像数据;文字识别步骤,分别对所接收的正反面的图像数据,通过文字识别而取得对应于透明薄板上的各原稿的收纳范围的每个数据区域的文字信息;原稿信息存储步骤,基于预先建立关联的正反面信息,按照每个数据区域,将在文字识别步骤中所识别的文字信息按照正反面之间建立关联的方式存储。
并且,上述程序可以作为记录了程序的计算机可读记录介质而进行分发和经由网路进行发布,能够可执行地安装到图像处理装置和计算机中。
根据本发明,可以对收纳有多张以正反面成对儿的方式打印了信息的原稿的透明薄板,毫不费力地以在同一原稿的正反面之间建立关联的方式存储信息。
Claims (10)
1.一种图像处理系统,具有计算机和连接于该计算机的图像处理装置,其特征在于,
上述图像处理装置具有:读取部,其对可收纳多张规定大小原稿的透明薄板进行光学读取,并转换成图像数据;发送部,其向上述计算机发送正反面的图像数据,该正反面的图像数据由利用上述读取部对上述透明薄板的单面整体进行光学读取而取得的单面图像数据、和利用上述读取部对上述透明薄板的另一面整体进行光学读取而取得的另一面图像数据构成,
上述计算机,具有:接收部,其接收从上述图像处理装置发送来的正反面的图像数据;文字识别部,其分别对上述接收部所接收的正反面的图像数据,通过文字识别取得与上述透明薄板上的各原稿的收纳范围相对应的每个数据区域的文字信息;原稿信息存储部,其基于表示单面原稿和另一面原稿之间的正反面的位置关系的、预先建立了关联的正反面信息,将上述文字识别部所识别的文字信息,按上述每个数据区域以正反面建立关联的方式进行存储。
2.根据权利要求1所述的图像处理系统,其特征在于,
上述文字识别部,分别对上述接收部所接收的正反面的图像数据,划分为上述每个数据区域,执行文字识别,或者分别对上述接收部所接收的正反面的图像数据进行文字识别后,再划分为上述每个数据区域。
3.根据权利要求1或2所述的图像处理系统,其特征在于,
上述文字识别部,在上述单面图像数据和上述另一面图像数据中使所使用语言不同来执行文字识别。
4.根据权利要求3所述的图像处理系统,其特征在于,
上述原稿信息存储部,在由上述文字识别部对满足正反面关系的数据区域进行识别后的文字信息组中,各文字信息包含了同一内容的信息的情况下,将上述同一内容的信息之间建立关联并进行存储。
5.根据权利要求4所述的图像处理系统,其特征在于,
上述同一内容的信息之间的建立关联,通过将一面信息翻译成另一面信息的语言的方式来执行。
6.根据权利要求1所述的图像处理系统,其特征在于,
上述原稿信息存储部,在由上述文字识别部对满足正反面关系的数据区域进行识别后的文字信息组中,各文字信息包含了同一表述的信息的情况下,对一方的信息不进行存储。
7.根据权利要求1所述的图像处理系统,其特征在于,
上述原稿信息存储部,在由上述文字识别部对满足正反面关系的数据区域进行识别后的文字信息组中、一方文字信息中不存在文字的情况下,仅对另一方文字信息进行存储。
8.根据权利要求1所述的图像处理系统,其特征在于,
上述计算机具有白纸判定部,该白纸判定部在分别对上述接收部所接收的正反面的图像数据用上述文字识别部进行文字识别之前,按照上述每个数据区域进行图像分析,判定是否是白纸,
上述文字识别部,对由上述白纸判定部判定为是白纸的数据区域不进行文字识别。
9.根据权利要求8所述的图像处理系统,其特征在于,
上述原稿信息存储部,当与上述白纸判定部判定为是白纸的数据区域满足正反面关系的数据区域未被判定为是白纸、并且用上述文字识别部完成了文字识别的情况下,仅对完成文字识别一方的文字信息进行存储。
10.一种图像处理方法,使用了计算机和连接于该计算机的图像处理装置,其特征在于,包括:
读取步骤,由利用上述图像处理装置的读取部对可收纳多张规定大小原稿的透明薄板的单面整体进行光学读取、并转换为单面图像数据的步骤,和光学读取另一面整体并转换为另一面图像数据的步骤构成;
发送步骤,上述图像处理装置的发送部向上述计算机发送在上述读取步骤中取得的正反面的图像数据;
接收步骤,上述计算机的接收部对在上述发送步骤中从上述图像处理装置发送来的正反面的图像数据进行接收;
识别步骤,上述计算机的文字识别部,分别对在上述接收步骤中接收到正反面的图像数据,通过文字识别而取得与上述透明薄板上的各个原稿的收纳范围相对应的每个数据区域的文字信息;以及
存储步骤,上述计算机的原稿信息存储部,基于表示单面原稿和另一面原稿之间的正反面的位置关系的、预先建立了关联的正反面信息,将上述识别步骤中所识别的文字信息,按照每个上述数据区域以正反面建立关联的方式进行存储。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007100410A JP4359721B2 (ja) | 2007-04-06 | 2007-04-06 | 画像処理システム、画像処理方法、及びプログラム |
JP2007-100410 | 2007-04-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101282395A true CN101282395A (zh) | 2008-10-08 |
CN101282395B CN101282395B (zh) | 2011-05-11 |
Family
ID=39982133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100845572A Expired - Fee Related CN101282395B (zh) | 2007-04-06 | 2008-03-25 | 图像处理系统及图像处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8184908B2 (zh) |
JP (1) | JP4359721B2 (zh) |
CN (1) | CN101282395B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102457649A (zh) * | 2010-11-01 | 2012-05-16 | 京瓷美达株式会社 | 图像形成装置以及图像形成方法 |
CN102831625A (zh) * | 2011-06-13 | 2012-12-19 | 深圳富泰宏精密工业有限公司 | 双面图片处理系统和方法 |
CN102833449A (zh) * | 2012-07-27 | 2012-12-19 | 富士施乐实业发展(上海)有限公司 | 一种基于多功能机的文档自动处理方法 |
CN103369191A (zh) * | 2012-03-29 | 2013-10-23 | 佳能株式会社 | 读取装置及其控制方法 |
CN104883467A (zh) * | 2014-02-28 | 2015-09-02 | 日本冲信息株式会社 | 图像形成装置以及方法 |
CN105472202A (zh) * | 2014-08-25 | 2016-04-06 | 日本冲信息株式会社 | 图像形成装置和图像形成方法 |
CN108701291A (zh) * | 2015-08-31 | 2018-10-23 | 微软技术授权有限责任公司 | 在社交网络中利用用户信息的数字图像 |
CN109426810A (zh) * | 2017-08-30 | 2019-03-05 | 精工爱普生株式会社 | 处理装置、处理系统、处理方法以及计算机可读记录介质 |
CN110138992A (zh) * | 2018-02-08 | 2019-08-16 | 精工爱普生株式会社 | 收据处理装置、程序的存储介质以及报告的制作方法 |
CN110278343A (zh) * | 2016-02-09 | 2019-09-24 | 富士施乐株式会社 | 图像处理装置和图像处理方法 |
CN111695568A (zh) * | 2019-03-14 | 2020-09-22 | 精工爱普生株式会社 | 信息处理装置、机器学习装置以及信息处理方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8411956B2 (en) * | 2008-09-29 | 2013-04-02 | Microsoft Corporation | Associating optical character recognition text data with source images |
JP4843705B2 (ja) * | 2009-11-20 | 2011-12-21 | 株式会社東芝 | 名刺読取装置 |
JP6427964B2 (ja) | 2013-11-28 | 2018-11-28 | 株式会社リコー | 画像処理システム、情報処理装置及びプログラム |
US9923991B2 (en) | 2015-08-31 | 2018-03-20 | Microsoft Technology Licensing, Llc | Automatic online registration based on data extracted from a digital image |
JP6690278B2 (ja) * | 2016-02-10 | 2020-04-28 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP2022140886A (ja) | 2021-03-15 | 2022-09-29 | 富士フイルムビジネスイノベーション株式会社 | 画像読取装置及び画像読取プログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07306927A (ja) | 1994-05-11 | 1995-11-21 | Matsushita Electric Ind Co Ltd | 電子ファイル装置 |
US5717941A (en) * | 1994-05-11 | 1998-02-10 | Matsushita Electric Industrial Co., Ltd. | Electronic file system for storing documents with front and back pages |
JPH08289102A (ja) | 1995-04-14 | 1996-11-01 | Canon Inc | 画像処理システム |
JP2002288169A (ja) * | 2001-03-26 | 2002-10-04 | Sharp Corp | 画像形成装置 |
JP4067870B2 (ja) * | 2002-05-14 | 2008-03-26 | シャープ株式会社 | 画像読取り装置 |
CN1520148A (zh) * | 2003-01-24 | 2004-08-11 | 力捷电脑股份有限公司 | 双面扫描装置的运作方法 |
JP2006261821A (ja) | 2005-03-15 | 2006-09-28 | Fuji Xerox Co Ltd | 画像形成装置および画像読み取り装置 |
JP2006339770A (ja) * | 2005-05-31 | 2006-12-14 | Canon Inc | 画像処理システムおよびその制御方法 |
JP4795038B2 (ja) | 2006-02-01 | 2011-10-19 | キヤノン株式会社 | 名刺管理システム、はがき管理システム、名刺管理方法およびはがき管理方法 |
-
2007
- 2007-04-06 JP JP2007100410A patent/JP4359721B2/ja active Active
-
2008
- 2008-03-25 CN CN2008100845572A patent/CN101282395B/zh not_active Expired - Fee Related
- 2008-04-01 US US12/060,720 patent/US8184908B2/en not_active Expired - Fee Related
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102457649B (zh) * | 2010-11-01 | 2015-04-01 | 京瓷办公信息系统株式会社 | 图像形成装置以及图像形成方法 |
CN102457649A (zh) * | 2010-11-01 | 2012-05-16 | 京瓷美达株式会社 | 图像形成装置以及图像形成方法 |
CN102831625A (zh) * | 2011-06-13 | 2012-12-19 | 深圳富泰宏精密工业有限公司 | 双面图片处理系统和方法 |
CN102831625B (zh) * | 2011-06-13 | 2016-01-06 | 深圳富泰宏精密工业有限公司 | 双面图片处理系统和方法 |
CN103369191B (zh) * | 2012-03-29 | 2016-02-17 | 佳能株式会社 | 读取装置及其控制方法 |
CN103369191A (zh) * | 2012-03-29 | 2013-10-23 | 佳能株式会社 | 读取装置及其控制方法 |
CN102833449A (zh) * | 2012-07-27 | 2012-12-19 | 富士施乐实业发展(上海)有限公司 | 一种基于多功能机的文档自动处理方法 |
CN102833449B (zh) * | 2012-07-27 | 2015-06-10 | 富士施乐实业发展(中国)有限公司 | 一种基于多功能机的文档自动处理方法 |
CN104883467B (zh) * | 2014-02-28 | 2019-01-11 | 日本冲信息株式会社 | 图像形成装置以及方法 |
CN104883467A (zh) * | 2014-02-28 | 2015-09-02 | 日本冲信息株式会社 | 图像形成装置以及方法 |
CN105472202A (zh) * | 2014-08-25 | 2016-04-06 | 日本冲信息株式会社 | 图像形成装置和图像形成方法 |
CN108701291A (zh) * | 2015-08-31 | 2018-10-23 | 微软技术授权有限责任公司 | 在社交网络中利用用户信息的数字图像 |
CN108701291B (zh) * | 2015-08-31 | 2022-01-14 | 微软技术许可有限责任公司 | 在社交网络中利用用户信息的数字图像 |
CN110278343A (zh) * | 2016-02-09 | 2019-09-24 | 富士施乐株式会社 | 图像处理装置和图像处理方法 |
CN110278343B (zh) * | 2016-02-09 | 2021-11-19 | 富士胶片商业创新有限公司 | 图像处理装置和图像处理方法 |
CN109426810A (zh) * | 2017-08-30 | 2019-03-05 | 精工爱普生株式会社 | 处理装置、处理系统、处理方法以及计算机可读记录介质 |
CN110138992A (zh) * | 2018-02-08 | 2019-08-16 | 精工爱普生株式会社 | 收据处理装置、程序的存储介质以及报告的制作方法 |
CN111695568A (zh) * | 2019-03-14 | 2020-09-22 | 精工爱普生株式会社 | 信息处理装置、机器学习装置以及信息处理方法 |
CN111695568B (zh) * | 2019-03-14 | 2023-08-18 | 精工爱普生株式会社 | 信息处理装置、机器学习装置以及信息处理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080298686A1 (en) | 2008-12-04 |
CN101282395B (zh) | 2011-05-11 |
JP2008259012A (ja) | 2008-10-23 |
JP4359721B2 (ja) | 2009-11-04 |
US8184908B2 (en) | 2012-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101282395B (zh) | 图像处理系统及图像处理方法 | |
CN101800826B (zh) | 图像处理装置、终端装置、打印机装置及图像处理方法 | |
US8131081B2 (en) | Image processing apparatus, and computer program product | |
JP4796830B2 (ja) | 情報処理方法及び情報処理装置 | |
US20080209549A1 (en) | Computer readable medium, document processing apparatus, document processing system, document processing method, and computer data signal | |
CN102404478A (zh) | 图像形成装置及系统、信息处理装置、图像形成方法 | |
CN101262547B (zh) | 图像处理设备及其控制方法 | |
AU5243700A (en) | Automatic barcode creation for data transfer and retrieval | |
CN102447806A (zh) | 印刷系统、计算机、图像形成装置、以及印刷方法 | |
US8749832B2 (en) | Information processing device | |
US9898236B2 (en) | Image processing apparatus and program for printing template images using keyword data | |
JP4254775B2 (ja) | 書込画像取得装置、書込情報抽出方法、およびコンピュータプログラム | |
CN113395397A (zh) | 图像处理装置、记录介质及图像处理方法 | |
US9860398B2 (en) | Information processing apparatus that creates other documents from read document | |
US20040196471A1 (en) | Image forming apparatus and image forming method for making image output setting easily | |
CN100553284C (zh) | 文档处理装置及文档处理方法 | |
JP4835213B2 (ja) | 印刷システム | |
US7359659B2 (en) | Image forming apparatus and image forming method to create a composite image of a page image and an input text string | |
CN106161867A (zh) | 图像处理方法和图像处理装置 | |
JP2006245747A (ja) | 印刷装置および印刷処理方法 | |
JP2008160339A (ja) | 画像形成装置 | |
JPH10136137A (ja) | ドキュメントデジタルコピーライター装置 | |
JP3859263B2 (ja) | 伝票用紙と専用用紙の使用方法 | |
KR100260905B1 (ko) | 프린터의 양면 인쇄 방법 | |
CN101163185A (zh) | 根据索引信息处理文件的成像设备及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110511 |