CN103685834B - 图像读取装置及文件管理系统 - Google Patents
图像读取装置及文件管理系统 Download PDFInfo
- Publication number
- CN103685834B CN103685834B CN201310336698.XA CN201310336698A CN103685834B CN 103685834 B CN103685834 B CN 103685834B CN 201310336698 A CN201310336698 A CN 201310336698A CN 103685834 B CN103685834 B CN 103685834B
- Authority
- CN
- China
- Prior art keywords
- image
- seal
- word
- information
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
Abstract
本发明提供一种图像读取装置及文件管理系统。本发明所涉及的图像读取装置具备图像读取部、接受文字图章输入信息的输入的文字图章输入信息接受部、原稿文字信息提取部和附信息图像数据生成部。附信息图像数据生成部生成作为使元信息与已盖图章图像为一组的数据的附信息图像数据。元信息为将通过文字图章输入信息接受部接受的文字图章输入信息附加到通过原稿文字信息提取部提取的原稿文字信息而成的信息。根据本发明,在使已盖图章图像与已盖图章图像中包含的与字符串对应的信息为一组来输出的情况下,能够可靠地输出与图章文字图像对应的文字,所述已盖图章图像为将作为表示文字的图像的图章文字图像重叠到原稿的图像而成的图像。
Description
技术领域
本发明涉及一种图像读取装置及文件管理系统,特别地,涉及一种使表示文字的图像重叠到原稿的图像而成的图像与该被重叠的图像中包含的与字符串有关的信息为一组输出的技术。
背景技术
近年来,已知有如下技术,即将利用MFP(MultiFunctionPeripherals:复合机)的扫描部读取的表示原稿图像的图像数据变换为PDF数据,并且进行该图像数据的文字识别以制作文本数据,并将该文本数据作为透明文本数据粘贴到PDF数据中,从而制作所谓能够检索的PDF并输出。另外,已知有将由用户输入的表示文字的位图重叠到利用读取单元(扫描部)读取的原稿的图像的技术。
通过使用这些技术,生成将作为由用户输入的表示“对外机密”或“机密”等的文字的图像的图章文字图像重叠到原稿的图像而成的图像,并且提取生成的图像中包含的与字符串有关的信息(原稿文字信息),从而能够将生成的图像与提取的原稿文字信息作为一组输出。
然而,在从图章文字图像重叠到原稿的图像而成的图像提取字符串时,由于因图章文字图像的分辨率低而通过图章文字图像表示的文字作为图案被识别,因此不能提取通过图章文字图像表示的文字。或者,当通过图章文字图像表示的文字与原稿的图像中包含的文字重叠时,由于未能作为文字适当地识别,因此不能提取通过图章文字图像表示的文字。
这样做的结果,当使图章文字图像重叠到原稿的图像而成的图像(已盖图章图像)与从已盖图章图像提取的原稿文字信息为一组来输出时,在输出的原稿文字信息中,有可能不包含通过用户应明确输入的通过图章文字图像表示的文本信息。
发明内容
本发明是鉴于这种情况提出的,目的在于提供一种图像读取装置及文件管理系统,当使已盖图章图像与已盖图章图像中包含的与字符串对应的信息为一组来输出的情况下,能够可靠地输出与图章文字图像对应的文本信息,所述已盖图章图像为将作为表示文字的图像的图章文字图像重叠到原稿的图像而成的图像。
本发明的一方案所涉及的图像读取装置具备:图像读取部,读取原稿的图像;文字图章输入信息接受部,接受文字图章输入信息的输入,文字图章输入信息为与图章文字有关的信息,所述图章文字为作为图像重叠到原稿图像的文字,所述原稿图像为通过所述图像读取部读取的图像;原稿文字信息提取部,提取原稿文字信息,所述原稿文字信息为与所述原稿图像中包含的字符串有关的信息;已盖图章图像生成部,生成图章文字图像,并通过将生成的图章文字图像重叠到所述原稿图像,从而生成已盖图章图像,所述已盖图章图像为所述图章文字图像重叠到所述原稿图像而成的图像,所述图章文字图像为表示与通过所述文字图章输入信息接受部接受的文字图章输入信息对应的图章文字的图像;附信息图像数据生成部,生成附信息图像数据,所述附信息图像数据为以元信息与所述已盖图章图像为一组的数据,所述元信息为将通过文字图章输入信息接受部接受的文字图章输入信息附加到通过原稿文字信息提取部提取的原稿文字信息而成的信息,所述文字图章输入信息为使图章文字信息与图章位置信息对应的信息,所述图章文字信息为表示所述图章文字的信息,所述图章位置信息为表示在所述原稿图像中使与所述图章文字对应的所述图章文字图像重叠的位置的信息,所述原稿文字信息为使字符串信息与字符串位置信息对应的信息,所述字符串信息表示所述原稿图像中包含的字符串,所述字符串位置信息表示在所述原稿图像中配置有所述字符串的位置,所述已盖图章图像生成部将表示与所述文字图章输入信息中包含的图章文字信息对应的图章文字并且与所述原稿图像相同分辨率的图像作为所述图章文字图像生成,并将使该生成的所述图章文字图像重叠到所述原稿图像中与所述图章位置信息对应的位置而成的图像作为所述已盖图章图像生成。
本发明的一方案的方案所涉及的文件管理系统,具备上述的图像读取装置、附信息图像数据存储部和检索服务器。所述附信息图像数据存储部存储通过所述附信息图像数据生成部被生成的附信息图像数据。所述检索服务器从被存储在所述附信息图像数据存储部的附信息图像数据中,检索将由用户指定的检索关键词包含在元信息中的附信息图像数据,所述文字图章输入信息为使图章文字信息与图章位置信息对应的信息,所述图章文字信息为表示所述图章文字的信息,所述图章位置信息为表示在所述原稿图像中使与所述图章文字对应的所述图章文字图像重叠的位置的信息,所述原稿文字信息为使字符串信息与字符串位置信息对应的信息,所述字符串信息表示所述原稿图像中包含的字符串,所述字符串位置信息表示在所述原稿图像中配置有所述字符串的位置,所述已盖图章图像生成部将表示与所述文字图章输入信息中包含的图章文字信息对应的图章文字并且与所述原稿图像相同分辨率的图像作为所述图章文字图像生成,并将使该生成的所述图章文字图像重叠到所述原稿图像中与所述图章位置信息对应的位置而成的图像作为所述已盖图章图像生成。
附图说明
图1是表示本发明所涉及的文件管理系统的一例的系统结构图。
图2是表示具备本发明所涉及的图像读取装置的复合机的一例的概要结构图。
图3是表示复合机的电气结构的一例的框图。
图4是表示生成附信息图像数据的动作的一例的流程图。
图5是表示文字图章功能的设定画面的一例的说明图。
图6是表示文字图章输入信息的一例的说明图。
图7是表示原稿图像的一例的说明图。
图8是表示原稿图像与提取用图像的关系的一例的说明图。
图9是表示提取用图像的一例的说明图。
图10是表示从提取用图像提取的与字符串有关的信息的一例的说明图。
图11是表示原稿文字信息的一例的说明图。
图12是表示已盖图章图像的一例的说明图。
图13是表示元信息的一例的说明图。
具体实施方式
下面,基于附图,说明本发明所涉及的实施方式。
图1是表示本发明所涉及的文件管理系统900的一例的系统结构图。
如图1所示,在LAN(LocalAreaNetwork)等的网络90,连接有本发明所涉及的图像读取装置的一例的复合机1、检索服务器2及个人计算机(以下简称PC)3。复合机1、检索服务器2及PC3经由网络90能够互相发送和接收各种数据。
复合机1进行通过后述的图像读取部5读取的原稿的图像的打印。另外,复合机1经由网络90接收由检索服务器2和PC3发送的图像数据,并基于接收到的图像数据进行图像的打印。
另外,复合机1将附信息图像数据经由网络90发送到检索服务器2,所述附信息图像数据为通过后述的附信息图像数据生成部84生成的、以图像和作为该图像中包含的与字符串有关的信息的元信息为一组的数据。
检索服务器2将接收到的附信息图像数据存储在检索服务器2中具备的附信息图像数据存储部21。
若检索服务器2经由网络90接收由用户对复合机1及个人计算机3的操作指定的检索关键词,则从存储在附信息图像数据存储部21的附信息图像数据中,检索将接收到的检索关键词包含在元信息的附信息图像数据。
于是,检索服务器2朝向检索关键词的发送源回复将作为检索结果的检索关键词包含在元信息的附信息图像数据。
如此,构成具备复合机1、检索服务器2和PC3的文件管理系统900。
此外,文件管理系统900的结构并不限定于此,还可以是不具备PC3的简化的结构。
下面,对复合机1进行详细说明。
图2是表示具备本发明所涉及的图像读取装置的复合机1的一例的概要结构图。
图3是表示复合机1的电气结构的一例的框图。
如图2所示,复合机1具备主体部10、图像读取部5和原稿供给部6。
在复合机1的前面部具备操作面板部7。
操作板部7具备显示部73和操作键部76。
主体部10具备网络通信部9和管理装置整体的动作控制的控制部8。
图像形成部4具备纸张运送部41、光扫描装置42、感光鼓43、显影部44、转印部45和定影部46。
网络通信部9为用于在连接于网络90的检索服务器2和PC3之间发送和接收各种数据的通信接口电路。
控制部8由CPU(CentralProcessingUnit)、ROM(ReadOnlyMemory)和RAM(RandomAccessMemory)等的存储器、作为构成为能够高速处理图像处理等的规定的处理的专用硬件的ASIC(ApplicationSpecificIntegratedCircuits)及具备这些的外围电路等的微型计算机(计算机)构成。
控制部8通过由CPU执行存储在ROM等的控制程序,执行各种处理,并控制复合机1内各部的动作。
由此,控制部8分别执行复合机1具备的多个功能。
在本实施方式中,控制部8作为执行多个功能的处理部,特别是构成文字图章输入信息接受部81、原稿文字信息提取部82、已盖图章图像生成部83及附信息图像数据生成部84。
下面,通过文字图章输入信息接受部81、原稿文字信息提取部82、已盖图章图像生成部83及附信息图像数据生成部84,对生成附信息图像数据的操作进行说明。在该说明中,对各处理部进行详细说明。图4是表示生成附信息图像数据的操作的一例的流程图。
如图4所示,首先,文字图章输入信息接受部81通过执行步骤S1至步骤S3,接受文字图章输入信息L的输入,所述文字图章输入信息L为作为在原稿图像DB上作为图像重叠的文字的、与图章文字CS有关的信息。
具体来讲,当用户操作操作面板部7(图3),选择图章功能时,显示图5所示的画面。在此,控制部8作为图章文字CS的选择项目,将“机密”、“加急”及“复制”等的选择菜单显示在显示部7中。于是,当用户选择“机密”的选择菜单时,文字图章输入信息接受部81将由文本数据表示的“机密”的文字信息作为表示图章文字CS的信息的图章文字信息LS接受(步骤S1)。此外,与各选择菜单对应的文本数据预先存储在ROM等中。
接着,控制部8将选择菜单显示在显示部73中,所述选择菜单表示作为使文字图像DS重叠到原稿图像DB时的位置预先规定的“左上”、“右上”、“左下”及“右下”等的多个位置,所述文字图像DS为在步骤S1接受的与图章文字信息LS对应的图章文字CS的图像。(参照图5的“位置”下的键显示)于是,当用户选择“右下”的选择菜单时,文字图章输入信息接受部81将显示“右下”的位置的信息作为图章位置信息LP接受,所述图章位置信息LP为表示原稿图像DB中使图章文字图像DS重叠的位置的信息(步骤S2)。
图6是表示文字图章输入信息L的一例的说明图。而且,如图6所示,文字图章输入信息接受部81生成作为使图章文字信息LS与图章位置信息LP对应的信息的文字图章输入信息L,并存储在RAM中,所述图章文字信息LS为表示在步骤S1接受的图章文字CS的信息,所述图章位置信息LP为表示在步骤S2接受的原稿图像DB中使图章文字图像DS重叠的位置的信息(步骤3)。
而且,当用户按下操作面板部7(图3)具备的开始键,输入附信息图像数据的发送功能的开始指示时,控制部8接受该输入,开始生成附信息图像数据的操作。
若开始生成附信息图像数据的操作,则控制部8通过图像读取部5读取原稿的图像,生成表示作为被读取的图像的原稿图像DB的图像数据(步骤4)。
在此,对下面的说明中作为具体例而使用的原稿图像DB进行说明。图7是表示原稿图像DB的一例的说明图。如图7所示,在原稿图像DB中,在通过左上角的像素的坐标S1和右下角的像素的坐标E1确定的矩形区域中,包含有被记载为“ABC…EFG”的字符串C1。另外,在原稿图像DB中,在通过左上角的像素的坐标S2和右下角的像素的坐标E2确定的矩形区域中,包含有被记载为“HIJ…LMN.”的字符串C2。另外,在原稿图像DB中,在通过左上角的像素的坐标S3和右下角的像素的坐标E3确定的矩形区域中,包含有被记载为“OPQ…XYZ.”的字符串C3。此外,在原稿图像DB还包含有符号G1所表示的图像。
接着,返回图4,原稿文字信息提取部82通过执行OCR(OpticalCharacterRecognition,光学字符识别)等公知的文字识别处理,提取在步骤S4生成的通过图像数据表示的原稿图像DB中包含的与字符串有关的信息(步骤S5)。
具体来讲,在步骤S5中,原稿文字信息提取部82将在步骤S4生成的通过图像数据表示的原稿图像DB的分辨率变换为预先规定的分辩率,使得能够提高原稿图像DB中包含的与字符串有关的信息的提取精度。
由此,原稿文字信息提取部82将原稿图像变换为提取用图像DT,所述提取用图像DT为所述预先规定的分辨率的图像。
图8是表示原稿图像DB与提取用图像DT的关系的一例的说明图。如图8所示,原稿文字信息提取部82将在步骤S4生成的且通过在水平方向上的Wb个像素与垂直方向上的Hb个像素表示的分辨率的原稿图像DB,变换为通过预先规定的在水平方向上的Wt个像素与垂直方向上的Ht个像素表示的分辨率的提取用图像DT,使得能够提高原稿图像DB中包含的与字符串有关的信息的提取精度。
此外,在图8中,为说明的方便,使原稿图像DB的大小与提取用图像DT的大小不同地图示。
下面,将在水平方向上从左第X个且在垂直方向上从上第Y个的像素的坐标表示为(X,Y)。即,与提取用图像DT中的坐标(Xt,Yt)对应的原稿图像DB中的坐标(Xb,Yb),能够使用提取用图像DT的水平方向的像素数Wt及垂直方向的像素数Ht和提取用图像DT中的坐标(Xt,Yt),通过下面的式(1)、(2)算出。
Xb=Xt*Wb/Wt…(1)
Yb=Yt*Hb/Ht…(2)
此外,“*”表示乘法运算(乘法),“/”表示除法运算(除法)。即,原稿图像DB的坐标位置和提取用图像DT的坐标位置通过式(1)、(2)对应。
接着,原稿文字信息提取部82对提取用图像DT执行OCR等公知的文字识别处理,提取提取用图像DT中包含的与字符串有关的信息。
图9是表示提取用图像DT的一例的说明图。图10是表示从提取用图像DT提取的与字符串有关的信息的一例的说明图。如图9所示,原稿文字信息提取部82对提取用图像DT执行文字识别处理,并识别通过左上角的坐标(SXt1,SYt1)和右下角的坐标(EXt1,EYt1)确定的在矩形区域被记载为“ABC…EFG”的字符串Ct1的存在。而且,如图10所示,原稿文字信息提取部82使表示字符串Ct1的信息与表示确定配置有字符串Ct1的区域的左上角的坐标(SXt1,SYt1)和右下角的坐标(EXt1,EYt1)的信息对应,并存储在RAM中。
与此相同,原稿文字信息提取部82使表示被记载为“这次是……”的字符串Ct2的信息与表示确定配置有字符串Ct2的区域的左上角的坐标(SXt2,SYt2)和右下角的坐标(Ext2,EYt2)的信息对应,并存储在RAM中。另外,原稿文字信息提取部82使表示被记载为“如右图所示,……”的字符串Ct3的信息与表示确定配置有字符串Ct3的区域的左上角的坐标(SXt3,SYt3)和右下角的坐标(Ext3,EYt3)的信息对应,并存储在RAM中。
而且,原稿文字信息提取部82将存储在RAM中的表示提取用图像DT中包含的字符串Ct1至Ct3的信息作为文本数据获取,并设为字符串信息MS,所述字符串信息MS为原稿图像DB中包含的表示字符串C1至C3的信息。
另外,原稿文字信息提取部82获取存储在RAM中的表示确定提取用图像DT中字符串Ct1至Ct3各自配置的区域的左上角的坐标和右下角的坐标的信息,并使用上述式(1)、(2),将获取的信息表示的坐标分别变换为与原稿图像DB对应的坐标。而且,原稿文字信息提取部82将表示该变更后的坐标的信息设为位置信息MP,所述位置信息MP表示原稿图像DB中包含的字符串C1至C3各自配置的位置。
具体来讲,原稿文字信息提取部82使用上述的式(1),将确定提取用图像DT中配置有字符串Ct1的区域的左上角的坐标(SXt1、SYt1)变换为原稿图像DB中的坐标(SXt1*Wb/Wt,SYt1*Hb/Ht)。然后,将该变换后的坐标设为原稿图像DB中配置有字符串C1的区域的左上角的坐标S1(图7)。另外,原稿文字信息提取部82使用上述的式(2),将确定提取用图像DT中配置有字符串Ct1的区域的右下角的坐标(EXt1、EYt1)变换为原稿图像DB中的坐标(EXt1*Wb/Wt,EYt1*Hb/Ht)。然后,将该变换后的坐标设为原稿图像DB中配置有字符串C1的区域的右下角的坐标E1。此外,Wb表示原稿图像DB的水平方向的像素数,Wt表示提取用图像DT的水平方向的像素数。另外,Hb表示原稿图像DB的垂直方向的像素数,Ht表示提取用图像DT的垂直方向的像素数。
与此相同,原稿文字信息提取部82将确定配置有字符串Ct2的区域的左上角的坐标(SXt2、SYt2)变换为原稿图像DB中的坐标(SXt2*Wb/Wt,SYt2*Hb/Ht),将右下角的坐标(EXt2、EYt2)变换为原稿图像DB中的坐标(Ext2*Wb/Wt,EYt2*Hb/Ht)。
而且,原稿文字信息提取部82将该变换后的坐标设为原稿图像DB中配置有字符串C2的区域的左上角的坐标S2和右下角的坐标E2(图7)。
另外,原稿文字信息提取部82将确定配置有字符串Ct3的区域的左上角的坐标(SXt3、SYt3)变换为与原稿图像DB对应的坐标(SXt3*Wb/Wt,SYt3*Hb/Ht),将右下角的坐标(EXt3、EYt3)变换为坐标(EXt3*Wb/Wt,EYt3*Hb/Ht)。
而且,原稿文字信息提取部82将该变换后的坐标设为原稿图像DB中配置有字符串C3的区域的左上角的坐标S3和右下角的坐标E3(图7)。
如此,在步骤S5中,原稿文字信息提取部82从原稿图像DB提取字符串信息MS和位置信息MP,所述字符串信息MS为表示原稿图像DB中包含的字符串C1至C3的信息,所述位置信息MP表示原稿图像DB中包含的配置有字符串C1至C3的位置。
图11是表示原稿文字信息M的一例的说明图。而且,如图11所示,原稿文字信息提取部82生成原稿文字信息M并存储在RAM中,所述原稿文字信息M为使字符串信息MS和位置信息MP对应的信息,其中所述字符串信息MS为表示在步骤S5提取的原稿图像DB中包含的字符串C1至C3的信息,所述位置信息MP表示原稿图像DB中包含的配置有字符串C1至C3的位置(步骤6)。
返回图4,已盖图章图像生成部83生成图章文字图像DS,所述图章文字图像DS为表示与在步骤S1接受的图章文字信息LS对应的图章文字CS(图6中的“机密”)的、与原稿图像DB相同的分辨率的图像。然后,已盖图章图像生成部83将生成的图章文字图像DS重叠到原稿图像DB中与在步骤S1接受的图章位置信息LP对应的位置(图6中的“右下”)。由此,已盖图章图像生成部83生成已盖图章图像DA,所述已盖图章图像DA为在原稿图像DB重叠有表示图章文字CS的图章文字图像DS的图像(步骤S7)。
图12是表示已盖图章图像DA的一例的说明图。具体来讲,如图12所示,在步骤S7中,已盖图章图像生成部83在与图章位置信息LP对应的位置表示原稿图像DB中的“右下”的位置时,通过将图章文字图像DS与原稿图像DB重叠,生成已盖图章图像DA,使得生成的图章文字图像DS的右下角的像素的坐标Z4与原稿图像DB的右下角的像素的坐标Q4重叠。此外,所谓右下角的像素表示作为水平方向的结尾的像素的、垂直方向的结尾的像素。
同样,在步骤S7中,已盖图章图像生成部83在与图章位置信息LP对应的位置表示原稿图像DB中的“左上”的位置时,将图章文字图像DS与原稿图像DB重叠,使得生成的图章文字图像DS的左上角的像素的坐标Z1与原稿图像DB的左上角的像素的坐标Q1重叠。此外,所谓左上角的像素表示作为水平方向的起始的像素的、垂直方向的起始的像素。
另外,在步骤S7中,已盖图章图像生成部83在与图章位置信息LP对应的位置表示原稿图像DB中的“右上”的位置时,将图章文字图像DS与原稿图像DB重叠,使得生成的图章文字图像DS的右上角的像素的坐标Z2与原稿图像DB的右上角的像素的坐标Q2重叠。此外,所谓右上角的像素表示作为水平方向的结尾的像素的、垂直方向的起始的像素。
另外,在步骤S7中,已盖图章图像生成部83在与图章位置信息LP对应的位置表示原稿图像DB中的“左下”的位置时,将图章文字图像DS与原稿图像DB重叠,使得生成的图章文字图像DS的左下角的像素的坐标Z3与原稿图像DB的左下角的像素的坐标Q3重叠。此外,所谓左下角的像素表示作为水平方向的起始的像素的、表示垂直方向的结尾的像素。
返回图4,附信息图像数据生成部84将在步骤S3生成的文字图章输入信息L(图6)附加到在步骤S6中通过原稿文字信息提取部82生成的原稿文字信息M(图11),并生成元信息N(步骤S8)。
图13是表示元信息N的一例的说明图。如图13所示,在图章位置信息LP(图6)为表示在原稿图像DB中的“右下”的位置的信息的情况下,附信息图像数据生成部84将图章位置信息LP变换为表示确定图章文字图像DS在原稿图像DB中重叠的区域的左上角的坐标Z1(图12)和右下角的坐标Z4(图12)的信息。具体来讲,当设为图章文字图像DS的水平方向的像素数Wd及垂直方向的像素数Hd时,且设为原稿图像DB的水平方向的像素数Wb及垂直方向的像素数Hb时,坐标Z1由(Wb-Wd+1,Hb-Hd+1)表示,坐标Z4由(Wb,Hb)表示。
同样,在图章位置信息LP为表示在原稿图像DB中的“左上”的位置的信息的情况下,附信息图像数据生成部84将图章位置信息LP变换为表示确定图章文字图像DS在原稿图像DB中重叠的区域的左上角的坐标(1,1)和右下角的坐标(Wd,Hd)的信息。另外,在图章位置信息LP为表示在原稿图像DB中的“右上”的位置的信息的情况下,附信息图像数据生成部84将图章位置信息LP变换为表示确定图章文字图像DS在原稿图像DB中重叠的区域的左上角的坐标(Wb-Wd+1,1)和右下角的坐标(Wd,Hd)的信息。另外,在图章位置信息LP为表示在原稿图像DB中的“左下”的位置的信息的情况下,附信息图像数据生成部84将图章位置信息LP变换为表示确定图章文字图像DS在原稿图像DB中重叠的区域的左上角的坐标(1,Hb-Hd+1)和右下角的坐标(Wd,Hd)的信息。
此外,附信息图像数据生成部84代替将上述的图章位置信息LP变换为表示在原稿图像DB中的坐标的信息,还可以将图章位置信息LP变换为表示在原稿图像DB中的预先规定的位置(例如,“右下”)的文本数据。
而且,附信息图像数据生成部84生成元信息N,所述元信息N为将图章位置信息LP附加到在步骤S6中通过原稿文字信息提取部82生成的、原稿图像DB中包含的与字符串C1至C3有关的信息的原稿文字信息M(图11)。
返回图4,附信息图像数据生成部84生成附信息图像数据,所述附信息图像数据为将在步骤8中生成的元信息N与在步骤S7中通过已盖图章图像生成部83生成的已盖图章图像DA为一组的数据(步骤9)。
具体来讲,在步骤S9中,附信息图像数据生成部84生成表示与元信息N中包含的原稿文字信息M对应的字符串C1至C3的文本数据(所谓透明文本),和表示与元信息N中包含的文字图章输入信息L对应的图章文字CS的文本数据(所谓透明文本)。而且,附信息图像数据生成部84通过将生成的文本数据与已盖图章图像DA重合,将元信息N与已盖图章图像DA为一组的所谓能够检索的PDF格式的数据作为附信息图像数据生成。
然后,附信息图像数据生成部84通过网络通信部9将在步骤S9中生成的附信息图像数据发送到与网络90连接的检索服务器2(步骤S10)。
即,通过图像读取部5及控制部8,构成本发明所涉及的图像读取装置的一例。
根据上述实施方式的结构,在附信息图像数据中包含的元信息N中包含原稿文字信息M和文字图章输入信息L,原稿文字信息M为原稿信息图像DB中包含的与字符串有关的信息,文字图章输入信息L是通过文字图章输入信息接受部81接受的。从而,即使不通过OCR等文字识别处理提取已盖图章图像DA中包含的字符串,也可以在元信息N中包含输入的文字图章输入信息L,即,与输入的图章文字CS有关的信息。为此,在从已盖图章图像DA提取与字符串有关的信息的情况下,回避无法提取与图章文字CS有关的信息的危险,能够可靠地输出包含与图章文字CS有关的信息的附信息图像数据。
另外,根据上述实施方式的结构,在附信息图像数据中包含的元信息N(图13)中,作为原稿文字信息M包含字符串信息MS和位置信息MP,所述字符串信息MS表示原稿图像DB中包含的字符串,所述位置信息MP表示在原稿图像DB中配置有所述字符串的位置。另外,在元信息N中,作为文字图章输入信息L(图6)包含图章文字信息LS和图章位置信息LP,所述图章文字信息LS为表示图章文字CS的信息,所述图章位置信息LP为表示在原稿图像DB中使与图章文字CS对应的图章文字图像DS重叠的位置的信息。
为此,使用附信息图像数据中包含的元信息N(图13),能够掌握原稿图像DB中包含的字符串和图章文字CS。进一步,使用附信息图像数据中包含的元信息N,能够掌握原稿图像DB中包含的字符串及图章文字CS分别配置在原稿图像DB中的哪个位置。另外,由于图章文字图像DS为与原稿图像DB相同的分辨率,因此能够易于重叠到通过图章位置信息LP表示的原稿图像DB中的位置。
另外,根据上述实施方式的结构,使用预先规定的分辨率的提取用图像DT,能够以良好的精度提取表示提取用图像DT中包含的字符串的信息(图10)和表示在提取用图像DT中提取的字符串存在的位置的信息(图10),使得能够提高原稿文字信息M的提取精度。即,通过使用该提取的信息生成原稿文字信息M(步骤S6),能够提高从原稿图像DB提取原稿文字信息M的精度。
另外,根据上述实施方式的结构,由于附信息图像数据为以元信息N与已盖图章图像DA为一组的所谓能够检索的PDF格式的数据,因此在安装有各种操作系统(OS)的多种计算机中,使用能够利用能够检索的PDF格式的数据的软件,能够以相同布局显示已盖图章图像DA。另外,能够检索通过重合在已盖图章图像DA中的数据显示的文字。
另外,根据上述实施方式的结构,通过将表示“严守机密”等的机密信息的文字指定为检索关键词,能够使检索服务器2检索附信息图像数据,所述附信息图像数据包含重叠有与图章文字CS对应的图章文字图像DS的已盖图章图像DA,其中将表示“严守机密”等的机密信息的文字作为图章文字CS。即,能够将通过图章文字图像DS表示的图章文字CS指定为检索关键词,并能够提高已盖图章图像DA的便利性。
此外,在上述实施方式中图1至图13所表示的结构仅为一例,并不意图将本发明限定于该实施方式。
例如,还可以以不执行步骤S10的方式简化而构成。同时,还可以构成为将通过附信息图像数据生成部84生成的附信息图像数据存储在复合机1的RAM中,从而只在复合机1中能够利用附信息图像数据。
另外,在步骤S9中通过附信息图像数据生成部84生成的附信息图像数据的格式,设为以元信息N与已盖图章图像DA为一组的所谓能够检索的PDF格式,但并不意图限定于此。附信息图像数据生成部84还可以针对一个数据文件登载表示元信息N的字符串和已盖图章图像DA,并将其作为附信息图像数据生成。
另外,在步骤S7中,已盖图章图像生成部83生成与原稿图像DB相同分辨率的图章文字图像DS,并将生成的图章文字图像DS重叠到原稿图像DB中与图章位置信息LP对应的位置(例如,在图6中的“右下”),从而生成已盖图章图像DA。
然而,代替此,在步骤S7中,已盖图章图像生成部83还可以构成为在生成与原稿图像DB相同分辨率的图章文字图像DS后,将其变换为临时图章文字图像,所述临时图章文字图像为与在步骤S5通过原稿文字信息提取部82使用的提取用图像DT相同分辨率的图像。而且,已盖图章图像生成部83还可以构成为将临时图章文字图像重叠到提取用图像DT中与图章位置信息LP对应的位置(在图章位置信息LP为表示原稿图像DB中的“右下”的位置的信息的情况下,提取用图像DT的右下角的像素与临时图章文字图像的右下角的像素重叠的位置),生成重叠有临时图章文字图像的提取用图像DT。而且,已盖图章图像生成部83还可以构成为通过将重叠有该生成的临时图章文字图像的提取用图像DT变换为与原稿图像DB相同分辨率的图像,生成已盖图章图像DA。
另外,在步骤S5中,原稿文字信息提取部82将在步骤S4生成的原稿图像DB变换为提取用图像DT,并对提取用图像DT执行文字识别处理,提取提取用图像DT中包含的与字符串有关的信息(图10)。然而,代替此,还可以构成为在步骤S5中原稿文字信息提取部82不将原稿图像DB变换为提取用图像DT,而是对原稿图像DB执行文字识别处理,从而直接提取字符串信息MS和位置信息MP,所述字符串信息MS表示原稿图像DB中包含的字符串,所述位置信息MP由确定该字符串在原稿图像DB中配置的区域的左上角的坐标和右下角的坐标构成。
另外,在上述结构中,文字图章输入信息L作为使图章文字信息LS和图章位置信息LP对应的信息而构成,但代替此,还可以是,仅由图章文字信息LS构成文字图章输入信息L。但是,同时,需要按照原稿图像DB的分辨率固定地预先规定使图章文字图像DS重叠到原稿图像DB的位置。
另外,原稿文字信息M作为使字符串信息MS和位置信息MP对应的信息而构成,所述字符串信息MS表示原稿图像DB中包含的字符串,所述位置信息MP表示在原稿图像DB中配置有所述字符串的位置,但代替此,还可以是,仅由表示在原稿图像DB中包含的字符串的字符串信息MS构成。
另外,在上述的结构中,对本发明所涉及的图像读取装置适用于复合机1的例进行了说明,但并不限于此,还可以适用于复印机或扫描装置等。
Claims (6)
1.一种图像读取装置,具有:
图像读取部,读取原稿的图像;
文字图章输入信息接受部,接受文字图章输入信息的输入,所述文字图章输入信息为与图章文字有关的信息,所述图章文字为作为图像重叠到原稿图像的文字,所述原稿图像为通过所述图像读取部读取的图像;
原稿文字信息提取部,提取原稿文字信息,所述原稿文字信息为与所述原稿图像中包含的字符串有关的信息;和
已盖图章图像生成部,生成图章文字图像,并通过将生成的图章文字图像重叠到所述原稿图像,从而生成已盖图章图像,所述图章文字图像为表示与通过所述文字图章输入信息接受部接受的文字图章输入信息对应的图章文字的图像,所述已盖图章图像为所述图章文字图像重叠到所述原稿图像而成的图像;
所述图像读取装置的特征在于,进一步具有:附信息图像数据生成部,生成附信息图像数据,所述附信息图像数据为以元信息与所述已盖图章图像为一组的数据,所述元信息为将通过所述文字图章输入信息接受部接受的文字图章输入信息附加到通过所述原稿文字信息提取部提取的原稿文字信息而成的信息,
所述文字图章输入信息为使图章文字信息与图章位置信息对应的信息,所述图章文字信息为表示所述图章文字的信息,所述图章位置信息为表示在所述原稿图像中使与所述图章文字对应的所述图章文字图像重叠的位置的信息,
所述原稿文字信息为使字符串信息与字符串位置信息对应的信息,所述字符串信息表示所述原稿图像中包含的字符串,所述字符串位置信息表示在所述原稿图像中配置有所述字符串的位置,
所述已盖图章图像生成部将表示与所述文字图章输入信息中包含的图章文字信息对应的图章文字并且与所述原稿图像相同分辨率的图像作为所述图章文字图像生成,并将使该生成的所述图章文字图像重叠到所述原稿图像中与所述图章位置信息对应的位置而成的图像作为所述已盖图章图像生成。
2.根据权利要求1所述的图像读取装置,其特征在于,
所述文字图章输入信息接受部通过表示是所述原稿图像中预先规定的多个位置中的哪个位置的信息的输入,接受所述图章位置信息的输入,
所述原稿文字信息提取部执行以下处理:
将所述原稿图像变换为提取用图像,所述提取用图像为以能够提高所述原稿文字信息的提取精度的方式预先规定的分辨率的图像;
从所述提取用图像提取字符串;
生成表示被提取的所述字符串的信息作为所述字符串信息;
将表示与提取所述字符串的所述提取用图像上的位置对应的所述原稿图像上的位置的信息作为所述字符串位置信息获取;和
使所述字符串信息与所述字符串位置信息对应,生成所述原稿文字信息。
3.根据权利要求1所述的图像读取装置,其特征在于,
所述附信息图像数据为通过使表示与所述元信息中包含的所述原稿文字信息对应的字符串的数据及表示与所述元信息中包含的所述文字图章输入信息对应的图章文字的数据重合到所述已盖图章图像而使所述元信息与所述已盖图章图像为一组的、能够检索的PDF格式的数据。
4.一种文件管理系统,其特征在于,具有:
图像读取部,读取原稿的图像;
文字图章输入信息接受部,接受文字图章输入信息的输入,所述文字图章输入信息为与图章文字有关的信息,所述图章文字为作为图像重叠到原稿图像的文字,所述原稿图像为通过所述图像读取部读取的图像;
原稿文字信息提取部,提取原稿文字信息,所述原稿文字信息为与所述原稿图像中包含的字符串有关的信息;
已盖图章图像生成部,生成图章文字图像,并通过将生成的图章文字图像重叠到所述原稿图像,从而生成已盖图章图像,所述图章文字图像为表示与通过所述文字图章输入信息接受部接受的文字图章输入信息对应的图章文字的图像,所述已盖图章图像为所述图章文字图像重叠到所述原稿图像而成的图像;
附信息图像数据生成部,生成附信息图像数据,所述附信息图像数据为以元信息与所述已盖图章图像为一组的数据,所述元信息为将通过所述文字图章输入信息接受部接受的文字图章输入信息附加到通过所述原稿文字信息提取部提取的原稿文字信息而成的信息;
附信息图像数据存储部,存储通过所述附信息图像数据生成部生成的附信息图像数据;和
检索服务器,从存储在所述附信息图像数据存储部的附信息图像数据中,检索将由用户指定的检索关键词包含在元信息中的附信息图像数据,
所述文字图章输入信息为使图章文字信息与图章位置信息对应的信息,所述图章文字信息为表示所述图章文字的信息,所述图章位置信息为表示在所述原稿图像中使与所述图章文字对应的所述图章文字图像重叠的位置的信息,
所述原稿文字信息为使字符串信息与字符串位置信息对应的信息,所述字符串信息表示所述原稿图像中包含的字符串,所述字符串位置信息表示在所述原稿图像中配置有所述字符串的位置,
所述已盖图章图像生成部将表示与所述文字图章输入信息中包含的图章文字信息对应的图章文字并且与所述原稿图像相同分辨率的图像作为所述图章文字图像生成,并将使该生成的所述图章文字图像重叠到所述原稿图像中与所述图章位置信息对应的位置而成的图像作为所述已盖图章图像生成。
5.根据权利要求4所述的文件管理系统,其特征在于,
所述文字图章输入信息接受部通过表示是所述原稿图像中预先规定的多个位置中的哪个位置的信息的输入,接受所述图章位置信息的输入,
所述原稿文字信息提取部执行以下处理:
将所述原稿图像变换为提取用图像,所述提取用图像为以能够提高所述原稿文字信息的提取精度的方式预先规定的分辨率的图像;
从所述提取用图像提取字符串;
生成表示被提取的所述字符串的信息作为所述字符串信息;
将表示与提取所述字符串的所述提取用图像上的位置对应的所述原稿图像上的位置的信息作为所述字符串位置信息获取;和
使所述字符串信息与所述字符串位置信息对应,生成所述原稿文字信息。
6.根据权利要求4所述的文件管理系统,其特征在于,
所述附信息图像数据为通过使表示与所述元信息中包含的所述原稿文字信息对应的字符串的数据及表示与所述元信息中包含的所述文字图章输入信息对应的图章文字的数据重合到所述已盖图章图像而使所述元信息与所述已盖图章图像为一组的、能够检索的PDF格式的数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012188478A JP5703270B2 (ja) | 2012-08-29 | 2012-08-29 | 画像読取装置、文書管理システム、及び画像読取制御プログラム |
JP2012-188478 | 2012-08-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103685834A CN103685834A (zh) | 2014-03-26 |
CN103685834B true CN103685834B (zh) | 2016-04-20 |
Family
ID=49080713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310336698.XA Expired - Fee Related CN103685834B (zh) | 2012-08-29 | 2013-08-05 | 图像读取装置及文件管理系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20140063564A1 (zh) |
EP (1) | EP2704413A3 (zh) |
JP (1) | JP5703270B2 (zh) |
CN (1) | CN103685834B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7337553B2 (ja) * | 2019-06-03 | 2023-09-04 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
CN111582085B (zh) * | 2020-04-26 | 2023-10-10 | 中国工商银行股份有限公司 | 单据拍摄图像识别方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102447806A (zh) * | 2010-09-27 | 2012-05-09 | 夏普株式会社 | 印刷系统、计算机、图像形成装置、以及印刷方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5903646A (en) * | 1994-09-02 | 1999-05-11 | Rackman; Michael I. | Access control system for litigation document production |
US6512856B1 (en) * | 1999-07-27 | 2003-01-28 | Hewlett-Packard Company | System and method for information stamping a digitized image |
JP2001213015A (ja) * | 2000-02-02 | 2001-08-07 | Fujitsu Ltd | 画像記録装置 |
US7327481B2 (en) * | 2001-05-30 | 2008-02-05 | Hewlett-Packard Development Company, L.P. | Open coventuring in a remote hardcopy proofing service, with preserved clientele, through interface sharing |
JP2006166091A (ja) * | 2004-12-08 | 2006-06-22 | Canon Inc | 文書処理装置、文書処理方法 |
JP4085337B2 (ja) * | 2006-02-13 | 2008-05-14 | コニカミノルタビジネステクノロジーズ株式会社 | 画像形成装置 |
US20100278453A1 (en) * | 2006-09-15 | 2010-11-04 | King Martin T | Capture and display of annotations in paper and electronic documents |
US20080162603A1 (en) * | 2006-12-28 | 2008-07-03 | Google Inc. | Document archiving system |
JP2008242820A (ja) * | 2007-03-27 | 2008-10-09 | Murata Mach Ltd | ドキュメント処理システム |
JP4983526B2 (ja) * | 2007-10-15 | 2012-07-25 | 富士ゼロックス株式会社 | データ処理装置及びデータ処理プログラム |
US8433708B2 (en) * | 2008-09-16 | 2013-04-30 | Kendyl A. Román | Methods and data structures for improved searchable formatted documents including citation and corpus generation |
JP4488101B2 (ja) * | 2008-09-19 | 2010-06-23 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、課金管理システム、課金管理方法並びに記録媒体 |
JP2010218098A (ja) * | 2009-03-16 | 2010-09-30 | Ricoh Co Ltd | 情報処理装置、情報処理方法、制御プログラム及び記録媒体 |
JP2011018201A (ja) * | 2009-07-09 | 2011-01-27 | Canon Inc | 文書生成装置 |
JP5751038B2 (ja) * | 2010-12-20 | 2015-07-22 | 株式会社リコー | 画像形成装置、画像形成方法、及び集積回路 |
-
2012
- 2012-08-29 JP JP2012188478A patent/JP5703270B2/ja not_active Expired - Fee Related
-
2013
- 2013-08-05 CN CN201310336698.XA patent/CN103685834B/zh not_active Expired - Fee Related
- 2013-08-28 EP EP13182020.1A patent/EP2704413A3/en not_active Withdrawn
- 2013-08-28 US US14/012,550 patent/US20140063564A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102447806A (zh) * | 2010-09-27 | 2012-05-09 | 夏普株式会社 | 印刷系统、计算机、图像形成装置、以及印刷方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2704413A3 (en) | 2017-03-15 |
CN103685834A (zh) | 2014-03-26 |
US20140063564A1 (en) | 2014-03-06 |
EP2704413A2 (en) | 2014-03-05 |
JP2014049782A (ja) | 2014-03-17 |
JP5703270B2 (ja) | 2015-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2264995B1 (en) | Image processing apparatus, image processing method, and computer program | |
US10528679B2 (en) | System and method for real time translation | |
JP5900803B2 (ja) | データ生成装置及びデータ生成プログラム並びにデータ生成方法 | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
KR20150086646A (ko) | 프리뷰 이미지를 제공하는 화상형성장치, 그 프리뷰 이미지를 디스플레이하는 디스플레이 장치 및 그 방법들 | |
US20110304872A1 (en) | Image forming apparatus and network system | |
JP2018129767A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
CN103685834B (zh) | 图像读取装置及文件管理系统 | |
JP2007096663A (ja) | 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2009140401A (ja) | データ処理システム、データ処理装置、データ処理方法、及びデータ処理プログラム | |
US10511733B2 (en) | Setting method and setting apparatus of image forming apparatus | |
JP2016096393A (ja) | 情報処理装置、システム、情報処理方法およびプログラム | |
JP2010039783A (ja) | 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム | |
JP2019004365A (ja) | 情報処理装置 | |
JP2012048637A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2015061259A (ja) | 画像処理装置、画像処理システム及び画面表示方法 | |
JP5423779B2 (ja) | 文書復元システム、画像形成装置、及びその制御方法、プログラム | |
JP2008176710A (ja) | 文書管理システム、文書管理装置および文書管理プログラム | |
JP2007088603A (ja) | 画像処理装置、画像システム及び画像処理方法 | |
JP2020205012A (ja) | 文書画像処理装置、情報処理方法及びプログラム | |
JP5993969B2 (ja) | 画像読取装置、文書管理システム、及び画像読取制御プログラム | |
JP5767574B2 (ja) | 画像処理装置及び画像処理システム | |
US20230224414A1 (en) | Server device and control method thereof | |
JP7302175B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP2016112756A (ja) | 印刷装置、制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160420 Termination date: 20210805 |