CN104954605A

CN104954605A - 图像形成装置、图像形成系统以及图像形成方法

Info

Publication number: CN104954605A
Application number: CN201510111871.5A
Authority: CN
Inventors: 原博幸
Original assignee: Kyocera Document Solutions Inc
Current assignee: Kyocera Document Solutions Inc
Priority date: 2014-03-31
Filing date: 2015-03-13
Publication date: 2015-09-30
Anticipated expiration: 2035-03-13
Also published as: EP2927843A1; CN104954605B; EP2927843B1; US20150278658A1; US9514394B2

Abstract

本发明提供图像形成装置、图像形成系统以及图像形成方法。本发明的图像形成装置包括：图像数据获取部、文字识别部、字体查询部、文字属性数据设定部。图像数据获取部获取用于执行光学文字识别(OCR)等的图像数据。文字识别部通过OCR从所获取的图像数据中识别文字。字体查询部对于图像数据的被识别为文字的区域，查询所识别出的文字符合多个字体及多个文字大小中的哪一个。文字属性数据设定部将查询出的字体及文字大小设定到文档数据中，并且以与图像数据相对应的方式设定描绘的原点、文字宽度以及侧架以作为文字的描绘位置。通过本发明，提供一种通过将查询出的字体及文字大小设定到文档数据中，并且对文字的描绘位置进行设定，从而能够生成与原来的原稿相同的文档数据的图像形成装置。

Description

图像形成装置、图像形成系统以及图像形成方法

技术领域

本发明涉及能够将图像数据变更为文档数据的图像形成装置、图像形成系统以及图像形成方法。

背景技术

以往，在能够对文档和图像进行打印的复合机(MFP，MultifunctionalPeripheral)等图像形成装置中，存在具备将由扫描仪等获取的图像数据转换为可移植文档格式(PDF，Portable Document Format)等的文档数据的功能的图像形成装置。

例如，已知有如下图像形成装置，该图像形成装置从图像数据中提取至少包含文字属性在内的属性数据，对于所提取出的属性数据中的文字属性，判定其对应于预先存储的文字字体中的哪一个，使用与被判定出的字体相对应的轮廓线来进行矢量化，对于除了文字属性之外的属性，取轮廓线作为线条画来进行矢量化，将经矢量化后的矢量化属性数据与图像数据一起发送到其他装置。

然而，由于所述图像形成装置仅仅是对文字进行矢量化，因此无法获取该文字的字体种类及文字大小等字体信息。

即，所述图像形成装置由于不知晓作为图像数据的基础的、在由文字自动处理机软件等生成时的字体信息，因此无法将图像数据转换为与原来的原稿相同的文档数据。

发明内容

本发明的能够将图像数据变更为文档数据的图像形成装置包括：文字识别部、字体查询部以及文字属性数据设定部。所述文字识别部从所述图像数据中识别文字。所述字体查询部对于所述图像数据的通过所述文字识别部被识别为文字的区域，查询所识别出的文字符合多个字体及多个文字大小中的哪一个。所述文字属性数据设定部将由所述字体查询部查询出的字体及文字大小设定到所述文档数据中，并且以与所述图像数据相对应的方式设定描绘的原点、文字宽度以及侧架以作为文字的描绘位置。

本发明的图像形成系统包括在图像形成装置中输入的图像数据以及将所述图像数据变更为文档数据的服务器。所述服务器包括：图像数据获取部、文字识别部、字体查询部以及文字属性数据设定部。所述图像数据获取部从所述图像形成装置中获取所述图像数据。所述文字识别部从通过所述图像数据获取部获取的图像数据中识别文字。所述字体查询部对于所述图像数据的通过所述文字识别部被识别为文字的区域，查询所识别出的文字符合多个字体及多个文字大小中的哪一个。所述文字属性数据设定部将由所述字体查询部查询出的字体及文字大小设定到所述文档数据中，并且以与所述图像数据相对应的方式设定描绘的原点、文字宽度以及侧架以作为文字的描绘位置。

本发明的图像形成方法由能够将图像数据变更为文档数据的图像形成装置执行，从所述图像数据中识别文字，对于所述图像数据的被识别为文字的区域，查询所识别出的文字符合多个字体及多个文字大小中的哪一个，将查询出的字体及文字大小设定到所述文档数据中，并且以与所述图像数据相对应的方式设定描绘的原点、文字宽度以及侧架以作为文字的描绘位置。

附图说明

图1是示出本发明的实施方式所涉及的图像形成系统的功能块的结构的图。

图2是示出所述图像形成系统的图像形成装置的功能块的结构的图。

图3是示出所述图像形成装置的内部结构的图。

图4是示出所述图像形成系统的服务器的功能块的结构的图。

图5是示出所述服务器的控制部及存储部的功能块的结构的图。

图6是本发明的实施方式所涉及的图像文件化处理的流程图。

图7是图6所示的文字识别处理的概念图。

图8是图6所示的文字大小推测处理及一致字体计算处理的概念图。

图9是图6所示的原点计算处理及文字描绘位置校正设定处理的概念图。

图10是图6所示的文字描绘位置校正设定处理所涉及的描绘数据的概念图。

图11是图6所示的同一文章设定处理的概念图。

具体实施方式

图1是示出本发明的实施方式所涉及的图像形成系统X的功能块的结构的图。图像形成系统X包括图像形成装置1以及服务器2。

图像形成装置1为具备扫描仪等的MFP等，并且对服务器2发送图像数据200(图5)。

服务器2为放置于数据中心等的PC/AT交换机等PC服务器或ARM(注册商标)服务器等信息处理装置。此外，服务器2还可以为用户的个人电脑(PC，Personal Computer)、智能手机、移动电话、个人数字助理(PDA，Personal DataAssistant)等终端，并且为执行所安装的服务器程序从而作为信息处理装置来发挥功能的结构。服务器2对于从图像形成装置1获取的图像数据，执行后述的图像文件化处理。

图像形成装置1及服务器2连接于网络5，所述网络5为局域网(LAN，Local Area Network)、无线LAN、广域网(WAN，Wide Area Network)、移动电话网等。

图2是示出图像形成系统X的图像形成装置1的功能块的结构的图。在图像形成装置1中，图像处理部11、原稿读取部12、原稿供给部13、运送部(供纸辊42b、运送辊对44、输出辊对45)、网络发送接收部15、操作面板部16、图像形成部17及存储部19等被连接于控制部10。各部通过控制部10来控制动作。

控制部10是通用处理器(GPP，General Purpose Processor)、中央处理器(CPU，Central Processing Unit)、微处理器(MPU，Micro Processing Unit)、数字信号处理器(DSP，Digital Signal Processor)、图形处理器(GPU，GraphicsProcessing Unit)、专用处理器(ASP，Application Specific Processor，面向特定用途的处理器)等。

控制部10读出在存储部19的ROM或HDD中存储的控制程序，通过使该控制程序在RAM中展开并执行，从而作为后述的功能块的各部来进行动作。此外，控制部10按照从未图示的外部终端或操作面板部16输入的规定的指示信息，对装置的整体进行控制。

图像处理部11是数字信号处理器(DSP，Digital Signal Processor)或图形处理器(GPU，Graphics Processing Unit)等的控制运算部。图像处理部11对各种图像的数据进行图像处理，例如，进行放大缩小、浓度调整、灰度调整、图像改善等各种图像处理。

图像处理部11将通过原稿读取部12读取到的图像作为打印数据存储到存储部19中。此时，图像处理部11也可以将打印数据转换为PDF或TIFF等格式的文件单位。

原稿读取部12对所放置的原稿进行读取。

原稿供给部13对通过原稿读取部12读取的原稿进行运送。

图像形成部17按照用户的输出指示，根据存储在存储部19中的、通过原稿读取部12读取的或者从外部终端获取的数据，进行向记录纸张的图像形成。

运送部从供纸盒42a(图3)中运送记录纸张，并使其在图像形成部17中进行图像形成，之后将其向堆叠托盘50运送。

另外，对于原稿读取部12、原稿供给部13、运送部以及图像形成部17的动作，将在后面进行说明。

网络发送接收部15包含用于连接到LAN、无线LAN、WAN、移动电话网等外部网络的LAN卡或无线发送接收机等。

网络发送接收部15在数据通信用线路中对数据进行发送接收，在语音电话线路中对语音信号进行发送接收。

网络发送接收部15可以经由网络连接到未图示的个人电脑(PC，PersonalComputer)或智能手机或个人数字助理(PDA，Personal Data Assistant)或移动电话等外部终端、服务器等。

操作面板部16包括：LCD等显示部；以及数字键、开始键、取消键、复印或FAX发送或扫描仪等动作模式的切换按钮、用于进行指示的按钮或触摸面板等输入部，其中，所述指示涉及与所选择的文档的打印或发送或保存或记录等有关的任务的执行。

操作面板部16获取用户对图像形成装置1的指示。根据该用户的指示，使后述的图像文件化处理开始执行。此外，还可以根据用户的指示，输入或变更各用户的信息。

此外，操作面板部16还可以具备用于连接USB存储器或闪存卡或外部设备等记录介质的连接部，所述记录介质存储有图像数据200(图5)。

存储部19是只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，Random Access Memory)等半导体存储器或硬盘驱动器(HDD，HardDisk Drive)等记录介质。

存储部19的RAM即使为省电状态，也会通过自刷新等功能来保持存储内容。

存储部19的ROM或HDD中存储有用于进行图像形成装置1的动作控制的控制程序。除此之外，存储部19还存储有用户的账户设定。此外，存储部19也可以包含有每个用户的保存文件夹的区域。

另外，在图像形成装置1中，还能够以GPU内置的CPU等或芯片模块封装的方式一体形成控制部10及图像处理部11。

此外，控制部10及图像处理部11也可以内置有RAM或ROM或闪存等。

此外，图像形成装置1还可以具备用于进行传真的发送接收的FAX发送接收部。

图3是示出所述图像形成装置1的内部结构的图。

原稿读取部12配设于主体部14的上部，原稿供给部13配设于原稿读取部12的上部。堆叠托盘50配设于在主体部14形成的记录纸张的输出口41侧，此外，操作面板部16配设于图像形成装置1的前侧。

原稿读取部12包括：扫描仪12a、稿台玻璃12b以及原稿读取窄缝12c。扫描仪12a由曝光灯以及电荷耦合器件(CCD，Charge Coupled Device)或互补金属氧化物半导体(CMOS，Complementary Metal Oxide Semiconductor)成像传感器等构成，并被构成为能够在原稿供给部13的原稿运送方向上移动。

稿台玻璃12b是由玻璃等透明部件构成的原稿台。原稿读取窄缝12c具有在与原稿供给部13的原稿运送方向相正交的方向上形成的窄缝。

当读取放置于稿台玻璃12b的原稿时，扫描仪12a被移动到与稿台玻璃12b相对置的位置，并一边对放置于稿台玻璃12b的原稿进行扫描一边读取原稿以获取图像数据200，并且将所获取的图像数据200输出到主体部14所具备的控制部10(图2)。

此外，当读取通过原稿供给部13被运送来的原稿时，扫描仪12a被移动到与原稿读取窄缝12c相对置的位置，并经由原稿读取窄缝12c，与原稿供给部13的原稿运送动作同步地读取原稿来获取图像数据200，并且将所获取的图像数据200输出到主体部14所具备的控制部10。

原稿供给部13包括：原稿放置部13a、原稿输出部13b以及原稿运送机构13c。放置于原稿放置部13a的原稿通过原稿运送机构13c被一张一张地依次导出，并被运送至与原稿读取窄缝12c相对置的位置，之后被输出到原稿输出部13b。

另外，原稿供给部13被构成为可倒式，通过将原稿供给部13抬向上方，从而能够使稿台玻璃12b的上表面被敞开。

主体部14包括图像形成部17，并且包括供纸部42、纸张运送通路43、运送辊对44以及输出辊对45。供纸部42包括：多个供纸盒42a，收纳尺寸或朝向各不相同的记录纸张；以及供纸辊42b，从供纸盒42a中将记录纸张一张一张地导出到纸张运送通路43。供纸辊42b、运送辊对44以及输出辊对45作为运送部来发挥功能。记录纸张通过该运送部被运送。

通过供纸辊42b被导出到纸张运送通路43的记录纸张通过运送辊对44被运送到图像形成部17。然后，通过图像形成部17被实施记录后的记录纸张通过输出辊对45被输出到堆叠托盘50。

图像形成部17包括：感光鼓17a、曝光部17b、显影部17c、转印部17d以及定影部17e。曝光部17b为具备激光装置、反射镜、透镜和LED阵列等的光学单元，对通过未图示的充电部被一次充电的感光鼓17a，根据图像数据输出光等并进行曝光，从而在感光鼓17a的表面形成静电潜像。显影部17c为使用调色剂对形成于感光鼓17a的静电潜像进行显影的显影单元，用于使基于静电潜像的调色剂图像形成在感光鼓17a上。转印部17d使通过显影部17c形成于感光鼓17a上的调色剂图像转印到记录纸张上。定影部17e对通过转印部17d转印有调色剂图像的记录纸张进行加热，用以使调色剂图像定影到记录纸张上。

图4是示出图像形成系统X的服务器2的功能块的结构的图。

服务器2包括：控制部20、网络发送接收部25以及存储部29。各部通过控制部20来进行动作控制。

控制部20具有作为GPP、CPU、MPU、DSP、图形处理器(GPU，GraphicsProcessing Unit)及ASP等的运送及控制能力。控制部20使用硬件资源来执行存储于存储部29的程序。

网络发送接收部25是用于连接到网络5的例如1000BASE-T/100BASE-TX等标准的LAN接口或无线LAN接口或移动电波发送接收设备等。服务器2能够经由网络发送接收部25对各种数据进行发送和接收。

另外，网络发送接收部25也可以连接到外部的集线器或路由器等，以连接到网络5。

存储部29包含RAM、固态硬盘(SSD，Solid State Drive)等闪存盘、硬盘驱动器(HDD，Hard Disk Drive)、磁带装置、光盘装置等。存储部29存储有用于使服务器2发挥功能的操作系统(OS，Operating System)和服务器的各种程序及数据。关于这些程序及数据的详细内容，将在后面进行描述。

图5是示出服务器2的控制部20及存储部29的功能块的结构的图。

服务器2的控制部20包括：图像数据获取部100、文字识别部110、字体查询部120、文字属性数据设定部130以及文字图像切换部140。

存储部29对图像数据200、文档数据210以及字体查询数据220进行存储。

网络发送接收部25接收图像数据200，并发送经转换后得到的文档数据210。

图像数据获取部100获取用于执行光学文字识别(OCR，Optical CharacterRecognition)等的图像数据200。

图像数据获取部100获取从图像形成装置1发送来的、经由网络5并由网络发送接受部25接收到的图像数据200，并存储于存储部29。

此时，图像数据获取部100可以根据用户的“网络扫描”等指示，使包含被打印的文字在内的原稿通过原稿读取部12被扫描，并作为图像数据200被发送到服务器2。

另外，图像数据获取部100也可以根据能够对图像形成装置1的操作面板部16进行操作的用户的指示，使通过原稿读取部12扫描得到的图像数据200或者文件夹中的图像数据200被发送到服务器2。

此外，图像数据获取部100还可以从所连接的记录介质或外部终端或者服务器等获取图像数据200。

文字识别部110对通过图像数据获取部100获取的图像数据200进行光学文字识别等来识别文字。

文字识别部110例如从图像数据200中识别出描绘有文字的区域301，并计算文字的线条画的矢量等，对于该矢量，利用人工神经网络等来辨别文字代码。在此基础上，文字识别部110将辨别出的文字代码作为文字属性数据211设定到文档数据210中。

此外，文字识别部110例如在进行光学文字识别时，还可以将在图像数据200内被识别为文字的区域301的坐标、文字的线条画的矢量等数据也存储到存储部29中。

字体查询部120对于图像数据200的通过文字识别部110被识别为文字的区域301，查询所识别出的文字符合字体查询数据220所包含的多个字体及多个文字大小中的哪一个。

字体查询部120例如对与通过文字识别部110输出的文字代码相对应的字体查询数据220的字体的描绘数据的描绘区域即“边界框”的大小进行计算，来推测文字大小。字体查询部120在推测出多个字体或文字大小时，对该字体及文字大小中的任意一方或者双方进行图像比较，通过计算类似度来进行查询。字体查询部120选择类似度最高的字体及文字大小。字体查询部120在该被选择出的字体及文字大小为规定的阈值以上的类似度时，判断为符合该字体及文字大小而被查询出。此外，字体查询部120在类似度低于规定的阈值时，判断为没有符合的字体及文字大小而未被查询出。

文字属性数据设定部130将由字体查询部120查询出的字体及文字大小设定到文档数据210中，还以与图像数据200相对应的方式设定文字的描绘位置。

文字属性数据设定部130例如对于文档数据210的文字属性数据211的各文字，设定为通过字体查询部120被判断为符合的字体及文字大小。此外，文字属性数据设定部130以该文字在被阅览或打印时成为与图像数据200相对应的描绘位置的方式进行设定。因此，文字属性数据设定部130以与图像数据200相对应的方式设定描绘的原点401(图8)、文字宽度404以及左侧架403以作为文字的描绘位置。另外，文字属性数据设定部130对于设定有右、上、下等侧架的文档数据210，也可以以与图像数据200相对应的方式进行设定。

此外，文字属性数据设定部130对应于与由字体查询部120查询出的文字相对应地计算出的原点401来计算下一个描绘出文字的第二原点402，当第二原点402与下一个文字的原点401一致时，作为同一文章321(图11)内的文字设定到文档数据210中。

据此，当文档数据210被阅览或者通过图像形成部17被输出时，在与图像数据大致相同的位置上描绘出文字。此外，能够对与作为图像数据200的来源的原稿相同的每一个句子统一文字，从而提高用户的便利性。

文字图像切换部140对于与图像数据200的区域301相对应的文档数据210的描绘位置，在通过字体查询部120被认为与字体查询数据220所包含的多个字体及多个文字大小中的任意一个均不符合而未被查询出时，将不包含文字的线条画或者图像的描绘数据设定到文档数据210中。

另外，文字图像切换部140在通过字体查询部120查询出符合字体查询数据220所包含的多个字体及多个文字大小中的任意一个时，可以直接将所识别出的文字的描绘数据作为文字属性数据211设定到文档数据210中。

图像数据200是包含文字的图像在内的数据，所述图像的分辨率是能够进行光学文字识别的分辨率。图像数据200例如还可以为通过原稿读取部12读取到并通过图像处理部11进行了图像处理的数据。

此外，图像数据200也可以为RGB彩色或CMYK彩色或单色或灰阶位图图像的文件、或者按扫描宽度或LZW等轻度压缩的文件等。

此外，图像数据200也可以是已通过服务器2的控制部20、图像形成装置1的控制部10或图像处理部11被转换为PDF或联合图像专家组(JPG，JointPhotographic Experts Group)或可移植的网络图像格式(PNG，Portable NetworkGraphics)或位图图像(BMP，Bitmap Image)或标记图像文件格式(TIFF，Tagged Image File Format)等形式的文件。

此外，图像数据200也可以为包含从存储部29的文件夹、所连接的记录介质、外部终端或其他服务器等获取的图像在内的JPG或PDF等图像文件。

此外，图像数据200为PDF时，还可以包含已经过文字识别而得到的文字属性数据211。

此外，图像数据200也可以为传真接收到的联合双态成像组(JBIG)等图像数据。

文档数据210是包含文字的文档用数据。

文档数据210例如还可以为与PDF、页面描述语言(PS，PostScript(注册商标))、图形描述语言(PDL，Page Description Language)等的电子文档或打印数据相接近的形式的文件。此外，文档数据210也可以为超文本标记语言(HTML，Hyper Text Markup Language)等超文本文件。此外，文档数据210还可以为文字自动处理机、表格计算软件、绘图软件等各种应用软件(以下称为应用)的文件。在这种情况下，文档数据210例如可以为“.docx(Microsoft(注册商标)Word(注册商标))”、“.xlsx(Microsoft(注册商标)Excel(注册商标))”、向量图形格式(SVG，Scalable Vector Graphics)的文件等。此外，文档数据210也可以为打印用的页面文件等。

另外，当文档数据210为PDF时，既可以包含文字属性数据211和图像数据200，也可以仅包含文字属性数据211。

此外，在本实施方式中，对文档数据210为PDF或PS时的例子进行说明。

文字属性数据211是文档数据210所包含的文字代码及文字属性的数据。

在图像数据200通过文字识别部110被进行文字识别而生成文档数据时，文字属性数据211也可以仅包含文字代码和文字的大致描绘位置的数据。

此外，文字属性数据211可以通过文字属性数据设定部130设定有各文字的字体及文字大小、文字的描绘位置等数据。文字属性数据211还可以设定有描绘的原点401(图8)、第二原点402、左侧架403以及文字宽度404等以作为文字的描绘位置的数据。此时，还可以设定有除了左侧架403之外的侧架(SideBearing)。此外，文字属性数据211还可以将作为文字集的文章321(图11)这样的文章的数据设定为边界框或字体框等。

此外，文字属性数据211在文档数据210为PS或PDF或PDL等时，还可以包含有字体词典数据的对象的数据。

字体查询数据220为用于以文字代码为检索键来对所述文字代码被描绘时的图像数据200进行查询的数据。

字体查询数据220例如可以包含每隔例如0.1点而生成的多个字体的各文字的位图数据以作为文字表格等。作为字体查询数据220的各字体，还可以包含标准PC、本公司制造的图像形成装置1的设备、印刷品所用的标准字体等。此外，作为字体查询数据220的文字大小，对应于图像数据200的点每英寸(dpi，dot perinch)等，例如，可以包含8点～96点等大小的数据。此外，字体查询数据220对于各字体的各文字大小，还可以包含有进行粗体、斜体、下划线、底纹等文字修饰时的数据。此外，字体查询数据220对于各字体、各文字大小，针对文字表格中的每一个文字，还可以包含有描绘出文字的边界框的坐标。

另外，字体查询数据220可以不是位图数据，而是多个字体的矢量(线条画)数据。在这种情况下，对于图像数据200的区域，可以分别描绘出变更文字大小后的位图并进行比较。

在此，服务器2的控制部20通过执行存储于存储部29的控制程序，从而作为图像数据获取部100、文字识别部110、字体查询部120、文字属性数据设定部130以及文字图像切换部140来发挥功能。

此外，上述服务器2的各部成为执行本发明的程序的硬件资源。

根据图6～图11，对本发明的实施方式所涉及的图像形成装置1执行的图像文件化处理进行说明。

在本实施方式的图像文件化处理中，首先，获取图像数据200，并执行光学文字识别，生成文档数据210。然后，根据通过该光学文字识别被输出的文字代码，对图像数据200的被识别为文字的区域301是以哪个字体的哪个文字大小输出的进行查询。对于能够查询出的文字的位置，校正文档数据210的文字的描绘位置，并写入与作为图像数据200的来源的文档相同的文字信息。此时，对描绘的原点、文字宽度以及侧架进行设定。对于无法查询出的文字的位置，将文档数据210的文字删除，置换为矢量的描绘数据。

本实施方式的图像文件化处理主要是控制部20与各部协作并使用硬件资源来执行存储在存储部29中的程序。

图6是本发明的实施方式所涉及的图像文件化处理的流程图。图7是图6所示的文字识别处理(S101)的概念图。图8是图6所示的文字大小推测处理(S102)及一致字体计算处理(S104)的概念图。图9是图6所示的原点计算处理(S106)及文字描绘位置校正设定处理(S107)的概念图。图10是图6所示的文字描绘位置校正设定处理(S107)所涉及的描绘数据的概念图。图11是图6所示的同一文章设定处理(S109)的概念图。

(步骤S100)

首先，控制部20作为图像数据获取部100来进行图像数据获取处理。

此外，控制部20经由网络发送接收部25从图像形成装置1等获取图像数据200，并存储于存储部29。

此外，控制部20还生成与图像数据200相对应的文档数据210的文件。在该时点，在文档数据210中，虽然还未设定有文字，但是可以复制有图像数据200所包含的图像。

另外，控制部20可以经由网络5将远程扫描的指令发送到图像形成装置1，使打印有文字的原稿通过原稿读取部12被扫描。在这种情况下，图像形成装置1的控制部10将扫描到的图像数据200发送给服务器2。此时，在书籍等双联页原稿的情况下，控制部10还可以执行使端部变形等处理。此外，控制部10还可以除去图像的污点、除去波纹、提高图像的清晰度、进行DPI转换的处理等。此外，控制部10对于这些图像处理，还可以通过图像处理部11的GPU等来高速化地执行。

此外，控制部20还可以从未图示的记录介质、外部终端或服务器等获取图像数据200，并存储于存储部29。

此外，控制部20还可以获取由图像形成装置1的未图示的FAX发送接收部接收到的图像数据200，并存储于存储部29。

此外，控制部20可以将所获取的图像数据200转换为特定形式的数据。

(步骤S101)

接着，控制部20作为文字识别部110来进行文字识别处理。

根据图7的(a)，控制部20对图像数据200内描绘有文字的位置进行检索，对于这个被检索出的位置，针对每一个文字进行文字识别。控制部20将所识别出的文字的文字描绘区域311这样的数据包含在文字属性数据211中，并设定到文档数据210中。

根据图7的(b)，文字描绘区域311设定有描绘位置，所述描绘位置为在文档数据210内以大致与图像数据200相同的位置阅览或打印的位置。文字描绘区域311例如在文档数据210为PS或PDF或PDL等情况下，可以被定义为字体框410的集合体，所述字体框410包含原点400与UTF8等编码形式的文字代码。

该时点下的文字描绘区域311也可以仅设定有各字体框410的原点400与缺省(既定)的字体。因此，如果对该时点的文字描绘区域311的描绘数据进行描绘，则成为与作为图像数据200的来源的原稿不同的描绘结果。

此外，控制部20还可以将所识别出的文字代码和图像数据200的被识别为文字的区域301的坐标作为临时数据存储在存储部29中。另外，控制部20还可以将文字识别时计算出的文字的矢量数据等也作为临时数据存储在存储部29中。

此外，控制部20还可以对除了文字之外的图形等进行识别。此外，当图像数据200中包含有已进行了文字识别而得到的文字属性数据211时，也可以跳过该文字识别处理。

(步骤S102)

接着，控制部20作为字体查询部120来进行文字大小推测处理。

根据图8的(a)，在本处理～步骤S104的一致字体计算处理中，控制部20对于经OCR处理的各文字，计算字体的种类及文字大小。此外，控制部20设定作为每个文字的描绘区域的边界框411、字体描绘的原点401、作为下一个文字的原点的第二原点402、作为文字描绘中的左侧留白的左侧架403、文字宽度404等描绘数据。此时，控制部20以成为与图像数据200一致的坐标的方式来计算原点401、文字宽度404以及左侧架403。为此，首先，在本处理中，控制部20对文字大小进行推测。

根据图8的(b)，控制部20对字体查询数据220之中的在上述文字识别处理中计算出的、图像数据200的被识别为文字的区域301的各文字的区域302的大小与各文字大小中的各字体的边界框的大小等进行比较来推测文字大小。控制部20在进行该比较时，考虑与边界框411相对应地实际描绘出文字的坐标的大小，来与区域302的大小进行比较。而且，此时，控制部20还对进行了文字修饰时的数据的边界框进行比较。此外，控制部20在比较时还可以参照图像数据200自身的大小、dpi、分辨率等信息。

控制部20经过比较将边界框的大小与区域302的大小一致者推测为字体种类和文字大小。此时，也可以推测出多个字体以及多个文字大小。控制部20将推测出的字体种类和文字大小临时存储于存储部29中。

另外，控制部20在进行检索时，对于通过上述文字识别处理计算出的文字描绘区域311的FontBBox信息等，也可以参照文字大小来进行比较。

(步骤S103)

接着，控制部20作为字体查询部120对是否推测出多个字体及多个文字大小进行判定。控制部20在上述文字大小推测处理中推测出多个字体种类或文字大小的情况下，判定为“是”。控制部20在除此之外的情况下，也就是仅推测出一个字体种类及文字大小相一致者或者没有相一致者的情况下，判定为“否”。

“是”的情况下，控制部20将处理推进到步骤S104。

“否”的情况下，控制部20将处理推进到步骤S105。

(步骤S104)

推测出多个字体种类或文字大小时，控制部20作为字体查询部120来进行一致字体计算处理。

根据图8的(c)，控制部20进行查询，所述查询是对多个字体种类或文字大小的各位图图像与区域302内的实际的文字图像进行比较来检索出最一致者。作为该比较，控制部20例如可以设定上下左右8～192点等的窗口，并使用动态编程等，对各像素的暗点的亮度的类似度进行计算。此时，控制部20可以计算出考虑了在打印出的原稿中具有文字轮廓变粗的倾向等打印条件之后的类似度，或者变更为黑白二值并使用位加法等来高速地计算出类似度。控制部20例如可以将这种类似度最高的图像选择为最接近的图像。此外，控制部20也可以计算出此时的窗口上的坐标。

控制部20将选择出的最接近的图像的字体、窗口上的坐标以及类似度等临时存储于存储部29中。

如此，通过仅在计算出多个字体种类或文字大小时，进行文字是否一致的比较，从而能够高速地进行字体及文字大小的检索。

(步骤S105)

在此，控制部20作为字体查询部120来判定查询是否成功。控制部20例如在上述的文字大小推测处理中仅推测出一个字体种类及文字大小相一致者时，或者，在上述的一致字体计算处理中类似度在规定的阈值以上时，判断为所识别出的文字符合字体查询数据220内的任意一个字体及文字大小，也就是查询成功，判定为“是”。控制部20在除此之外的情况下，例如，在文字大小推测处理中未计算出字体种类及文字大小相一致者时，或者，在一致字体计算处理中类似度小于规定的阈值时等，认为没有符合的字体及文字大小，也就是查询失败，判定为“否”。

“是”的情况下，控制部20将处理推进到步骤S106。

“否”的情况下，控制部20将处理推进到步骤S110。

(步骤S106)

在查询成功时，控制部20作为文字属性数据设定部130来进行原点计算处理。

根据图9，控制部20使用被推测出的字体及文字大小，来与区域302内的实际的文字图像进行比较，计算出最一致的坐标，并根据该坐标计算原点401。该比较例如可以设定上下左右8～192点等的窗口，并使用动态编程等，对各像素的暗点的亮度的类似度进行计算，计算出最一致的坐标。此时，控制部20可以与上述一致字体计算处理同样地，计算出考虑了打印条件之后的类似度，或者变更为黑白二值并使用位加法等来高速地计算出类似度。此外，控制部20此时还可以根据原点401来计算第二原点402(图8)。

另外，控制部20例如还可以根据上述查询处理的窗口上的坐标和图像数据200的被识别为文字的区域301的坐标，来计算出该文字的描绘位置。此外，控制部20还可以在该文字被描绘时，通过确认是否实际上与图像数据200的区域301的图像重叠来计算类似度。

(步骤S107)

接着，控制部20作为文字属性数据设定部130来进行文字描绘位置校正设定处理。

控制部20指定在上述原点计算处理中计算出的原点401，并指定在文字大小推测处理或一致字体计算处理中得到的字体和文字大小，并将文字属性数据211设定到文档数据210中。

此时，控制部20例如对文档数据210的字体及文字大小以及字体的描绘位置进行变更。控制部20在文档数据210为PS或PDF或PDL等时，将类似度为阈值以上的字体及文字大小登记到字体词典以作为文字属性数据211，并将描绘位置设定为“开始位置”这一信息。控制部20在此以与计算出的图像数据200上的正确的描绘位置相对应的方式，对文档数据210的文字属性数据211中的文字的描绘位置进行设定。控制部20例如将如图8的(a)所示的边界框411、字体描绘的原点401、作为下一个文字的原点的第二原点402、左侧架403、文字宽度404等描绘数据设定到文档数据210的文字属性数据211中。

图10示出将该描绘数据登记到PS的文档数据210的文字属性数据211的字体词典内的例子。

描绘数据501是例如指定“type3”为字体，并指定了字形坐标系和字体边界的例子。

描绘数据502是数组定义的例子，该数组将文字代码转换为文字名。在这个例子中，代码“80”被转换为“P”。

描绘数据503是保存字形描述(矢量化文字)用的词典的例子。

描绘数据504是表示指定字形生成步骤的代码的例子。在该代码中，示出了文字边界、字典的获取等。

描绘数据505是表示在文字描绘中所需要的字体词典获取、字体大小指定、位置指定、文字显示等的代码的例子。

(步骤S108)

接着，控制部20作为文字属性数据设定部130对是否存在原点401与第二原点402一致的文字进行判定。控制部20在设定于文档数据210的文字属性数据211内存在多个文字时，对于相邻的文字，辨别原点401和第二原点402之间的距离是否为规定的阈值以下。控制部20在存在这种阈值以下的文字对时，判定为“是”。也就是，控制部20在对应于与查询出的文字相对应地计算出的原点401来计算出的第二原点402与下一个文字的原点401一致的情况下，判定为“是”。在图11的例子中，由于“gakpylp”这些文字中的每一个文字的前一个文字的第二原点402与下一个文字的原点401一致，因此控制部20判定为“是”。控制部20在除此之外的情况下，判定为“否”。

“是”的情况下，控制部20将处理推进到步骤S109。

“否”的情况下，控制部20结束图像文件化处理。

(步骤S109)

对于在文字属性数据211内相邻的文字，当存在原点401与第二原点402一致的文字时，控制部20作为文字属性数据设定部130来进行同一文章设定处理。

根据图11，当前一个文字的第二原点402与下一个文字的原点401一致时，所述多个文字很可能是作为图像数据200的来源的原稿的同一文章内的文字。因此，在图11的例子中，控制部20在文字属性数据211中，将所述多个文字设定为同一文章321内的文字。

之后，控制部20结束图像文件化处理。

(步骤S110)

对于图像数据200的被识别为文字的区域，在字体及文字大小的查询不成功时，控制部20作为文字图像切换部140来进行文字图像切换处理。

控制部20对于图像数据200的被识别为文字的区域301，将文档数据210内的文字的信息删除，并置换为矢量(线条画)数据。该置换的矢量数据可以使用在上述文字识别处理中计算出的文字的线条画的矢量数据等。此外，控制部20也可以将区域301的图像直接输出到文档数据210中。

通过以上步骤，结束本发明的实施方式所涉及的图像文件化处理。

在以往的进行文字识别的装置中，当将图像数据转换为文档数据时，无法准确地设定文字的字体及文字大小。因此，无法将图像数据转换为与原来的原稿相同的文档数据。

对此，本发明的实施方式所涉及的服务器2被构成为能够将图像数据200变更为文档数据210，该服务器2包括：图像数据获取部100，获取图像数据200；文字识别部110，从通过图像数据获取部100获取的图像数据200中识别文字；字体查询部120，对于图像数据200的通过文字识别部110被识别为文字的区域301，查询所识别出的文字符合多个字体及多个文字大小中的哪一个；以及文字属性数据设定部130，将通过字体查询部120查询出的字体及文字大小设定到文档数据210中，并且以与图像数据200相对应的方式设定描绘的原点401、文字宽度404以及左侧架403以作为文字的描绘位置。

通过如此进行构成，从而能够还原出作为图像数据200的来源的原稿中所打印的文字的格式。据此，能够对从图像数据200中进行文字识别而得到的文档数据210进行转换以成为与各种应用的文件相同的文件。也就是，能够转换为与原来的原稿相同的文档数据210。

当在对应的应用中读入经如此转换后的文档数据210时，能够大致可靠地再现文字的字体种类、文字大小、粗体/斜体等文字修饰信息、文字的描绘位置等。因此，能够再现文档数据210的字体信息，从而能够在各种应用中容易地进行文字的修改等。据此，用户的便利性得到提高。

特别地，通过设定描绘的原点401、文字宽度404以及左侧架403，从而能够容易地将文字的位置设定到文档数据210中，还能够使描绘数据的结构简洁。因此，能够提高文档数据210的通用性。

此外，在背景技术中记载的已知的图像形成装置中，由于文档数据210中包含有以矢量描绘的数据，因此存在着无法在进行读入的应用中进行文字的修改等的问题。图像数据200的文字部分如果在文件内偏偏不作为文字信息存在，则无法还原出原来的文档。

对此，本实施方式的服务器2由于以由文字识别部110检测出的文字代码，与针对字体查询数据220中所包含的所有的字体及文字大小而设定的文字表格进行对照，因此能够大致可靠地提取出所生成的字体及文字大小。

此外，比较所检测出的文字的图像与图像数据200是否一致，将由文字识别部设定在文档数据210中的文字的描绘位置校正为准确的值。

通过如此进行构成，从而能够大致可靠地再现出作为原稿来源的文档。此外，该经转换后的文档数据210能够以成为与作为其来源的文档相同的状态的方式被打印。此时，在文档数据210中，由于文字的属性被设定在文字属性数据211中，因此来源于扫描的模糊或污点等会减少，从而能够进行高等级的打印。

此外，本发明的实施方式所涉及的服务器2的特征在于，文字属性数据设定部130对应于与由字体查询部120查询出的文字相对应地计算出的原点401来计算出下一个描绘出文字的第二原点402，当第二原点402与下一个文字的原点401一致时，作为同一文章321内的文字设定到文档数据210中。也就是，前一个文字的第二原点402和下一个文字的原点401之间的距离为规定值以下时，在文档数据210的文字属性数据211中设定其属于同一文章321。

通过如此进行构成，即使文字通过OCR等被识别为各自文章的一部分时，也能够重新结合为统一的文章。因此，易于从文档数据210中提取句子，用户的易用性更好。

此外，本发明的实施方式所涉及的服务器2的特征在于，包括：文字图像切换部140，对于与图像数据200的区域301相对应的文档数据210的描绘位置，当通过字体查询部120查询出符合多个字体及多个文字大小中的任意一个时，对所识别出的文字的描绘数据进行设定，而在未查询出的情况下，对不包含文字的线条画或者图像的描绘数据进行设定。

通过如此进行构成，从而能够检测出在文字识别中被误识别的位置。据此，通过将转换后的文档数据210所包含的被误识别的文字属性数据211删除，能够使用户易于对文档数据210进行编辑，提高用户的便利性。此外，对于例如公司的标识等被图案化的数据混杂在一起从而文字识别失败的位置等，能够删除文字而生成完美状态的文档数据210。

此外，即使在针对字体及文字大小查询失败时，对于文字的位置，通过设定矢量的描绘数据，也能够获取能够进行高等级打印的文档数据210。此外，即使在文章途中发生文字识别失败的情况下，也能够减少对该位置进行阅览或打印时的不协调感。

此外，在本实施方式中，当文档数据210为PDF时，对于在文字识别中生成的字体的边界框，以查询出的字体及文字大小来设定与字体有关的信息。

通过如此进行构成，能够使PDF所包含的文字属性数据211的字体或开始位置等信息准确，从而能够容易地从PDF中提取出样式对应的文字信息。而且，使从PDF向文字自动处理机或表格计算软件等应用的文件转换变得容易。

另外，在上述实施方式的字体查询处理的说明中，在推测文字大小之后再进行查询。

然而，控制部20还可以不先推测文字大小，而是以循环方式检索字体查询数据220的文字表格。此外，作为字体查询数据220，在仅存储有矢量数据的情况下，当将文字描绘为线性数据时，也可以通过计算与图像数据200的区域301一致的像素数的比例等来进行查询。此外，控制部20也可以使用GPU运算功能等来高速地进行查询。此外，控制部20还可以在进行查询时利用在上述文字识别处理中生成的文字的线条画的矢量等数据。

通过如此进行构成，从而能够削减存储部29的存储容量或者使查询高速化。

此外，在上述实施方式中，虽然对转换为PDF或PS的例子进行了说明，但是并不限于此，能够转换为各种文档格式。

此外，将图像文件转换为文字自动处理机的文档文件或表格计算软件的文件或者HTML文件等时，控制部20可以以页面为单位对修改后的文字描绘位置的信息进行计算，对于标准字体、换行、文字间隔、余白、页眉/页脚等的设定也进行计算，并设定到文档数据210中。据此，能够还原出与作为原稿来源的文件相同的页面设定等，易于对文档文件进行修改，从而能够提高用户的便利性。

此外，在上述的本实施方式中，当查询失败时，以从文档数据210中删除所对应的文字属性数据211的方式进行了记载，但是也可以将其保留下来。

此外，服务器2还可以具备：文字再识别部，对于通过字体查询部120未被查询为多个字体及多个文字大小中的任意一个的文字，指定与周围的被查询出的文字相同的字体或文字大小，并再次进行文字识别。通过如此进行构成，能够提高文字识别的精度。此外，即使是划有下划线的文字等在以往的文字识别方式中容易识别失败的位置，也能够可靠地进行文字识别。

此外，在上述实施方式中，以文字识别部110先将文字属性数据211输出到文档数据210中的方式进行了记载，但是并不限于此。也就是，还可以为如下结构，即文字识别部110将文字代码等作为临时数据输出到存储部29，文字属性数据设定部130将文字代码等设定到文档数据中。

通过如此进行构成，从而能够简化处理，并能够减少文档数据210的修改，使处理高速化。

此外，还可以在图像形成装置1中执行本实施方式的图像文件化处理。此外，还可以以如下方式构成，即对于图像文件化处理中的如文字识别处理、查询处理那样需要运算性能的处理，在服务器2中执行，而除此之外的处理在图像形成装置1中执行。此外，还可以从用户终端对这类处理进行指示，并在具备有多个GPU等的所谓的“云端”上的服务器2中执行。

通过如此进行构成，从而能够削减图像形成装置1的控制部10、图像处理部11以及存储部19的成本。而且，能够以短时间完成处理，并且减少功耗。

此外，本实施方式的图像文件化处理还能够应用在不使用图像形成装置1的系统中。也就是，还可以为使用网络扫描仪、以USB等另行连接有扫描仪的服务器2的结构。

此外，上述实施方式的结构以及动作均为示例，在不脱离本发明宗旨的范围内，可以适当地变更执行，这是不言而喻的。

Claims

1.一种图像形成装置，能够将图像数据变更为文档数据，所述图像形成装置包括：

文字识别部，从所述图像数据中识别文字；

字体查询部，对于所述图像数据的通过所述文字识别部被识别为文字的区域，查询所识别出的文字符合多个字体及多个文字大小中的哪一个；以及

文字属性数据设定部，将由所述字体查询部查询出的字体及文字大小设定到所述文档数据中，并且以与所述图像数据相对应的方式设定描绘的原点、文字宽度以及侧架以作为文字的描绘位置。

2.根据权利要求1所述的图像形成装置，

所述文字属性数据设定部进一步对应于与由所述字体查询部查询出的文字相对应地计算出的原点来计算下一个描绘出文字的第二原点，当所述第二原点与下一个文字的原点一致时，作为同一文章内的文字设定到所述文档数据中。

3.一种图像形成系统，具备在图像形成装置中输入的图像数据，以及将所述图像数据变更为文档数据的服务器，在所述图像形成系统中，

所述服务器包括：

图像数据获取部，从所述图像形成装置中获取所述图像数据；

文字识别部，从通过所述图像数据获取部获取的图像数据中识别文字；

4.根据权利要求3所述的图像形成系统，

5.一种图像形成方法，将图像数据变更为文档数据，在所述图像形成方法中，

从所述图像数据中识别文字，

对于所述图像数据的被识别为文字的区域，查询所识别出的文字符合多个字体及多个文字大小中的哪一个，

将查询出的字体及文字大小设定到所述文档数据中，并且以与所述图像数据相对应的方式设定描绘的原点、文字宽度以及侧架以作为文字的描绘位置。

6.根据权利要求5所述的图像形成方法，进一步地，

对应于与查询出的文字相对应地计算出的原点来计算下一个描绘出文字的第二原点，当所述第二原点与下一个文字的原点一致时，作为同一文章内的文字设定到所述文档数据中。