CN109922229B

CN109922229B - 图像形成装置

Info

Publication number: CN109922229B
Application number: CN201811147375.5A
Authority: CN
Inventors: 辻拓也
Original assignee: Kyocera Document Solutions Inc
Current assignee: Kyocera Document Solutions Inc
Priority date: 2017-12-13
Filing date: 2018-09-29
Publication date: 2021-05-25
Anticipated expiration: 2038-09-29
Also published as: US20190180096A1; US10726253B2; JP7114892B2; JP2019106028A; CN109922229A

Abstract

本发明提供一种图像形成装置。所述图像形成装置包括：图像读取部、存储部、图像处理部、欠缺检测部和文章修正部。所述图像读取部读取原稿图像。所述存储部存储登记有多个文字和多个单词的词典数据。所述图像处理部对所述原稿图像进行文字识别处理并取得文字数据。所述欠缺检测部基于所述词典数据检测所述文字数据中的欠缺部分。当在所述文字数据中存在所述欠缺部分时，所述文章修正部从所述词典数据提取针对所述欠缺部分的修正候选的文字或单词，并利用提取的文字或单词对所述欠缺部分进行修正。

Description

图像形成装置

技术领域

本发明涉及一种图像形成装置。

背景技术

在复印机等图像形成装置中，当在复印功能等中进行原稿图像的图像形成时，重要的是适当地从原稿读取原稿图像。与这样的原稿图像的读取有关的以往技术已被公众所知。

所述以往技术的图像读取控制装置从读取到的图像提取存在原稿的区域并检测该区域的倾斜。此外，该图像读取控制装置根据存在原稿的区域的倾斜，对该区域的倾斜进行修正，并且设定从图像切出的原稿的区域的切出宽度。由此，能够防止原稿的欠缺等，从而能够提高原稿图像的自动切出精度。

但是，在所述以往技术中存在如下的问题：在起因于例如原稿的倾斜等而在读取该原稿图像的时点在原稿的周向边缘部等存在欠缺的情况下，不能对该欠缺进行修正。由此，用户必须每次进行预览并实施原稿图像的确认，需要花费较多的时间。

发明内容

本发明的目的在于提供一种实现提高读取原稿图像时的操作性的图像形成装置。

本发明提供一种图像形成装置，其包括：图像读取部，读取原稿图像；存储部，存储登记有多个文字和多个单词的词典数据；图像处理部，对所述原稿图像进行文字识别处理并取得文字数据；欠缺检测部，基于所述词典数据，检测所述文字数据中的欠缺部分；以及文章修正部，当在所述文字数据中存在所述欠缺部分时，分析所述欠缺部分与所述欠缺部分前后的字符串的关系，从所述词典数据中提取针对所述欠缺部分的修正候选的文字或单词，并利用提取的所述修正候选的文字或单词对所述欠缺部分进行修正，所述文章修正部在上下文分析中对所述欠缺部分和前后的上下文的关系进行分析，所述文章修正部在使用预测分析中，通过累积至此为止对所述原稿图像进行文字识别处理而取得的文字数据，并且学习累积的文字、单词的使用频率和使用状况，对预测为下次使用的文字、单词进行分析，所述文章修正部在量词分析中，对于所述欠缺部分，分析数字和量词的关系，所述文章修正部在前缀分析和后缀分析中，对于所述欠缺部分，分析与前缀、后缀的关系。

按照本发明的构成，当在读取原稿图像的时点例如在所述原稿的周向边缘部等处存在欠缺的情况下，能够根据从词典数据中提取的修正候选的文字或单词，自动地对欠缺部分进行修正。由此，用户无需为了确认原稿图像而每次都进行预览。因此，在图像形成装置中，能够提高读取原稿图像时的操作性。

附图说明

图1是表示本发明实施方式的图像形成装置的构成的框图。

图2是表示本发明实施方式的图像形成装置的图像读取时的原稿状态的例子的说明图。

图3是表示本发明实施方式的图像形成装置的图像读取处理的例子的流程图。

具体实施方式

下面，参照附图对本发明的实施方式进行说明。另外，本发明并不限定于以下内容。

首先，参照图1，对本发明实施方式的图像形成装置的构成进行说明。图1是表示图像形成装置的构成的例子的框图。图像形成装置1是具有复印(印刷)、扫描(图像读取)和传真发送等多种功能的所谓的数码复合机。

图像形成装置1包括图1所示的控制部20和存储部23。控制部20例如包括：CPU21、图像处理部22以及其它未图示的电子电路和电子部件等。CPU21基于存储在存储部23中的控制用程序和数据，控制设置于图像形成装置1的各结构要素的动作，并执行与图像形成装置1的功能有关的处理。图像处理部22对用于图像形成、印刷、图像读取和发送的图像数据进行图像处理。存储部23例如是未图示的程序ROM、数据ROM等非易失性存储装置和RAM这样的易失性存储装置的组合。

在图像形成装置1的上部设置有原稿输送部3和图像读取部4。图像读取部4具有原稿读取台4t，该原稿读取台4t用于从放置在其上表面上的原稿或书籍一页一页地读取原稿图像。用户在使图像形成装置1执行复印作业和扫描作业的情况下，将描绘有文字、图形和图案等图像的原稿放置在原稿输送部3上，或者将原稿或书籍放置在图像读取部4的原稿读取台4t上。控制部20向原稿输送部3和图像读取部4提供动作指示并使其读取原稿图像。图像读取部4读取到的原稿图像的图像数据临时存储在存储部23等中。

在图像形成装置1的上部、且在图像读取部4的正面侧设置有操作面板(操作部)5。操作面板5包括显示部5w。操作面板5从用户接收指令等，该指令例如使图像形成装置1执行复印(印刷)作业、扫描(图像读取)作业和传真发送作业。操作面板5接收例如在印刷中使用的纸的种类、尺寸、放大缩小和是否双面印刷这样的印刷条件等的设定输入以及接收传真发送的传真号和发送人等的设定输入。此外，操作面板5通过在显示部5w显示例如装置的状态、注意事项和错误信息等，发挥作为用于将这些信息通知用户的通知部的作用。操作面板5接收到的操作信息向控制部20发送。

图像形成装置1在比图像读取部4更靠下方的部分具有印刷部6。印刷部6执行印刷作业。印刷部6包括：供纸部7、送纸部8、曝光部9、图像形成部10、转印部11和定影部12。供纸部7收容多张纸，印刷时将纸送出。送纸部8将从供纸部7送出的纸输送到转印部11和定影部12，并将定影后的纸向装置的外部排出。曝光部9向图像形成部10照射基于图像数据被控制的激光。图像形成部10通过由曝光部9照射的激光，形成原稿图像的静电潜影，从该静电潜影形成调色剂像。转印部11将由图像形成部10形成的调色剂像转印在纸上。定影部12对转印有调色剂像的纸进行加热、加压，使调色剂像定影在纸上。控制部20控制这样的印刷部6的印刷动作。

图像形成装置1包括通信部24。通信部24与外部通信装置、计算机等之间进行传真、图像数据的收发这样的通信。通信部24与电话线路或网络线路连接，利用这些线路与外部通信装置、计算机等进行图像数据等的收发。控制部20使通信部24执行与外部通信装置等的数据的收发。

接着，在图1的基础上参照图2对图像形成装置1的详细构成进行说明。图2是表示图像形成装置1的图像读取时的原稿状态的例子的说明图。另外，图2表示从下方观察放置有原稿Ca1、Ca2、Ca3的图像读取部4的原稿读取台4t的状态。

图像处理部22对原稿图像进行文字识别处理并取得文字数据。在文字识别处理中例如使用OCR(Optical Character Recognition：光学字符识别)技术。在文字识别处理中，图像处理部22从图像数据提取文字图像。此外，图像处理部22进行匹配处理并识别文字，所述匹配处理对提取的文字图像与作为词典数据23d存储在存储部23中的文字图形进行比较。

存储部23具有词典数据23d。词典数据23d存储图形匹配用的文字图形，该图形匹配用的文字图形在例如由图像处理部22进行的文字识别处理中使用。词典数据23d包含字母、平假名、片假名和汉字等每种文字的图形匹配用的文字图形。

此外，在词典数据23d中登记有多个文字和多个单词。作为文字数据包含例如字母、平假名、片假名和汉字等与各种语言相关的文字。作为单词数据例如对每种语言登记有名词(普通名词、专有名词)、动词、形容词、代词、冠词、副词、介词和连词等单词。例如，可以在专有名词中登记通常被公众所知的国名、地名、公司名、名胜古迹名、设施名和人物名等。

控制部20包括欠缺检测部25和文章修正部26。另外，欠缺检测部25和文章修正部26的功能例如通过CPU21按照程序执行运算处理来实现，但是也可以由电子硬件电路来实现。

在此，例如图像读取时，像图2所示的原稿状态那样，有时在原稿读取台4t上放置三张名片型的原稿Ca1、Ca2、Ca3。在图2所示的例子中，原稿Ca1、Ca3的一部分从原稿读取台4t的外边缘部伸出。此外，原稿Ca1、Ca2的一部分相互重叠。由此，在原稿Ca1、Ca2、Ca3各自的原稿图像中产生欠缺部X1、X2、X3。

在这样的原稿状态下，欠缺检测部25基于词典数据23d，检测图像处理部22对原稿图像进行文字识别处理而取得的文字数据中的欠缺部分。欠缺检测部25通过对从原稿图像取得的文字数据与登记在词典数据23d中的文字、单词进行对照来检测欠缺部分。例如，像欠缺部X1、X2这样，在文字数据的单词是大写字母的字符串的情况下，欠缺检测部25对照登记在词典数据23d中的专有名词来检测欠缺部分。此外，例如像欠缺部X3这样，在包含在单词或连续的字符串中的多个文字欠缺的情况下，欠缺检测部25通过与登记在词典数据23d中的图形匹配用的文字图形进行对照来检测欠缺部分。

当在文字数据中存在欠缺部分的情况下，文章修正部26从词典数据23d中提取针对欠缺部分的修正候选的文字或单词，并利用提取的文字或单词对文字数据的欠缺部分进行修正。文章修正部26例如对上下文、使用预测、量词、前缀和后缀等进行分析，从词典数据23d中提取针对欠缺部分的修正候选的文字或单词。

在上下文分析中，对欠缺部分和前后的上下文的关系进行分析。例如，包含欠缺部分的单词是大写字母的字符串、该单词记载在文书的开头、包含该单词的句尾包含“Inc.”、“School”和“Hospital”等特定单词时，将包含欠缺部分的单词分析为是专有名词。例如，在欠缺部X1、X2的情况下，文章修正部26将包含欠缺部分的单词“KYOCCCE”分析为是专有名词，并从词典数据23d中提取“KKYOCCCE”这样的专有名词的修正候选。

此外，例如在上下文分析中，在欠缺部X2的情况下，根据包含单词“neral”的句尾的单词“Section”，将该句子分析为是组织名，所述单词“neral”包含欠缺部分。此外，从词典数据23d中提取“General Affairs Section(总务科)”的“General”这样的修正候选。

此外，例如在上下文分析中，在欠缺部X3的情况下，通过与图形匹配用的文字图形进行对照，检测到句首的“http”和“www”，分析该句子是互联网的主页地址。此外，从词典数据23d中提取与接着“www”的文字图形对应的主页地址的修正候选。

在使用预测分析中，通过累积至此为止对原稿图像进行文字识别处理而取得的文字数据，并且学习累积的文字、单词的使用频率和使用状况，对预测为下次使用的文字、单词进行分析。在量词分析中，对于欠缺部分，分析数字和量词的关系。在前缀分析和后缀分析中，对于欠缺部分，分析与前缀、后缀的关系。

此外，文章修正部26利用从词典数据23d中提取的修正候选的文字或单词，对文字数据的欠缺部分进行修正。另外，文章修正部26对于使用了修正候选的文字的修正，具有以下两种处理模式，可以任意地选择。一种是自动处理模式：不通过操作面板5从用户接收修正候选的文字或单词的选择或输入地对欠缺部分进行修正。另一种是操作接收处理模式：通过操作面板5从用户接收修正候选的文字或单词的选择或输入地对欠缺部分进行修正。

接着，参照图3所示的流程，说明由图像形成装置1进行的图像读取处理的一个例子。图3是表示图像形成装置1的图像读取处理的例子的流程图。

在图像形成装置1中，如果例如接收到扫描作业，则图像读取动作开始(图3的开始)。

在步骤#101中，由图像读取部4读取原稿图像的图像数据。此时，例如由用户将原稿放置在原稿读取台4t上，从操作面板5按下图像读取处理的开始键。原稿图像的图像数据存储在存储部23中。

在步骤#102中，图像处理部22检测文字识别处理后的字符串的倾斜，并且对该字符串的倾斜进行修正。图像处理部22具有如下功能：能够分别检测出原稿图像整体相对于例如原稿自身或图像读取的扫描方向倾斜的情况、或者原稿图像中的字符串自身局部倾斜的情况，并且对原稿图像中的字符串的倾斜进行修正。此时，当检测到的倾斜比预先确定的上限值大时，文章修正部26使显示部5w显示由图像读取部4读取到的原稿图像。此外，希望要求用户重新将原稿放置在原稿读取台4t上等。

在步骤#103中，图像处理部22对图像读取部4读取到的原稿图像进行文字识别处理并取得文字数据。从原稿图像取得的文字数据存储在存储部23中。

在步骤#104中，欠缺检测部25基于词典数据23d，检测图像处理部22对原稿图像进行文字识别处理而取得的文字数据中的欠缺部分。欠缺检测部25通过对从原稿图像取得的文字数据与登记在词典数据23d中的文字、单词进行对照，检测欠缺部分。

在步骤#105中，判断在从原稿图像取得的文字数据中是否存在欠缺部分。当在文字数据中存在欠缺部分时，转移至步骤#106。当在文字数据中不存在欠缺部分时，转移至步骤#114。

在步骤#106中，文章修正部26从词典数据23d中提取针对欠缺部分的修正候选的文字或单词。文章修正部26通过对文字数据进行分析，从词典数据23d中提取针对欠缺部分的修正候选的文字或单词。

在步骤#107中，判断由文章修正部26进行的文字的修正是否是自动处理模式。当文字的修正是自动处理模式时，转移至步骤#108。当文字的修正不是自动处理模式而是操作接收处理模式时，转移至步骤#111。

在步骤#108中亦即在文字的修正是自动处理模式的情况下，文章修正部26利用从词典数据23d中提取的修正候选的文字或单词对文字数据的欠缺部分进行修正。

在步骤#109中，对于修正后的文字数据，判断利用显示部5w的预览的设定是否是开。用户可以利用操作面板5预先设定预览的开/关。当预览设定是开时转移至步骤#110。当预览设定是关时转移至步骤#114。

在步骤#110中，在显示部5w上显示由文章修正部26修正后的文字数据。由文章修正部26修正后的文字或单词可以通过例如以与不需要修正的文字或单词不同的颜色进行显示、或高亮度显示来进行强调。

在步骤#111中亦即在文字的修正是操作接收处理模式的情况下，文章修正部26使显示部5w显示文字数据的预览，还显示针对欠缺部分的多个修正候选的文字或单词。

在步骤#112中，通过操作面板5从用户接收显示于显示部5w的修正候选的文字或单词的选择、或者接收与显示于显示部5w的修正候选的文字或单词不同的文字或单词的输入。用户利用操作面板5，选择针对文章修正部26提取的欠缺部分的多个修正候选的文字或单词中的任意一个。此外，在显示于显示部5w的修正候选中没有所希望的文字或单词时，用户能够利用操作面板5，输入与显示于显示部5w的修正候选的文字或单词不同的文字或单词。

在步骤#113中，文章修正部26基于用户选择或输入的文字或单词，对文字数据的欠缺部分进行修正。

在步骤#114中，保存文字数据。即，当在从原稿图像的图像数据识别出的文字数据中存在欠缺部分时，将基于词典数据23d进行了修正的文字数据最终保存在存储部23等中。此外，图像读取处理结束(图3的结束)。

如所述实施方式所示，图像形成装置1包括欠缺检测部25和文章修正部26。欠缺检测部25基于词典数据23d，从图像处理部22取得的文字数据检测欠缺部分。当在文字数据中存在欠缺部分时，文章修正部26从词典数据23d中提取针对欠缺部分的修正候选的文字或单词，并对文字数据的欠缺部分进行修正。

按照这种构成，例如如图2所示，当在原稿的周向边缘部和原稿重叠的部分等处在读取该原稿图像的时点存在欠缺部X1、X2、X3时，能够通过从词典数据23d提取的修正候选的文字或单词，自动地对欠缺部分进行修正。由此，用户无需为了确认原稿图像而每次都进行预览。因此，在图像形成装置1中，能够提高读取原稿图像时的操作性。

此外，图像形成装置1包括显示部5w，所示显示部5w显示文章修正部26修正后的文字或单词。由此，通过根据需要在显示部5w进行预览，能够确认修正后的原稿图像。

此外，文章修正部26从词典数据23d中提取并使显示部5w显示多个修正候选的文字或单词，基于通过操作面板5由用户在多个修正候选的文字或单词中选择的任意一个文字或单词，对欠缺部分进行修正。按照这种构成，能够提高图像读取精度。

此外，文章修正部26基于与修正候选的文字或单词不同的、由用户通过操作面板5输入的文字或单词，对欠缺部分进行修正。按照这种构成，当在文章修正部26提取的修正候选中没有所希望的文字或单词时，用户能够基于自身所期望的文字或单词，对欠缺部分进行修正。因此，能够进一步提高图像读取精度。

此外，文章修正部26能够在欠缺部分的修正中任意选择自动处理模式和操作接收处理模式。按照这种构成，能够根据多种状况使图像形成装置1执行图像读取处理。

此外，图像处理部22检测文字识别处理后的字符串的倾斜并对该字符串的倾斜进行修正。即，欠缺检测部25从图像处理部22取得并对字符串的倾斜进行了修正的文字数据检测欠缺部分。由此，能够从文字数据自动地检测欠缺部分，并能够提高修正的精度。因此，能够进一步降低进行预览的必要性，并能够提高读取原稿图像时的操作性。此外，当由图像处理部22检测出的字符串的倾斜比预先确定的上限值大时，文章修正部26使显示部5w显示由图像读取部4读取到的原稿图像。由此，能够要求用户重新向原稿读取台4t放置原稿。

以上，对本发明的实施方式进行了说明，但是并不限定本发明的范围，只要在不脱离本发明宗旨的范围内，可以施加各种变形来实施本发明。

例如，图2所示的图像读取时的原稿状态是一个例子，本发明能够实现的状态并不限定于图2的状态。例如，原稿并不限定于名片型的文件，也可以是记载有通常的文章等的文件。此外，例如原稿的文字和单词(语言)并不限定于字母和英语，也可以是平假名、片假名及汉字和日语，也可以是其它文字和单词(语言)。

Claims

1.一种图像形成装置，其包括：

图像读取部，读取原稿图像；

存储部，存储登记有多个文字和多个单词的词典数据；

图像处理部，对所述原稿图像进行文字识别处理并取得文字数据；

欠缺检测部，基于所述词典数据，检测所述文字数据中的欠缺部分；以及

文章修正部，当在所述文字数据中存在所述欠缺部分时，分析所述欠缺部分与所述欠缺部分前后的字符串的关系，从所述词典数据中提取针对所述欠缺部分的修正候选的文字或单词，并利用提取的所述修正候选的文字或单词对所述欠缺部分进行修正，

所述图像形成装置的特征在于，

所述文章修正部在上下文分析中对所述欠缺部分和前后的上下文的关系进行分析，

所述文章修正部在使用预测分析中，通过累积至此为止对所述原稿图像进行文字识别处理而取得的文字数据，并且学习累积的文字、单词的使用频率和使用状况，对预测为下次使用的文字、单词进行分析，

所述文章修正部在量词分析中，对于所述欠缺部分，分析数字和量词的关系，

所述文章修正部在前缀分析和后缀分析中，对于所述欠缺部分，分析与前缀、后缀的关系。

2.根据权利要求1所述的图像形成装置，其特征在于，所述图像形成装置包括显示部，所述显示部显示所述文章修正部修正后的文字或单词。

3.根据权利要求1所述的图像形成装置，其特征在于，

所述图像形成装置包括：

显示部，显示所述修正候选的文字或单词；以及

操作部，接收显示于所述显示部的所述修正候选的文字或单词的选择，

所述文章修正部从所述词典数据中提取并使所述显示部显示多个所述修正候选的文字或单词，并且基于通过所述操作部在多个所述修正候选的文字或单词中选择的任意一个文字或单词，对所述欠缺部分进行修正。

4.根据权利要求3所述的图像形成装置，其特征在于，

所述操作部接收与显示于所述显示部的所述修正候选的文字或单词不同的文字或单词的输入，

所述文章修正部基于通过所述操作部输入的文字或单词，对所述欠缺部分进行修正。

5.根据权利要求3或4所述的图像形成装置，其特征在于，

所述文章修正部具有：

自动处理模式，不通过所述操作部接收所述修正候选的文字或单词的选择或输入地对所述欠缺部分进行修正；以及

操作接收处理模式，通过所述操作部接收所述修正候选的文字或单词的选择或输入并对所述欠缺部分进行修正，

所述文章修正部能够任意地选择所述自动处理模式和所述操作接收处理模式。

6.根据权利要求1所述的图像形成装置，其特征在于，

所述图像形成装置包括显示部，

所述图像处理部检测文字识别处理后的字符串的倾斜并对该字符串的倾斜进行修正，

当检测到的所述倾斜比预先确定的上限值大时，所述文章修正部使所述显示部显示由所述图像读取部读取到的所述原稿图像。