JP2020099030A

JP2020099030A - 情報処理装置、及び情報処理方法

Info

Publication number: JP2020099030A
Application number: JP2018237330A
Authority: JP
Inventors: 宏憲林; Hironori Hayashi
Original assignee: Kyocera Document Solutions Inc
Current assignee: Kyocera Document Solutions Inc
Priority date: 2018-12-19
Filing date: 2018-12-19
Publication date: 2020-06-25
Also published as: US20200202156A1; US10936893B2

Abstract

【課題】ユーザーの利便性を向上させることができる情報処理装置、及び情報処理方法を提供する。【解決手段】情報処理装置は、原稿画像データＧ１に対して処理を実行する。原稿画像データは、複数の第１画像データＴ１〜Ｔ３と、第２画像データＮ１、Ｎ２・・・とを含む。第１画像データは、文字認識処理の対象であるが、第２画像データは、文字認識処理の対象でない。情報処理装置は、検出部と抽出部と処理部とを備える。検出部は、原稿画像データから複数の第１画像データを検出する。抽出部は、原稿画像データから複数の第１画像データを抽出する。処理部は、複数の第１画像データを合成して合成画像データを生成し、合成画像データに対して文字認識処理を実行する。【選択図】図２

Description

本発明は、情報処理装置、及び情報処理方法に関する。

原稿を読取って生成された画像データから、特定の領域を切り出す画像形成装置が従来から開発されている。例えば、特許文献１に記載の画像形成装置は、画像データにマーカーペンで囲まれた領域があるか否かを判別する。

特許文献１に記載の画像形成装置は、画像データにマーカーペンで囲まれた領域があると判別した場合には、マーカーペンで囲まれた領域の内部又は外部をシートに印字出力する。特許文献１に記載の画像形成装置は、画像データにマーカーペンで囲まれた領域がないと判別した場合には、画像データを改変せずにシートに印字出力する。

特開２００５−１６７８７５号公報

しかしながら、特許文献１に記載の画像形成装置は、画像データに対する文字認識処理の方法を変更できない。したがって、特許文献１に記載の画像形成装置は、画像データに応じて、最適な文字認識処理を実行できない。その結果、ユーザーの利便性が低かった。

本発明は上記課題に鑑みてなされたものであり、ユーザーの利便性を向上させることができる情報処理装置、及び情報処理方法を提供することを目的とする。

本発明に係る情報処理装置は、原稿画像データに対して処理を実行する。原稿画像データは、複数の第１画像データと、第２画像データとを含む。前記第１画像データは、文字認識処理の対象である。前記第２画像データは、文字認識処理の対象でない。当該情報処理装置は、検出部と、抽出部と、処理部とを備える。前記検出部は、前記原稿画像データから、前記複数の第１画像データを検出する。前記抽出部は、前記原稿画像データから、前記複数の第１画像データを抽出する。前記処理部は、前記複数の第１画像データを合成して合成画像データを生成し、前記合成画像データに対して文字認識処理を実行する。

本発明に係る情報処理方法は、原稿画像データに対して処理を実行する方法である。前記原稿画像データは、複数の第１画像データと、第２画像データとを含む。前記第１画像データは、文字認識処理の対象である。前記第２画像データは、文字認識処理の対象でない。当該情報処理方法は、前記原稿画像データから前記複数の第１画像データを検出するステップと、前記原稿画像データから前記複数の第１画像データを抽出するステップと、前記複数の第１画像データを合成して合成画像データを生成し、前記合成画像データに対して文字認識処理を実行するステップとを含む。

本発明の情報処理装置、及び情報処理方法によれば、ユーザーの利便性を向上させることができる。

本発明の実施形態１に係る情報処理装置の構成を示す図である。本発明の実施形態１に係る原稿画像を示す図である。本発明の実施形態１に係る合成画像を示す図である。本発明の実施形態１に係る情報処理装置の制御部の構成を示すブロック図である。本発明の実施形態１に係る情報処理装置が原稿画像を読取って文字列データを出力するまでの動作を示すフローチャートである。本発明の実施形態２に係るマスキング画像を示す図である。（ａ）〜（ｃ）は、本発明の実施形態２に係る原稿画像から抽出された第１画像を示す図である。本発明の実施形態２に係る情報処理装置の制御部の構成を示すブロック図である。本発明の実施形態２に係る情報処理装置が原稿画像を読取って文字列データを出力するまでの動作を示すフローチャートである。本発明の実施形態３に係る原稿画像を示す図である。（ａ）は、本発明の実施形態４に係る翻訳前の原稿画像を示す図である。（ｂ）は、本発明の実施形態４に係る翻訳後の画像を示す図である。（ａ）は、本発明の実施形態５に係る表現方法を変更する前の原稿画像を示す図である。（ｂ）は、本発明の実施形態５に係る表現方法を変更した後の画像を示す図である。本発明の実施形態６に係る指示画面を示す図である。

以下、本発明の実施形態について、図面を参照しながら説明する。なお、図中、同一又は相当部分については同一の参照符号を付して説明を繰り返さない。

（実施形態１）
図１を参照して、実施形態１に係る情報処理装置１００を説明する。図１は、実施形態１に係る情報処理装置１００の構成を示す図である。情報処理装置１００は、例えば、複写機、プリンター、又は複合機である。以下では、一例として、情報処理装置１００がプリンター機能と複写機能とファクシミリ機能とを有するモノクロ複合機である場合について説明する。

図１に示すように、情報処理装置１００は、画像読取部１０と、画像形成部２０と、制御部３０と、記憶部４０と、通信部５０と、原稿台１２と、原稿搬送装置１１０と、操作パネル１２０と、給紙カセット１３０と、用紙搬送部１４０と、用紙排出部１７０とを備える。

画像読取部１０は、予め設定された解像度で原稿Ｄに形成された画像を読取り、原稿Ｄの画像を示すデータを生成する。詳しくは、画像読取部１０は、原稿搬送装置１１０によって搬送された原稿Ｄに形成された画像を読取り、原稿Ｄの画像を示すデータを生成する。又は、画像読取部１０は、原稿台１２に載置された原稿Ｄに形成された画像を読取り、原稿Ｄの画像を示すデータを生成する。以下、原稿Ｄの画像を「原稿画像」と記載する場合がある。また、原稿Ｄの画像を示すデータを「原稿画像データ」と記載する場合がある。

画像形成部２０は、原稿画像データに基づいて用紙Ｐに画像を形成する。用紙Ｐは、記録媒体の一例である。

制御部３０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）のようなプロセッサー、及びＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）等によって構成されるハードウェア回路である。制御部３０は、記憶部４０に記憶された制御プログラムをプロセッサーが読み出して実行することによって、情報処理装置１００の各部の動作を制御する。制御部３０は、原稿画像データに対して処理を実行する。

原稿画像データは、第１画像データと第２画像データとを含む。第１画像は、文字認識処理の対象となる画像である。第２画像は、文字認識処理の対象とならない画像である。第１画像は、例えば、文字に対してマーキングがされている画像である。例えば、ユーザーは、筆記具（例えば、ピンク色の蛍光ペン）によって文字に対してマーキングする。あるいは、ユーザーは、ソフトウェアを使用してデータ上で文字に対してマーキングしてもよい。

制御部３０は、原稿画像データから、第１画像データのみを含む合成画像を示すデータを生成し、合成画像を示すデータに対して文字認識処理を実行する。これにより、文字認識処理に掛かる時間が短くなる。この結果、ユーザーの利便性が向上する。以下、合成画像を示すデータを「合成画像データ」と記載する場合がある。

記憶部４０は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、及びＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）によって構成される。記憶部４０は、外部メモリーを含んでいてもよい。外部メモリーは、リムーバブルメディアである。記憶部４０は、外部メモリーとして、例えば、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリー、及びＳＤ（ＳｅｃｕｒｅＤｉｇｉｔａｌ）カードを含む。記憶部４０は、各種のデータ、及び情報処理装置１００の各部の動作を制御するための制御プログラムを記憶する。制御プログラムは、制御部３０によって実行される。

通信部５０は、同じ通信方式（プロトコル）を利用する通信機が搭載された電子機器との間で通信が可能である。本実施形態において、通信部５０は、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）などのネットワーク網を介して外部装置と通信する。通信部５０は、例えば、ＬＡＮボードのような通信モジュール（通信機器）である。なお、原稿画像データは、通信部５０を介して外部装置から送信された画像データでもよい。

操作パネル１２０は、ユーザーに情報処理装置１００を操作させるために用いられる。操作パネル１２０は、表示部１２２を有する。表示部１２２は、例えば、タッチパネルである。表示部１２２には、ユーザーに情報処理装置１００を操作させるための入力画面が表示される。また、表示部１２２は、指示画面を表示する。指示画面については、図１３を参照して後に説明する。

給紙カセット１３０は、印刷用の用紙Ｐを収容している。印刷を行う際、給紙カセット１３０内の用紙Ｐは、画像形成部２０を経由して用紙排出部１７０から排出されるように、用紙搬送部１４０によって搬送される。

図２は、実施形態１に係る原稿画像Ｇ１を示す図である。図２に示すように、原稿画像Ｇ１は、第１画像Ｔ１、Ｔ２及びＴ３と、第２画像Ｎ１、及びＮ２とを含む。

第１画像Ｔ１は、文字列画像Ｔ１ａと、識別画像Ｔ１ｂとを含む。第１画像Ｔ２は、文字列画像Ｔ２ａと、識別画像Ｔ２ｂとを含む。第１画像Ｔ３は、文字列画像Ｔ３ａと、識別画像Ｔ３ｂとを含む。

文字列画像Ｔ１ａ、Ｔ２ａ、及びＴ３ａは複数の文字画像を含む。文字画像は、１つの文字を示す。換言すると、文字列画像Ｔ１ａ、Ｔ２ａ、及びＴ３ａは、文字列を示す画像である。図２において、文字列画像Ｔ１ａは、文字列「ＡＢＣＤＥＦＧＨ」を示す。文字列画像Ｔ２ａは、文字列「１２３４５６７８９０」を示す。文字列画像Ｔ３ａは、文字列が「ＱＲＳＴＵＶＷＸ」を示す。

識別画像Ｔ１ｂ、Ｔ２ｂ、及びＴ３ｂは、文字列画像Ｔ１ａ、Ｔ２ａ、及びＴ３ａが文字認識処理の対象であることを示す。識別画像Ｔ１ｂは、文字列画像Ｔ１ａに重なるマーキング画像である。識別画像Ｔ２ｂは、文字列画像Ｔ２ａに重なるマーキング画像である。識別画像Ｔ３ｂは、文字列画像Ｔ３ａに重なるマーキング画像である。図２に示す例において、識別画像Ｔ１ｂ、Ｔ２ｂ、及びＴ３ｂは、ピンク色の蛍光ペンにより描画された直線状あるいは略直線状の画像である。

第２画像Ｎ１は、文字列画像Ｎ１ａを含む。第２画像Ｎ２は、文字列画像Ｎ２ａを含む。

図２において、文字列画像Ｎ１ａ、及びＮ２ａは、文字列を示す画像である。図２において、文字列画像Ｎ１ａは、文字列「ＩＪＫＬＭＮＯＰ」を示す。文字列画像Ｎ２ａは、文字列「０９８７６５４３２１」を示す。

図３は、実施形態１に係る合成画像Ｇ２を示す図である。図３に示すように、合成画像Ｇ２は、第１画像Ｔ１、Ｔ２及びＴ３を含む。合成画像Ｇ２は、複数の第１画像、具体的には、第１画像Ｔ１、Ｔ２及びＴ３を合成した画像である。合成画像Ｇ２の第１画像Ｔ１、Ｔ２及びＴ３は、図２を参照して説明した原稿画像Ｇ１の第１画像Ｔ１、Ｔ２及びＴ３と同じである。

次に、図４を参照して、実施形態１の制御部３０の構成について説明する。図４は、実施形態１の制御部３０の構成を示すブロック図である。

図４に示すように、制御部３０は、検出部３１と、抽出部３２と、処理部３３とを有する。具体的には、制御部３０は、記憶部４０が記憶する制御プログラムを実行することによって、検出部３１、抽出部３２、及び処理部３３として機能する。

検出部３１は、図２を参照して説明した原稿画像Ｇ１を示すデータから、第１画像Ｔ１、Ｔ２及びＴ３を検出する。具体的には、検出部３１は、識別画像Ｔ１ｂ、Ｔ２ｂ、又はＴ３ｂを含む画像を第１画像として検出する。

抽出部３２は、原稿画像Ｇ１を示すデータから、検出部３１が検出した第１画像Ｔ１、Ｔ２及びＴ３の各々を示すデータを抽出する。

処理部３３は、抽出部３２が抽出した第１画像Ｔ１、Ｔ２及びＴ３の各々を示すデータを合成して、図３を参照して説明した合成画像Ｇ２を示すデータを生成する。処理部３３は、合成画像Ｇ２を示すデータに対して文字認識処理を実行する。文字認識処理は、原稿画像に含まれる文字画像（例えば、平仮名、カタカナ、アルファベッド、漢字、数字、記号）を光学的に認識し、文字画像を文字コードに変換する処理である。

文字認識処理を実行した結果、処理部３３は、第１画像Ｔ１を示すデータから、文字列画像Ｔ１ａに含まれる文字列「ＡＢＣＤＥＦＧＨ」を示すデータを取得する。処理部３３は、第１画像Ｔ２を示すデータから、文字列画像Ｔ２ａに含まれる文字列「１２３４５６７８９０」を示すデータを取得する。処理部３３は、第１画像Ｔ３を示すデータから、文字列画像Ｔ３ａに含まれる「ＱＲＳＴＵＶＷＸ」を示すデータを取得する。

処理部３３は、文字認識処理を実行して得られた文字列データを出力する。例えば、処理部３３は、文字列データを電子ファイルに記録する。あるいは、処理部３３は、文字列データを外部の情報端末に送信する。あるいは、処理部３３は、図１を参照して説明した用紙Ｐに文字列が印字されるように情報処理装置１００を動作させる。処理部３３は、図１を参照して説明した表示部１２２に文字列を表示する。

次に、図５を参照して、実施形態１の情報処理装置１００の動作について説明する。図５は、情報処理装置１００が原稿Ｄの画像を読取って文字列データを出力するまでの動作を示すフローチャートである。

図５に示す動作は、ユーザーが、例えば、図１を参照して説明した原稿搬送装置１１０に原稿Ｄを載置して、情報処理装置１００に原稿Ｄの画像の読取りを指示することによって開始する。

ステップＳ１０１において、画像読取部１０が、原稿Ｄの画像を読取って、原稿画像Ｇ１を示すデータを生成する。動作はステップＳ１０２に進む。

ステップＳ１０２において、検出部３１が、原稿画像Ｇ１に含まれる第１画像Ｔ１、Ｔ２及びＴ３を検出する。動作はステップＳ１０３に進む。

ステップＳ１０３において、抽出部３２が、検出された第１画像Ｔ１、Ｔ２及びＴ３の各々を示すデータを原稿画像データから抽出する。動作はステップＳ１０４に進む。

ステップＳ１０４において、処理部３３が、抽出された第１画像Ｔ１、Ｔ２及びＴ３の各々を示すデータを合成して合成画像Ｇ２を示すデータを生成する。動作はステップＳ１０５に進む。

ステップＳ１０５において、処理部３３が、合成画像Ｇ２を示すデータに対して文字認識処理を実行する。動作はステップＳ１０６に進む。

ステップＳ１０６において、処理部３３が、文字認識処理によって取得された文字列データを出力する。図５に示す動作は終了する。

以上、図１から図５を参照して、本発明の実施形態１に係る情報処理装置１００について説明した。実施形態１によれば、情報処理装置１００は、原稿画像Ｇ１から、第１画像Ｔ１、Ｔ２及びＴ３のみを含む合成画像Ｇ２を生成し、合成画像Ｇ２に対して文字認識処理を実行する。したがって、文字認識処理に掛かる時間が短くなる。この結果、ユーザーの利便性が向上する。

なお、図１〜図５を参照して説明した情報処理装置１００において、原稿画像Ｇ１に含まれる識別画像Ｔ１ｂ、Ｔ２ｂ、及びＴ３ｂは、ピンク色の蛍光ペンにより描画されたマーキング画像である。しかしながら、識別画像Ｔ１ｂ、Ｔ２ｂ、及びＴ３は、ピンク色ではない色、例えば黄色の蛍光ペンによって描画されたマーキング画像であってもよい。また、識別画像Ｔ１ｂ、Ｔ２ｂ、及びＴ３ａは、文字列画像Ｔ１ａ、Ｔ２ａ、及びＴ３ａの全体ではなく、例えば、文字列画像Ｔ１ａ、Ｔ２ａ、及びＴ３ａの下半分とだけ重なっていてもよい。

（実施形態２）
図２、図６から図９を参照して、本発明の実施形態２について説明する。実施形態２によれば、情報処理装置１００は、図２を参照して説明した原稿画像Ｇ１に含まれる第１画像Ｔ１、Ｔ２及びＴ３の数に応じて、文字認識処理の方法を変更する。この結果、ユーザーの利便性が向上する。

図６は、実施形態２に係るマスキング画像Ｇ３を示す図である。本実施形態において、マスキング画像Ｇ３は、図２を参照して説明した原稿画像Ｇ１の背景色によって、原稿画像Ｇ１の第２画像Ｎ１、及びＮ２をマスキングすることにより形成される。

背景色は、図２を参照して説明した原稿画像Ｇ１のうち、第１画像、及び第２画像が描画されていない部分の色である。背景色は、ユーザーが予め設定する。背景色は、例えば、白である。マスキング画像Ｇ３の第１画像Ｔ１、Ｔ２及びＴ３は、原稿画像Ｇ１の第１画像Ｔ１、Ｔ２及びＴ３と同じである。

図７は、原稿画像Ｇ１から抽出された第１画像Ｔ１、Ｔ２及びＴ３を示す図である。図７（ａ）は、原稿画像Ｇ１から抽出された第１画像Ｔ１を示す図である。図７（ｂ）は、原稿画像Ｇ１から抽出された第１画像Ｔ２を示す図である。図７（ｃ）は、原稿画像Ｇ１から抽出された第１画像Ｔ３を示す図である。

次に、図８を参照して、実施形態２の制御部３０の構成について説明する。図８は、実施形態２の制御部３０の構成を示すブロック図である。図８に示すように、実施形態２の制御部３０は、処理部３３の構成を除けば実施形態１の制御部３０と構成が同じである。したがって、実施形態２の制御部３０の構成のうち、処理部３３以外の構成については説明を省略する。

処理部３３は、計数部３３１と、判定部３３２と、第１実行部３３３と、第２実行部３３４とを有する。具体的には、制御部３０は、記憶部４０が記憶する制御プログラムを実行することによって、計数部３３１、判定部３３２、第１実行部３３３、及び第２実行部３３４として機能する。

なお、処理部３３は、実施形態１において説明した処理部３３と同様に、文字認識処理を実行して得られた文字列データを出力する。

計数部３３１は、抽出部３２が抽出した第１画像Ｔ１、Ｔ２及びＴ３の数を計数する。図７（ａ）〜図７（ｃ）に示すように、実施形態２における第１画像Ｔ１、Ｔ２、及びＴ３の数は３つである。

判定部３３２は、第１画像Ｔ１、Ｔ２及びＴ３の数が閾値よりも大きいか否かを判定する。閾値は、例えば、「５」である。閾値は、ユーザー、又はメンテナンス担当者が設定、及び変更できる。また、情報処理装置１００を工場で製造する際に設定できる。

第１実行部３３３は、第１画像Ｔ１、Ｔ２及びＴ３の数が閾値よりも大きいと判定された場合、第１処理を実行する。第１処理は、図６を参照して説明したマスキング画像Ｇ３を示すデータに対して文字認識する処理である。具体的には、第１実行部３３３は、原稿画像Ｇ１を示すデータに対して、第２画像Ｎ１、及びＮ２を原稿画像Ｇ１の背景色でマスキングする処理を実行する。この結果、マスキング画像Ｇ３を示すデータが生成される。

第２実行部３３４は、第１画像Ｔ１、Ｔ２及びＴ３の数が閾値より大きくないと判定された場合、第１処理と異なる第２処理を実行する。第２処理は、図７（ａ）〜図７（ｃ）を参照して説明した第１画像Ｔ１、Ｔ２及びＴ３の各々に対して文字認識する処理である。

次に、図９を参照して、実施形態２の情報処理装置１００の動作について説明する。図９は、情報処理装置１００が原稿Ｄの画像を読取って文字列データを出力するまでの動作を示すフローチャートである。なお、ステップＳ１０１からステップＳ１０３までは、実施形態１のステップＳ１０１からステップＳ１０３と同じである。したがって、ステップＳ１０１からステップＳ１０３までの説明を省略する。

ステップＳ２０４において、計数部３３１が、抽出された第１画像Ｔ１、Ｔ２及びＴ３の数を計数する。動作はステップＳ２０５に進む。

ステップＳ２０５において、第１画像Ｔ１、Ｔ２及びＴ３の数が閾値より大きいか否かを判定部３３２が判定する。閾値より大きいと判定部３３２が判定した場合（ステップＳ２０５のＹｅｓ）は、動作はステップＳ２０６に進む。閾値より大きくないと判定部３３２が判定した場合（ステップＳ２０５のＮｏ）は、動作はステップＳ２０７に進む。

ステップＳ２０６において、第１実行部３３３が、第１処理を実行する。動作はステップＳ２０８に進む。

ステップＳ２０７において、第２実行部３３４が、第２処理を実行する。動作はステップＳ２０８に進む。

ステップＳ２０８において、処理部３３が、文字認識処理によって取得された文字列データを出力する。図９に示す動作は終了する。

以上、図２、図６から図９を参照して、本発明の実施形態２に係る情報処理装置１００について説明した。実施形態２によれば、情報処理装置１００は、原稿画像に含まれる第１画像の数に応じて、文字認識処理の方法を変更する。この結果、原稿画像に応じて、最適な文字認識方法を選択できる。したがって、ユーザーの利便性が向上する。

（実施形態３）
図１、図４、及び図１０を参照して、本発明の実施形態３について説明する。実施形態３の情報処理装置１００によれば、識別画像がマーキング画像ではなくても文字認識処理を実行できる。この結果、ユーザーの利便性が向上する。

実施形態３の情報処理装置１００は、識別画像が文字画像の位置する領域を特定する記号又は図形であっても文字認識処理を実行できる。文字画像の位置する領域を示す特定の記号は、例えば、鉤括弧、丸括弧、隅付き括弧である。文字画像の位置する領域を特定する図形は、例えば、下線、四角型の線図、丸型の線図、三角型の線図、及び雲形の線図である。

図１０は、実施形態３に係る原稿画像Ｇ４を示す図である。図１０は、第１画像Ｔ１１、Ｔ１２及びＴ１３を除いて、原稿画像Ｇ１と同一である。したがって、第１画像Ｔ１１、Ｔ１２及びＴ１３以外の説明を省略する。

第１画像Ｔ１１は、文字列画像Ｔ１１ａと、識別画像Ｔ１１ｂ、及びＴ１１ｃとを含む。第１画像Ｔ１２は、文字列画像Ｔ１２ａと、識別画像Ｔ１２ｂとを含む。第１画像Ｔ１３は、文字列画像Ｔ１３ａと、識別画像Ｔ１３ｂとを含む。

文字列画像Ｔ１１ａは、実施形態１、及び実施形態２で説明した文字列画像Ｔ１ａと同じである。文字列画像Ｔ１２ａは、実施形態１、及び実施形態２で説明した文字列画像Ｔ２ａと同じである。文字列画像Ｔ１３ａは、実施形態１、及び実施形態２で説明した文字列画像Ｔ３ａと同じである。したがって、文字列画像Ｔ１１ａ、Ｔ１２ｂ、及びＴ１３ｃについての説明は省略する。

識別画像Ｔ１１ｂ、及びＴ１１ｃは、鉤括弧を示す画像である。識別画像Ｔ１２ｂは、下線を示す画像である。識別画像Ｔ１３ｂは、雲形の線図を示す画像である。図１０に示すように、識別画像Ｔ１１ｂ、Ｔ１１ｃ、Ｔ１２ｂ、Ｔ１３ｂは、文字列画像Ｔ１１ａ、Ｔ１２ａ、及びＴ１３ａの位置する領域を特定している。

実施形態３の情報処理装置１００の構成は、識別画像Ｔ１１ｂ、Ｔ１１ｃ、Ｔ１２ｂ、Ｔ１３ｂを検出部３１が識別画像として検出することを除いて、実施形態１の情報処理装置１００の構成と同じである。したがって、実施形態３の情報処理装置１００の構成の説明は省略する。

また、実施形態３の情報処理装置１００の動作は、識別画像Ｔ１１ｂ、Ｔ１１ｃ、Ｔ１２ｂ、Ｔ１３ｂを検出部３１が識別画像として検出することを除いて、実施形態１の情報処理装置１００と同じ動作である。したがって、実施形態３の情報処理装置１００の動作の説明は省略する。

以上、図１、図４、及び図１０を参照して、本発明の実施形態３に係る情報処理装置１００について説明した。実施形態３によれば、情報処理装置１００は、第１画像に含まれる識別画像がマーキングキング画像でなくても、文字認識処理を実行できる。この結果、ユーザーの利便性が向上する。

なお、実施形態３に係る処理部３３は、実施形態２に係る処理部３３と同様に、計数部３３１、判定部３３２、第１実行部３３３、及び第２実行部３３４を有していてもよい。

（実施形態４）
図１、図４、図１１（ａ）、及び図１１（ｂ）を参照して、本発明の実施形態４について説明する。実施形態４の処理部３３は、文字認識処理によって取得された文字列を翻訳して出力する。この結果、ユーザーの利便性がより向上する。なお、翻訳は、所定処理の一例である。

図１１（ａ）は、翻訳前の原稿画像Ｇ５を示す図である。図１１（ｂ）は、翻訳後の画像Ｇ６を示す図である。実施形態４の情報処理装置１００は、文字認識処理によって取得された文字列を翻訳する。

図１１（ａ）に示すように、翻訳前の原稿画像Ｇ５は、翻訳の対象となる第１画像Ｔ２０を含んでいる。第１画像Ｔ２０は、文字列画像Ｔ２０ａと、識別画像Ｔ２０ｂとを含んでいる。文字列画像Ｔ２０ａは、文字列を示す画像である。図１１（ａ）において、文字列画像Ｔ２０ａは、文字列「ｂｕｒｅａｕｃｒａｔｉｃ」を示す。識別画像Ｔ２０ｂは、図２で説明した識別画像Ｔ１ｂと同じピンク色の蛍光ペンにより描画された直線状の画像である。

図１１（ｂ）に示すように、翻訳後の画像Ｇ６は、処理部３３によって翻訳された翻訳画像Ｈを含んでいる。翻訳画像Ｈは、文字列画像Ｈ１を含んでいる。文字列画像Ｈ１は、翻訳された文字列を示す画像である。図１１（ｂ）において、文字列画像Ｈ１は、文字列「官僚的な」を示す。

実施形態４の情報処理装置１００の構成は、文字認識処理を実行して得られた文字列を処理部３３が翻訳することを除いて、実施形態１の情報処理装置１００の構成と同じである。したがって、実施形態４の情報処理装置１００の構成の説明は省略する。

また、実施形態４の情報処理装置１００の動作は、文字認識処理を実行して得られた文字列を処理部３３が翻訳することを除いて、実施形態１の情報処理装置１００と同じ動作である。したがって、実施形態４の情報処理装置１００の動作の説明は省略する。

以上、図１、図４、図１１（ａ）、及び図１１（ｂ）を参照して、本発明の実施形態４に係る情報処理装置１００について説明した。実施形態４によれば、情報処理装置１００は、文字認識処理を実行して文字列を取得するだけでなく、得られた文字列を翻訳することができる。この結果、ユーザーの利便性がより向上する。

なお、実施形態４では、情報処理装置１００は英文を日本文に翻訳している。しかしながら、翻訳元の言語、及び翻訳先の言語は特に限定されない。例えば、情報処理装置１００は、日本文を英文に翻訳してもよい。

なお、実施形態４に係る処理部３３は、実施形態２に係る処理部３３と同様に、計数部３３１、判定部３３２、第１実行部３３３、及び第２実行部３３４を有していてもよい。

（実施形態５）
図１、図４、図１２（ａ）、及び図１２（ｂ）を参照して、本発明の実施形態５について説明する。実施形態５の処理部３３は、文字認識処理によって取得された文字列の表現方法を変更して出力する。処理部３３は、例えば、文字列の色、文字列の大きさ（フォントサイズ）、及び文字列の形状（フォントの種類）のうちの少なくとも一つを変更して出力する。処理部３３は、例えば、文字画像に下線を新たに付加してもよく、文字画像にマーキング画像を新たに重ねてもよい。表現方法の変更は、所定処理の一例である。

具体的には、処理部３３は、例えば、第１画像に含まれる１２ポイントの文字列を２４ポイントの文字列に変更し、変更後の文字列が用紙Ｐに印字されるように情報処理装置１００の動作を制御する。第１画像の表現方法を変更して出力することによって、第１画像は用紙Ｐ中で強調される。この結果、ユーザーの利便性がより向上する。

図１２（ａ）は、表現方法を変更する前の原稿画像Ｇ７を示す図である。図１２（ｂ）は、表現方法を変更した後の画像Ｇ８を示す図である。実施形態５の情報処理装置１００は、文字認識処理によって取得された文字列の表現方法を変更する。

図１２（ａ）に示すように、表現変更前の原稿画像Ｇ７は、表現変更の対象となる第１画像Ｔ３０を含んでいる。第１画像Ｔ３０は、文字列画像Ｔ３０ａと、識別画像Ｔ３０ｂとを含んでいる。文字列画像Ｔ３０ａは、文字列を示す画像である。図１２（ａ）において、文字列画像Ｔ３０ａは、文字列「ｂｕｒｅａｕｃｒａｔｉｃ」を示す。識別画像Ｔ３０ｂは、図２を参照して説明した識別画像Ｔ１ｂと同じピンク色の蛍光ペンにより描画された直線状の画像である。

図１２（ｂ）に示すように、表現方法を変更した後の画像Ｇ８は、変更後画像Ｓを含んでいる。変更後画像Ｓは、文字列画像Ｓ１を含んでいる。文字列画像Ｓ１は、文字列を示す画像である。文字列画像Ｓ１は、文字列「ｂｕｒｅａｕｃｒａｔｉｃ」を示す。文字列画像Ｓ１に含まれている文字列のフォントサイズは、文字列画像Ｔ３０ａに含まれている文字列のフォントサイズよりも大きい。

実施形態５の情報処理装置１００の構成は、文字認識処理を実行して得られた文字列の表現方法を処理部３３が変更することを除いて、実施形態１の情報処理装置１００の構成と同じである。したがって、実施形態５の情報処理装置１００の構成の説明は省略する。

また、実施形態５の情報処理装置１００の動作は、文字認識処理を実行して得られた文字列の表現方法を処理部３３が変更することを除いて、実施形態１の情報処理装置１００と同じ動作である。したがって、実施形態４の情報処理装置１００の動作の説明は省略する。

以上、図１、図４、図１２（ａ）及び図１２（ｂ）を参照して、本発明の実施形態５に係る情報処理装置１００について説明した。実施形態５によれば、情報処理装置１００は、文字認識処理を実行して文字列を得られた文字列の表現方法を変更することができる。この結果、ユーザーの利便性がより向上する。

なお、実施形態５に係る処理部３３は、実施形態２に係る処理部３３と同様に、計数部３３１、判定部３３２、第１実行部３３３、及び第２実行部３３４を有していてもよい。

（実施形態６）
図１、図４、及び図１３を参照して、本発明の実施形態６について説明する。実施形態６の処理部３３は、原稿画像Ｇ１の第１画像に含まれる文字画像の文字濃度が規定値以上の場合、図１を参照して説明した表示部１２２に、再読取指示情報Ｍを表示する。

文字濃度は、文字画像を構成する画素の数に対する文字を構成する画素の数の比率を示す。規定値は、例えば、６０％である。再読取指示情報Ｍは、画像読取部１０が原稿画像を前回読取った際に設定されていた解像度よりも高い解像度で、原稿画像を読取ることを指示する情報を示す。

文字濃度が高い文字画像は、例えば、画数が多い漢字を含む画像である。文字濃度が高い文字画像は、文字認識の精度が低い。第１画像が文字濃度の高い文字画像を含む場合、画像読取部１０によって原稿Ｄをより高い解像度で再度読取るように、情報処理装置１００はユーザーに指示する。ユーザーが指示にしたがった場合、文字認識の精度が高くなる。

具体的には、処理部３３は、第１画像が文字濃度の高い文字画像を含む場合、表示部１２２が指示画面Ｇ１０を表示するように、表示部１２２を制御する。

図１３は、指示画面Ｇ１０を示す図である。指示画面Ｇ１０は、再読取指示情報Ｍを表示する。再読取指示情報Ｍは、「解像度を上げて、原稿を再読取りして下さい。」を示している。ユーザーが、再読取指示情報Ｍにしたがって、例えば、解像度を２００ｄｐｉから４００ｄｐｉに変更することにより、文字認識の精度が高くなる。

実施形態６の情報処理装置１００の構成は、再読取指示情報Ｍを表示するように処理部３３が表示部１２２を制御することを除いて、実施形態１の情報処理装置１００の構成と同じである。したがって、実施形態６の情報処理装置１００の構成の説明は省略する。

また、実施形態６の情報処理装置１００の動作は、再読取指示情報Ｍを表示するように処理部３３が表示部１２２を制御することを除いて、実施形態１の情報処理装置１００と同じ動作である。したがって、実施形態６の情報処理装置１００の動作の説明は省略する。

以上、図１、図４、及び図１３を参照して、本発明の実施形態６に係る情報処理装置１００について説明した。実施形態６によれば、情報処理装置１００は、第１画像に文字濃度の高い文字が含まれている場合、原稿Ｄをより高い解像度で再読取するようユーザーに指示する。ユーザーが高い解像度での再読取を実行すれば、文字認識の精度が高まる。この結果、ユーザーの利便性がより向上する。

なお、実施形態６に係る処理部３３は、実施形態２に係る処理部３３と同様に、計数部３３１、判定部３３２、第１実行部３３３、及び第２実行部３３４を有していてもよい。

以上、図面を参照しながら本実施形態について説明した。ただし、本発明は、上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲で種々の態様において実施することが可能である（例えば、下記に示す（１）〜（２））。図面は、理解し易くするために、それぞれの構成要素を主体に模式的に示しており、図示された各構成要素の個数等は、図面作成の都合上から実際とは異なる場合がある。また、上記の実施形態で示す各構成要素の形状等は一例であって、特に限定されるものではなく、本発明の構成から実質的に逸脱しない範囲で種々の変更が可能である。

（１）本発明の実施形態では、情報処理装置１００の一例として、複合機を用いて説明したが、本発明の情報処理装置１００は、複合機に限定されない。例えば、情報処理装置１００は、スマートフォン、又はタブレット端末でもよい。情報処理装置１００が、スマートフォン、又はタブレット端末である場合、例えば、タッチパネル上に表示された画像の特定部分をドラッグすることによって、第１画像を選択する。

（２）本発明の実施形態では、第１画像は識別画像を一つ含んでいたが、第１画像は互いに異なる複数の識別画像を含み得る。この場合、識別画像の違いによって、処理内容を変更することもできる。例えば、情報処理装置１００は、識別画像が赤色のマーキング画像である第１画像は翻訳して出力し、識別画像が青色のマーキング画像である第１画像はフォントサイズを大きくして出力してもよい。

本発明は、画像形成装置の分野に利用可能である。

３１検出部
３２抽出部
３３処理部
１００情報処理装置
Ｇ１原稿画像
Ｇ２合成画像
Ｎ１、Ｎ２、Ｎ３第２画像
Ｔ１、Ｔ２、Ｔ３第１画像

Claims

文字認識処理の対象である複数の第１画像データと、文字認識処理の対象でない第２画像データとを含む原稿画像データに対して処理を実行する情報処理装置であって、
前記原稿画像データから、前記複数の第１画像データを検出する検出部と、
前記原稿画像データから、前記複数の第１画像データを抽出する抽出部と、
前記複数の第１画像データを合成して合成画像データを生成し、前記合成画像データに対して文字認識処理を実行する処理部と
を備える、情報処理装置。
前記第１画像データは、
少なくとも１つの文字画像と、
前記文字画像が文字認識処理の対象であることを示す識別画像と
を示し、
前記文字画像は１つの文字を示す、請求項１に記載の情報処理装置。
前記第１画像データの各々が、互いに異なる複数の前記識別画像を示す、請求項２に記載の情報処理装置。
前記識別画像が、前記文字画像に重なるマーキング画像である、請求項２又は請求項３に記載の情報処理装置。
前記識別画像が、前記文字画像の位置する領域を特定する記号又は図形を含む、請求項２又は請求項３に記載の情報処理装置。
前記処理部は、前記識別画像の種類に応じて処理内容を変更する、請求項２から請求項５記載のいずれか１項に記載の情報処理装置。
前記処理部は、前記文字認識処理によって取得された文字列を翻訳する、請求項６に記載の情報処理装置。
前記処理部は、前記文字認識処理によって取得された文字列の色、大きさ、及び形状のうちの少なくとも一つを変更する、請求項６に記載の情報処理装置。
前記処理部は、前記文字画像の文字濃度を算出して、前記文字濃度に基づいて所定処理を実行し、
前記文字濃度は、前記文字画像を構成する画素の数に対する前記文字を構成する画素の数の比率を示す、請求項２から請求項８のいずれか１項に記載の情報処理装置。
予め設定された解像度で原稿から原稿画像を読取り、前記原稿画像データを生成する画像読取部と、
表示部と
を更に備え、
前記所定処理は、前記文字濃度が規定値以上の場合に、再読取指示情報を表示するように前記表示部を制御する処理であり、
前記再読取指示情報は、前記画像読取部が前記原稿画像を前回読取った際に設定されていた解像度よりも高い解像度で、前記原稿画像を読取ることを指示する情報を示す、請求項９に記載の情報処理装置。
文字認識処理の対象である複数の第１画像データと、文字認識処理の対象でない第２画像データとを含む原稿画像データに対して処理を実行する情報処理方法であって、
前記原稿画像データから、前記複数の第１画像データを検出するステップと、
前記原稿画像データから、前記複数の第１画像データを抽出するステップと、
前記複数の第１画像データを合成して合成画像データを生成し、前記合成画像データに対して文字認識処理を実行するステップと
を含む、情報処理方法。