JP2018025885A

JP2018025885A - 画像処理装置

Info

Publication number: JP2018025885A
Application number: JP2016155938A
Authority: JP
Inventors: 健西尾; Takeshi Nishio
Original assignee: Kyocera Document Solutions Inc
Current assignee: Kyocera Document Solutions Inc
Priority date: 2016-08-08
Filing date: 2016-08-08
Publication date: 2018-02-15
Anticipated expiration: 2036-08-08
Also published as: US20180039847A1; US10503993B2; JP6531738B2

Abstract

【課題】ユーザーの誤った操作により、文字と重なるようにＯＣＲ処理を行う範囲が指定された場合であっても、ユーザーが所望する範囲に示される文字を抽出することを可能にする。【解決手段】画像処理装置は、画像データの指定された範囲を検出範囲として、当該検出範囲に含まれる線画像を検出するとともに、当該検出された線画像を解析して、当該線画像が示す文字を特定するＯＣＲ処理を実行するＯＣＲ処理部を備える。そして、ＯＣＲ処理部は、ＯＣＲ処理において線画像が示す文字を特定できなかった場合に、線画像が文字の一部分を示しているか否かを判定し、線画像が文字の一部分を示していると判定した時に、当該文字の一部分以外の他の部分が存在していると想定される方向に検出範囲を広げ、当該広げた検出範囲において再度ＯＣＲ処理を実行する。【選択図】図４

Description

本発明は、画像処理装置に関し、特に、画像データから文字を抽出するＯＣＲ（Optical character recognition）処理技術に関する。

画像データの全体に対してＯＣＲ処理を行うのではなく、画像データの指定された範囲にＯＣＲ処理を行い、当該指定された範囲に示された文字を抽出する技術が知られている。ユーザーは、所望の範囲を指定することで所望の文字を抽出させることができる。

ＯＣＲ処理を行う範囲を指定する方法としては、例えば、ユーザーが原稿に対してマーカーペンにより所望の範囲をマーキングする方法がある。このマーキングされた原稿を読み取り、当該原稿の読み取りにより生成された画像データを解析してマーキングされた箇所を特定することにより、ＯＣＲ処理を行う範囲を特定することができる（例えば、下記の特許文献１参照）。上記の技術によれば、原稿に対して手書きでマーキングなどの印を記入するという直感的かつ簡易な操作で、ユーザーがＯＣＲ処理を行う範囲を指定することができる。

特開２００４−１６６０６２号公報

しかしながら上記の技術のように、原稿に対して手書きでマーキングなどの印を記入するという操作でＯＣＲ処理を行う範囲を指定する場合、ユーザーが誤って文字と重なるように印を記入してしまう場合がある。この場合、文字と重なるようにＯＣＲ処理を行う範囲が指定されることになるため、ユーザーが所望する範囲に示される文字を抽出できないおそれがある。

本発明は、上記の事情に鑑みなされたものであり、ユーザーの誤った操作により、文字と重なるようにＯＣＲ処理を行う範囲が指定された場合であっても、ユーザーが所望する範囲に示される文字を抽出することを可能にすることを目的とする。

本発明の一局面にかかる画像処理装置は、画像データの指定された範囲を検出範囲として、当該検出範囲に含まれる線画像を検出するとともに、当該検出された線画像を解析して、当該線画像が示す文字を特定するＯＣＲ処理を実行するＯＣＲ処理部を備え、前記ＯＣＲ処理部は、前記ＯＣＲ処理において前記線画像が示す文字を特定できなかった場合に、前記線画像が文字の一部分を示しているか否かを判定し、前記線画像が文字の一部分を示していると判定した時に、当該文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を広げ、当該広げた検出範囲において再度前記ＯＣＲ処理を実行する、画像処理装置である。

本発明によれば、ユーザーの誤った操作により、文字と重なるようにＯＣＲ処理を行う範囲が指定された場合であっても、ユーザーが所望する範囲に示される文字を抽出することが可能となる。

本発明の一実施形態にかかる画像形成装置を示す斜視図である。本発明の一実施形態にかかる画像形成装置の内部構成を示すブロック図である。本発明の一実施形態にかかる画像形成装置による処理対象となる原稿の一例を示す図である。本発明の一実施形態にかかる画像形成装置の動作の流れを示すフローチャートである。マーカー箇所、検出範囲、および拡大後の検出範囲の一例を示す図である。変形例にかかる画像形成装置の動作の流れを示すフローチャートである。マーカー箇所、検出範囲、および拡大後の検出範囲の一例を示す図である。（Ａ）は、補足にかかる画像形成装置による処理対象となる原稿の一例を示す図であり、（Ｂ）は、検出範囲および拡大後の検出範囲の一例を示す図である。マーカー箇所、検出範囲、および拡大後の検出範囲の一例を示す図である。

以下、本発明の一実施形態にかかる画像処理装置の一例である画像形成装置について図面を参照して説明する。

図１は、本発明の一実施形態にかかる画像形成装置を示す斜視図である。図２は、画像形成装置の内部構成を示すブロック図である。

画像形成装置１０は、例えば、コピー機能、プリンター機能、スキャナー機能、及びファクシミリ機能などの複数の機能を兼ね備えた複合機である。画像形成装置１０は、装置本体１１と、装置本体１１の上方に配置された画像読取部１１０と、画像読取部１１０と装置本体１１との間に設けられた連結部１２とから概略構成される。

装置本体１１は、画像形成部１２０や給紙部１３などを備えて構成されている。

画像形成装置１０が画像読取動作を行う場合、後述する動作制御部１０２による制御のもと、画像読取部１１０（画像データ取得部）が原稿載置台１１１に載置された原稿束を順次読み取り、複数のページからなる画像データを生成（取得）する。当該画像データは、記憶部１６０に記憶される。なお、画像形成装置１０は、画像読取部１１０が原稿束を読み取って画像データを取得するのではなく、通信部１７０がＰＣ（Personal Computer）などの他の情報処理装置から画像データを受信することで原稿を示す画像データを取得してもよい。

画像形成装置１０が画像形成動作を行う場合は、記憶部１６０に記憶された画像データなどに基づいて、動作制御部１０２による制御のもと、画像形成部１２０が給紙部１３から給紙される記録紙にトナー像を形成する。その後、記録紙上に形成されたトナー像は、不図示の定着部により熱定着される。定着処理の完了した画像形成済みの記録紙は、排出トレイ１４に排出される。

画像形成装置１０の外郭を構成する筐体の前面には、表示部１３０および操作部１５０が配置されている。表示部１３０は、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）や有機ＥＬ（ＯＬＥＤ：Organic Light-Emitting Diode）ディスプレイを含んで構成される。表示部１３０は動作制御部１０２による制御のもと、メニュー画面などを表示する。

表示部１３０の前面には、タッチパネル１４０が配置されている。タッチパネル１４０は、所謂抵抗膜方式や静電容量方式などのタッチパネルであって、タッチパネル１４０上におけるユーザーによる接触（タッチ）をその接触位置とともに検知する。

操作部１５０は、例えば、メニューを呼び出すメニューキー、メニューを構成するＧＵＩのフォーカスを移動させる矢印キー、メニューを構成するＧＵＩに対して確定操作を行う決定キーなどを備えるハードキーである。

記憶部１６０は、ＨＤＤなどの大容量の記憶装置である。

通信部１７０は、無線ＬＡＮボードなどの通信モジュールから構成されるネットワークインターフェイスである。

画像形成装置１０は、更に、制御ユニット１００を備えている。制御ユニット１００は、ＣＰＵ（Central Processing Unit）、ＲＡＭ(Random Access Memory）、及びＲＯＭ（Read Only Memory）などから構成される。制御ユニット１００は、上記のＲＯＭまたは記憶部１６０に記憶されたプログラムが上記のＣＰＵに実行されることにより、制御部１０１、動作制御部１０２、操作受付部１０３、通信制御部１０４、マーカー検出部１０５、およびＯＣＲ処理部１０６として機能する。なお、制御ユニット１００の上記の各構成は、プログラムに基づく動作によらず、それぞれハード回路により構成されてもよい。

制御部１０１は、画像形成装置１０の全体的な動作制御を司る。

操作受付部１０３は、タッチパネル１４０から出力される検知信号に基づき、タッチパネル１４０に対するユーザー操作を受け付ける機能を有する。また、操作受付部１０３は、ハードキーなどの操作部１５０を用いたユーザー操作を受け付ける機能を有する。

通信制御部１０４は、通信部１７０による通信動作を制御する機能を有する。通信部１７０は、通信制御部１０４による制御のもと、ＰＣなどの他の情報処理装置へ画像データを送信する。

動作制御部１０２は、画像読取部１１０による画像読取動作や表示部１３０による表示動作などを制御する機能を有する。

マーカー検出部１０５は、画像読取部１１０が原稿を読み取って取得した画像データを解析して、原稿においてマーカーによりマーキングされたマーカー箇所を検出する機能を有する。

ＯＣＲ処理部１０６は、画像読取部１１０が原稿を読み取って取得した画像データのうち、マーカー検出部１０５が検出したマーカー箇所により示される範囲をＯＣＲ処理対象の検出範囲として特定し、当該特定した検出範囲に対してＯＣＲ処理を行うことで文字を抽出する機能を有する。

具体的には、ＯＣＲ処理部１０６は、マーカー検出部１０５が検出したマーカー箇所上の領域、またはマーカー箇所により囲われる領域を上記の検出範囲として特定する。そして、ＯＣＲ処理部１０６は、当該検出領域に対してエッジ検出を行うことで、検出範囲に含まれる線（線画像）を検出する。ここで、記憶部１６０には、ひらがな、カタカナ、漢字、アルファベットなどの各種の文字のそれぞれについて、文字を構成する線分の軌跡および位置関係を示す情報（線同士の交点の位置情報、線の端点の位置情報、および線の軌跡をベクトル化した情報などを含む）を示した文字データベースが記憶されている。ＯＣＲ処理部１０６は、記憶部１６０に記憶されている当該文字データベースを参照して、上記で検出した線から構成される文字を検出する。具体的には、ＯＣＲ処理部１０６は、文字データベースに含まれる各文字に対して、線分の軌跡および位置関係から算出される線画像との類似度を算出し、当該算出された類似度が予め定められた第１の値以上である文字を、線画像が示す文字として特定する。

図３は、画像形成装置１０による処理対象となる原稿の一例を示す図である。原稿ａ１には、マーカーペンを用いてマーキングされた複数のマーカー箇所ｍ１〜ｍ３が印されている。画像読取部１１０は、当該原稿ａ１を読み取って画像データを生成する。そして、マーカー検出部１０５が当該生成された画像データからマーカー箇所ｍ１〜ｍ３を抽出するとともに、ＯＣＲ処理部１０６がマーカー箇所ｍ１〜ｍ３上の領域を検出範囲としたＯＣＲ処理を行う。

続いて、上記の構成を備える画像形成装置１０の画像読取動作について説明する。図４は、画像形成装置１０のＯＣＲ処理動作の流れを示すフローチャートである。

操作受付部１０３が画像読取指示を受け付けると（ステップＳ１０においてＹＥＳ）、動作制御部１０２は、画像読取部１１０を制御して画像読取処理を実行する（ステップＳ１１）。当該ステップＳ１１の処理により、画像読取部１１０は、原稿を示す画像データを取得する。

マーカー検出部１０５は、ステップＳ１１の処理で画像読取部１１０が取得した画像データを解析して、画像データに含まれるマーカー箇所を検出するマーカー検出処理を行う（ステップＳ１２）。

マーカー箇所が検出されなかった場合（ステップＳ１３においてＮＯ）、ＯＣＲ処理部１０６は、画像データの全体を検出範囲として特定し、画像データ全体に対してＯＣＲ処理を実行する（ステップＳ１４）。そして、ＯＣＲ処理部１０６は、ステップＳ１４のＯＣＲ処理で抽出した文字を出力する処理を行う（ステップＳ１５）。ＯＣＲ処理部１０６は、例えば、抽出した文字を記憶部１６０に記憶させる処理、通信部１７０にＰＣなどの他の情報処理装置へ抽出した文字を送信させる処理、および表示部１３０に抽出した文字を表示させる処理などを上記の出力処理として実行する。

マーカー箇所が検出された場合（ステップＳ１３においてＹＥＳ）、ＯＣＲ処理部１０６は、マーカー箇所により示される範囲を検出処理として特定し（ステップＳ１６）、当該検出範囲に対してＯＣＲ処理を実行する（ステップＳ１７）。

ＯＣＲ処理では検出領域に対してエッジ検出を行うことで検出範囲に含まれる線を検出するが、当該検出された線の全てについて文字を検出に成功した場合（ステップＳ１８においてＮＯ）、ＯＣＲ処理部１０６は、ステップＳ１５の検出文字を出力する処理を行う。

一方、線が検出されたが当該検出された線から構成される文字の検出に失敗したものが存在する場合（ステップＳ１８においてＹＥＳ）、ＯＣＲ処理部１０６は、文字検出に失敗した線が文字の一部であるか否かを判定する（ステップＳ１９）。

ステップＳ１９の処理において、ＯＣＲ処理部１０６は、記憶部１６０に記憶された既述の文字データベースに示される文字を構成する線の位置情報を参照して、文字検出に失敗した線と文字データベースに示される文字との類似度を算出する。そして、算出した類似度が記述の第１の値より小さい予め定められた第２の値以上である文字が存在する場合、ＯＣＲ処理部１０６は、文字検出に失敗した線が文字の一部分を構成するものであることを判定する。一方、算出した類似度が予め定められた値以上の文字が存在しない場合、ＯＣＲ処理部１０６は、文字検出に失敗した線が文字の一部分を構成するものではないことを判定する。

文字検出に失敗した線が文字の一部分を構成しない場合（ステップＳ２０においてＮＯ）、ＯＣＲ処理部１０６は、ステップＳ１５の検出文字を出力する処理を行う。

一方、文字検出に失敗した線が文字の一部分を構成する場合（ステップＳ２０においてＹＥＳ）、ＯＣＲ処理部１０６は、文字の検出に成功した範囲に含まれる文字の並びに沿った方向を特定する（ステップＳ２１）。そして、ＯＣＲ処理部１０６は、文字の検出に成功した範囲を文字の並びに沿った方向に広げることで検出範囲を広げ（ステップＳ２２）、当該広げた検出範囲に対してＯＣＲ処理を再度実行する（ステップＳ２３）。

ステップＳ１６〜ステップＳ２３について、図５を用いて更に具体的に説明する。図５は、マーカー箇所、検出範囲、および拡大後の検出範囲の一例を示す図である。

マーカーペンによるマーキングはユーザーの手書きにより行われるため、誤ってマーカー箇所により示される範囲が文字と重なるように、マーカー箇所が記入される場合がある。図５に示す例では、第１段に示すように、マーカー箇所ｍ３が文字の並びに対して斜め方向に記入されている。この結果、マーカー箇所ｍ３により示される範囲が、「示される」といった文字に対しては重ならないが、その一方で、「表」や「確認画面」といった文字に対しては重なっている。

ＯＣＲ処理部１０６は、図５の第１段に示されるマーカー箇所ｍ３により示される範囲に対してＯＣＲ処理を行うことで、「示される」といった文字については文字の検出に成功する。この結果、図５の第２段に示される点線ｂ１で示される範囲が、文字の検出に成功した範囲となる。その一方で、「表」や「確認画面」といった文字については文字の検出に失敗する。

ＯＣＲ処理部１０６は、文字の検出に成功した範囲ｂ１に含まれる「示される」といった文字の並びに沿った方向に、文字の検出に成功した範囲ｂ１を広げる。この結果、図５の第３段に示される点線ｂ２で示される範囲が、新たな検出範囲となり、ＯＣＲ処理部１０６は、当該新たな検出範囲ｂ２に対してＯＣＲ処理を再度実行する。新たな検出範囲ｂ２は、「表」や「確認画面」といった文字と重ならないため、ＯＣＲ処理部１０６は、「表」や「確認画面」といった一度目のＯＣＲ処理で検出できなかった文字を検出することができる。

図４に戻って、ＯＣＲ処理部１０６は、ステップＳ２３の処理後、再度ステップＳ１８の処理を行う。そして、拡大後の検出範囲について、線が検出されたが当該検出された線から構成される文字の検出に失敗したものが存在する場合（ステップＳ１８においてＹＥＳ）、ＯＣＲ処理部１０６は、再度ステップＳ１９〜ステップＳ２３の処理を行う。一方、拡大後の検出範囲について、検出された線の全てについて文字の検出に成功した場合（ステップＳ１８においてＮＯ）、ＯＣＲ処理部１０６は、ステップＳ１５の検出文字を出力する処理を行う。

以上のように、上記の実施形態にかかる画像形成装置１０によれば、ユーザーの誤った操作により、文字と重なるようにＯＣＲ処理を行う範囲が指定された場合であっても、ユーザーが所望する範囲に示される文字を抽出することが可能となる。

なお、本発明は、上記の実施形態の構成に限られず種々の変形が可能である。

＜変形例１＞
図６は、変形例１にかかる画像形成装置のＯＣＲ処理動作の流れを示すフローチャートである。図４に示したフローチャートと同様の処理については、同符号を付して説明を略する。

変形例１にかかる画像形成装置では、線が検出されたが当該検出された線から構成される文字の検出に失敗したものが存在する場合（ステップＳ１８においてＹＥＳ）、ＯＣＲ処理部１０６がステップＳ３０の処理を実行する。

ここで、記憶部１６０には、既述の文字データベースに加えて、文字を構成する一部の要素を構成する線分の軌跡および位置関係を示す位置情報（線同士の交点の位置情報、線の端点の位置情報、および線の軌跡をベクトル化した情報などを含む）を示した文字要素データベースが記憶されている。文字を構成する一部の要素とは、例えば、漢字を構成する偏、旁、冠、脚、構、垂、または繞を含む部首である。

ＯＣＲ処理部１０６は、ステップＳ３０の処理において、記憶部１６０に記憶された文字要素データベースに示される部首を構成する線の位置情報を参照して、文字検出に失敗した線と文字要素データベースに示される部首との類似度を算出する。そして、算出した類似度が予め定められた第３の値以上の部首が存在する場合、ＯＣＲ処理部１０６は、文字検出に失敗した線が部首を構成し、文字の一部分を構成するものであることを判定する。一方、算出した類似度が予め定められた第３の値以上の部首が存在しない場合、ＯＣＲ処理部１０６は、文字検出に失敗した線が部首を構成せず、文字の一部分を構成するものでないことを判定する。

文字検出に失敗した線が部首を構成しない場合（ステップＳ３１においてＮＯ）、ＯＣＲ処理部１０６は、ステップＳ１５の検出文字を出力する処理を行う。

一方、文字検出に失敗した線が部首を構成する場合（ステップＳ３１においてＹＥＳ）、ＯＣＲ処理部１０６は、部首の種別に基づいて、当該部首以外を構成する線が位置する方向を特定する（ステップＳ３２）。例えば、検出した部首がウ冠などの冠である場合、ＯＣＲ処理部１０６は、部首以外を構成する線が部首の下方に位置することを特定する。また、例えば、検出した部首が三水などの辺である場合、ＯＣＲ処理部１０６は、部首以外を構成する線が部首の右側に位置することを特定する。

ステップＳ３２の処理後、ＯＣＲ処理部１０６は、ステップＳ１７のＯＣＲ処理において文字の検出に成功した範囲を、ステップＳ３２の処理で特定した方向に広げることで検出範囲を拡大し（ステップＳ３３）、当該拡大した検出範囲に対してＯＣＲ処理を再度実行する（ステップＳ３４）。

ステップＳ３０〜ステップＳ３４について、図７を用いて更に具体的に説明する。図７は、マーカー箇所、検出範囲、および拡大後の検出範囲の一例を示す図である。

図７に示す例では、第１段に示すように、マーカー箇所ｍ４が記入されているが、マーカー箇所ｍ４により示される範囲が、「火大会」といった文字に対しては重ならないが、その一方で、「花」といった文字に対しては重なっている。

ＯＣＲ処理部１０６は、図５の第１段に示されるマーカー箇所ｍ４により示される範囲に対してＯＣＲ処理を行うことで、「火花火」といった文字については文字の検出に成功する。この結果、図７の第２段に示される点線ｂ３で示される範囲が、文字の検出に成功した範囲となる。その一方で、「花」といった文字については文字の検出に失敗する。

ＯＣＲ処理部１０６は、文字の検出に失敗した線が部首を構成するか否かを判定する。図７の第２段に示される例では、ＯＣＲ処理部１０６は、文字の検出に失敗した範囲ｂ４に含まれる線が草冠を構成することを特定する。そして、ＯＣＲ処理部１０６は、草冠以外を構成する線が草冠の下方に位置することを特定し、文字の検出に失敗した範囲ｂ４を下方に広げることで検出範囲を拡大する。この結果、図７の第３段に示される点線ｂ５で示される範囲が、新たな検出範囲となり、ＯＣＲ処理部１０６は、当該新たな検出範囲ｂ５に対してＯＣＲ処理を再度実行する。新たな検出範囲ｂ５は、「花」といった文字と重ならないため、ＯＣＲ処理部１０６は、「花」といった一度目のＯＣＲ処理で検出できなかった文字を検出することができる。

以上のように、変形例１にかかる画像形成装置によれば、文字検出に失敗した線が部首などの要素を構成するか否かを判定することにより、文字検出に失敗した線が文字の一部分であるか否かを判定することができる。

＜変形例２＞
変形例２にかかる画像処理装置では、ＯＣＲ処理部１０６が、文字の一部分以外の他の部分が存在していると想定される方向に検出範囲を予め定められた長さ分広げ、当該予め定められた長さ分広げた検出範囲において再度ＯＣＲ処理を実行する。そして、当該ＯＣＲ処理で線画像が示す文字を特定できなかった場合、ＯＣＲ処理部１０６は、文字の一部分以外の他の部分が存在していると想定される方向に検出範囲を予め定められた長さ分更に広げてＯＣＲ処理を実行する。

このように、変形例２にかかる画像処理装置では、検出範囲を予め定められた長さ分だけ広げる処理を、線画像が示す文字を特定できるまで行うことで、文字と重なるようにＯＣＲ処理を行う範囲が指定された場合であっても、ユーザーが所望する範囲に示される文字を抽出することが可能となる。

＜変形例３＞
変形例３にかかる画像処理装置では、ＯＣＲ処理部１０６が、広げた検出範囲においてＯＣＲ処理を再度実行した場合において線画像が示す文字を特定できなかったときに、広げる前の検出範囲においてＯＣＲ処理を実行する。

検出範囲を広げたが文字を特定できなかった場合、以前のＯＣＲ処理において何らかのエラーにより文字を特定できなかったことが考えられる。このような場合、変形例３にかかる画像処理装置では、広げる前の検出範囲においてＯＣＲ処理を実行する。これにより、以前のＯＣＲ処理において何らかのエラーにより特定できなかった文字を特定することができる。

なお、ＯＣＲ処理では、検出領域に対してエッジ検出を行うことで、検出範囲に含まれる線（線画像）を検出する。このエッジ検出を行う方法には、様々なものがあり、処理時間が短いがエッジ検出の精度が劣る方法（第１の方法）や処理時間が長いがエッジ検出の精度が高い方法（第２の方法）がある。ＯＣＲ処理部１０６は、初回のＯＣＲ処理において上記の第１の方法によりエッジ検出を行い、二回目以降のＯＣＲ処理において上記の第２の方法によりエッジ検出を行うとしてもよい。

＜変形例４＞
変形例４にかかる画像処理装置では、ＯＣＲ処理部１０６が、広げた検出範囲においてＯＣＲ処理を再度実行した場合において線画像が示す文字を特定できなかったときに、当該広げた検出範囲を予め定められた長さ分狭め、当該狭めた検出範囲においてＯＣＲ処理を実行する。そして、当該ＯＣＲ処理で線画像が示す文字を特定できなかった場合、ＯＣＲ処理部１０６は、検出範囲を予め定められた長さ分更に狭めてＯＣＲ処理を実行する。

検出範囲を広げたが文字を特定できなかった場合、以前のＯＣＲ処理において何らかのエラーにより文字を特定できなかったことが考えられる。このような場合、変形例４にかかる画像処理装置では、検出範囲を予め定められた長さ分更に狭めてＯＣＲ処理を再度実行する。これにより、以前のＯＣＲ処理において何らかのエラーにより特定できなかった文字を特定することができる。

＜補足１＞
上記の実施形態および変形例では、マーカーペンを用いたマーキングによりＯＣＲ処理を施す検出範囲を指定する場合を説明したが、本発明は必ずしもこの場合に限定されない。補足１にかかる画像形成装置では、ＯＣＲ処理を施す検出範囲が予め定められている。図８（Ａ）は、画像形成装置１０による処理対象となる原稿の一例を示す図である。原稿ａ２には、文字記入欄ｈｌおよびｈ２が設けられており、当該文字記入欄ｈ１およびｈ２の内部がＯＣＲ処理を施す検出範囲として予め定められている。原稿ａ２の文字記入欄ｈ１およびｈ２には、ユーザーが手書きにより文字を記入する。このため、誤って文字記入欄ｈ１およびｈ２の枠に重なるように文字が記入される場合がある。図８（Ａ）に示す例では、「海」といった文字が文字記入欄ｈ２の枠に重なっている。

ＯＣＲ処理部１０６は、図８（Ｂ）の第１段に示される文字記入欄ｈ１により示される範囲に対してＯＣＲ処理を行うことで、「山田」といった文字については文字の検出に成功する。この結果、図８（Ｂ）の第１段に示される点線ｂ６で示される範囲が、文字の検出に成功した範囲となる。その一方で、「海」といった文字については文字の検出に失敗する。

ＯＣＲ処理部１０６は、文字の検出に失敗した線が部首を構成するか否かを判定する。図８（Ｂ）の第１段に示される例では、ＯＣＲ処理部１０６は、文字の検出に失敗した範囲ｂ７に含まれる線が三水を構成することを特定する。そして、ＯＣＲ処理部１０６は、三水以外を構成する線が三水の右側に位置することを特定し、文字の検出に失敗した範囲ｂ７を右側に広げることで検出範囲を拡大する。この結果、図８（Ｂ）の第２段に示される点線ｂ８で示される範囲が、新たな検出範囲となり、ＯＣＲ処理部１０６は、当該新たな検出範囲ｂ８に対してＯＣＲ処理を再度実行する。新たな検出範囲ｂ８は、「海」といった文字と重ならないため、ＯＣＲ処理部１０６は、「海」といった一度目のＯＣＲ処理で検出できなかった文字を検出することができる。

＜補足２＞
上記の実施形態および変形例では、ひらがなおよび漢字で示された文字に対してＯＣＲ処理を行う場合を説明したが、本発明は必ずしもこの場合に限定されない。以下では、アルファベットの文字に対して、上記の実施形態および変形例で示した画像処理装置を適用する場合を説明する。

図９の第１段に示す例では、マーカー箇所ｍ５より示される検出範囲に「Ｒ」のアルファベットが重なっている。このため、ＯＣＲ処理部１０６は、図中の点線ｂ９で示す「Ｒ」の右側部分を構成する線については文字の検出に失敗する。

ここで、記憶部１６０に記憶されている文字データベースには、「Ｒ」、「ｑ」、「Ｐ」といったアルファベットを構成する線の位置情報（アルファベットの軌跡をベクトル化した情報、線同士の交点の位置情報、および線の端点の位置情報などを含む）が示されている。ＯＣＲ処理部１０６は、この文字データベースを参照して、点線ｂ９で示す「Ｒ」の右側部分と予め定められた値以上の位置の類似度を有するアルファベットが存在するか否かを特定し、存在する場合には、図９の第１段に示すように検出範囲を広げる。そして、ＯＣＲ処理部１０６は、拡大した検出範囲ｂ１０に対してＯＣＲ処理を行うことにより「Ｒ」のアルファベットを検出する。

図９の第２段および第３段に示す例についても、ＯＣＲ処理部１０６は、上記と同様の処理を行うことにより検出することができる。図９の第２段には、「ｑ」の下側部分がマーカー箇所ｍ６となっており、ＯＣＲ処理部１０６は、点線ｂ１１で示す部分と予め定められた値以上の位置の類似度を有するアルファベットが存在するか否かを特定し、存在する場合には、図９の第２段に示すように検出範囲を広げる。そして、ＯＣＲ処理部１０６は、拡大した検出範囲ｂ１２に対してＯＣＲ処理を行うことにより「ｑ」のアルファベットを検出する。

また、図９の第３段には、「Ｐ」の下側部分がマーカー箇所ｍ７となっており、ＯＣＲ処理部１０６は、点線ｂ１３で示す部分と予め定められた値以上の位置の類似度を有するアルファベットが存在するか否かを特定し、存在する場合には、図９の第３段に示すように検出範囲を広げる。そして、ＯＣＲ処理部１０６は、拡大した検出範囲ｂ１３に対してＯＣＲ処理を行うことにより「Ｐ」のアルファベットを検出する。

このように、上記の実施形態および変形例で示した画像処理装置は、アルファベットの文字に対してもＯＣＲ処理を行うことができるが、その他の言語の文字に対しても同様の処理を行うことによりＯＣＲ処理を行うことができる。

１０画像形成装置
１００制御ユニット
１０１制御部
１０２動作制御部
１０３操作受付部
１０４通信制御部
１０５マーカー検出部
１０６ＯＣＲ処理部
１１０画像読取部
１６０記憶部

Claims

画像データの指定された範囲を検出範囲として、当該検出範囲に含まれる線画像を検出するとともに、当該検出された線画像を解析して、当該線画像が示す文字を特定するＯＣＲ処理を実行するＯＣＲ処理部を備え、
前記ＯＣＲ処理部は、前記ＯＣＲ処理において前記線画像が示す文字を特定できなかった場合に、前記線画像が文字の一部分を示しているか否かを判定し、前記線画像が文字の一部分を示していると判定した時に、当該文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を広げ、当該広げた検出範囲において再度前記ＯＣＲ処理を実行する、画像処理装置。
前記ＯＣＲ処理部は、前記検出範囲内に前記線画像が示す文字を特定することができた第１の範囲が存在する場合、当該第１の範囲に含まれる文字の並びに沿った方向を、前記文字の一部分以外の他の部分が存在していると想定される方向として決定して前記検出範囲を広げる、請求項１に記載の画像処理装置。
複数の文字を構成する線分の軌跡および位置関係を示す文字データベースを記憶した記憶部を更に備え、
前記ＯＣＲ処理部は、（i）前記文字データベースに含まれる各文字に対して、前記線分の軌跡および位置関係から算出される前記線画像との類似度を算出し、（ii）当該算出された類似度が予め定められた第１の値以上である文字を、前記線画像が示す文字として特定し、（iii）当該算出された類似度が前記第１の値未満であり、かつ、前記第１の値より小さい予め定められた第２の値以上である文字を、前記線画像が一部分を示している文字として特定する、請求項１または請求項２に記載の画像処理装置。
漢字を構成する偏、旁、冠、脚、構、垂、または繞を含む部首を構成する線分の軌跡および位置関係を示す部首データベースを記憶した記憶部を更に備え、
前記ＯＣＲ処理部は、前記部首データベースに含まれる各部首に対して、前記線分の軌跡および位置関係から算出される前記線画像との類似度を算出し、当該算出された類似度が予め定められた第３の値以上である部首を、前記線画像が示す部首として特定するとともに、前記線画像が文字の一部分を示していると判定する、請求項１に記載の画像処理装置。
前記ＯＣＲ処理部は、前記線画像が示す部首を特定した場合、当該特定した部首が偏、旁、冠、脚、構、垂、または繞の何れであるかに基づいて、前記文字の他の部分が存在していると想定される方向を決定して前記検出範囲を広げる、請求項４に記載の画像処理装置。
前記ＯＣＲ処理部は、前記文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を予め定められた長さ分広げ、当該予め定められた長さ分広げた検出範囲において再度前記ＯＣＲ処理を実行し、当該ＯＣＲ処理で前記線画像が示す文字を特定できなかった場合、前記文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を予め定められた長さ分更に広げて前記ＯＣＲ処理を実行する、請求項１乃至請求項５の何れか１項に記載の画像処理装置。
前記ＯＣＲ処理部は、前記広げた検出範囲において前記ＯＣＲ処理を再度実行した場合において前記線画像が示す文字を特定できなかったときに、広げる前の検出範囲において前記ＯＣＲ処理を実行する、請求項１乃至請求項５の何れか１項に記載の画像処理装置。
前記ＯＣＲ処理部は、前記広げた検出範囲において前記ＯＣＲ処理を再度実行した場合において前記線画像が示す文字を特定できなかったときに、当該広げた検出範囲を予め定められた長さ分狭め、当該狭めた検出範囲において前記ＯＣＲ処理を実行し、当該ＯＣＲ処理で前記線画像が示す文字を特定できなかった場合、前記検出範囲を予め定められた長さ分更に狭めて前記ＯＣＲ処理を実行する、請求項１乃至請求項５の何れか１項に記載の画像処理装置。
前記画像データに示されるマーカー箇所を検出するマーカー検出部を更に備え、
前記ＯＣＲ処理部は、前記マーカー検出部が検出したマーカー箇所により示される範囲を前記検出範囲として特定する、請求項１乃至請求項８の何れか１項に記載の画像処理装置。