JP2007172276A

JP2007172276A - 画像処理装置

Info

Publication number: JP2007172276A
Application number: JP2005368828A
Authority: JP
Inventors: Takashi Osawa; 隆大澤; Ayumi Seki; 歩瀬木; Takaaki Sumitomo; 高明住友
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2005-12-21
Filing date: 2005-12-21
Publication date: 2007-07-05

Abstract

【課題】利用者の指示誤りを防止し、ＯＣＲの精度を向上させて検索を容易にできる画像処理装置を提供する。
【解決手段】原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得し、画像データに含まれる文字を認識して、文字列情報を生成し、当該生成した文字列情報の量が、原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行って、原稿種別情報を含む履歴情報を生成して保持し、当該保持されている履歴情報が所定の検索処理に供される画像処理装置である。
【選択図】図１

Description

本発明は、複写機やスキャナ等によって読み取られる等して得られる画像を処理する画像処理装置に関する。

近年では、複写機等で複写された画像データの履歴を保持することにより、特定の画像データの形成日時や形成指示者を追跡可能とする技術がある（特許文献１）。また、光学的文字認識処理（ＯＣＲ）等によって、画像データに含まれる文字列情報を抽出し、画像データに関連づけて記憶しておくことで、キーワードを用いて画像データを検索できるようにしているものもある。
特開２００２−１６７８８号公報

しかしながら、上記従来の技術においては、ＯＣＲの精度によってはキーワードの抽出が適切に行なわれない場合がある。例えば利用者がテキスト主体の原稿を読み取るときに、誤ってイメージ主体の原稿であるとして設定してしまうと、イメージに適した画像処理が行なわれる結果、文字の画像がぼやけてＯＣＲ処理の精度が低下してしまう場合がある。このように従来の技術では、利用者の設定誤り等によってＯＣＲの精度が低下し、検索が容易でなくなる場合がある。

本発明は上記実情に鑑みて為されたもので、利用者の指示誤りを防止し、ＯＣＲの精度を向上させて検索を容易にできる画像処理装置を提供することを、その目的の一つとする。

上記従来例の問題点を解決するための本発明は、画像処理装置であって、原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する手段と、前記画像データに含まれる文字を認識して、文字列情報を生成する手段と、前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う手段と、前記原稿種別情報を含む履歴情報を生成して保持する手段と、を含み、当該保持されている履歴情報が所定の検索処理に供されることを特徴としている。

ここで前記文字列量条件は、原稿種別情報がイメージ主体であるときに、文字列情報の量が予め定めたしきい値を超えないとの条件であってもよい。また前記履歴情報を保持する手段は、履歴情報に、さらに文字列情報の量を含めることとしてもよい。さらに前記文字列情報を提示して、編集をさせる手段をさらに含み、当該提示ないし編集された文字列情報が前記履歴情報に含めて保持されることとしてもよい。

本発明の一態様は、画像処理装置の制御方法であって、原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する工程と、前記画像データに含まれる文字を認識して、文字列情報を生成する工程と、前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う工程と、を含むことを特徴としている。

本発明の別の態様はプログラムであって、コンピュータに対して、原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する手順と、前記画像データに含まれる文字を認識して、文字列情報を生成する手順と、前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う手順と、を実行させることを特徴としている。

本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る画像処理装置は、例えば複写機であって、図１に示すように、スキャナ部１１と、制御部１２と、記憶部１３と、操作部１４と、表示部１５と、プリンタ部１６と、ストレージ部１７とを含んで構成されている。

スキャナ部１１は、フラットベッドスキャナで構わない。このスキャナ部１１は、制御部１２から入力される読取指示に従い、読取面に載置されているドキュメントを光学的に読み取って画像データを生成し、制御部１２に出力する。

制御部１２は、ＣＰＵ等であり、記憶部１３に格納されているプログラムに従って動作する。本実施の形態では、この制御部１２は、複写機として機能するよう、各部の制御を行なう。すなわち、操作部１４から入力される複写の指示に従い、スキャナ部１１に対して読取を指示し、スキャナ部１１から入力される画像データに対して、指示された画像処理を行なって、プリンタ部１６に出力する。また、本実施の形態では、制御部１２は、読み取った画像データを含む処理の履歴の情報（履歴情報）をストレージ部１７に格納する処理（履歴記録処理）を実行している。この制御部１２の処理の内容については、後に詳しく述べる。

記憶部１３は、ＲＡＭやＲＯＭなどの記憶素子を含んで構成されている。この記憶部１３には、制御部１２によって実行されるプログラムが格納されている。また、この記憶部１３は、制御部１２のワークメモリとしても動作する。

操作部１４は、表示部１５にオーバーレイされたタッチパネルや、テンキーなどである。この操作部１４は、利用者の指示操作の内容を受け入れて制御部１２に出力する。表示部１５は、液晶ディスプレイ等であり、制御部１２から入力される指示に従ってインタフェース画面や、情報の表示を行なう。プリンタ部１６は、制御部１２から入力される指示に従って、制御部１２から入力される画像データを印刷出力する。

ストレージ部１７は、ハードディスク等を含むディスクデバイスであり、制御部１２から入力される指示に従って、履歴情報を保持する。

ここで制御部１１の処理の内容について説明する。制御部１１が実行するプログラムは、図２に例示するように、画像データ入力部２１と、文字認識部２２と、確認部２３と、文字列編集部２４と、画像処理部２５と、キーワード抽出部２６と、履歴情報登録部２７と、検索処理部２８とを、機能的に含む。

ここで画像データ入力部２１は、操作部１４の指示操作により、スキャナ部１１における原稿の読取指示を受けて、スキャナ部１１に読取指示を出力する。また、この画像データ入力部２１は、原稿の読取指示とともに、当該読み取る対象となる原稿が、
（１）テキスト主体
（２）写真等のイメージ主体、
（３）テキスト及びイメージの混在
のいずれであるか、を表す原稿種別情報の入力を受け入れる。

画像データ入力部２１は、スキャナ部１１が出力する画像データと、ここで入力された原稿種別情報とを関連づけて記憶部１３に格納する。

文字認識部２２は、記憶部１３に格納された画像データの一つを処理対象として選択し、処理対象となった画像データに対して画像処理を行なうよう、画像処理部２５に対して処理開始を指示する。そして、画像処理を完了した処理対象の画像データに対して光学的文字認識（ＯＣＲ）の処理を実行して文字列の情報を抽出し、当該文字列の情報を、処理対象の画像データに関連づけて記憶部１３に格納する。

確認部２３は、ここで抽出した文字列情報の量が、処理対象の画像データに関連づけられた原稿種別情報に基づいて定められる文字列量条件を満足するか否かを確認する。すなわち本実施の形態では、記憶部１３に、原稿種別情報ごとに、図３に示すように、文字列量の条件を設定しておく。この図３では、条件の例として、原稿種別情報が「イメージ主体」であるときには、文字列情報の量が予め定めたしきい値（Ｙ）を超えないとの条件を挙げている。確認部２３は、例えば処理対象の画像データに「イメージ主体」との原稿種別情報が関連づけられており、かつ、当該画像データについてのＯＣＲ処理の結果、得られた文字の数（文字列量）が、このしきい値（Ｙ）を超える場合に、条件を満足しないと判断する。

確認部２３は、ここで条件を満足しない場合に、報知処理を開始し、表示部１５に対して条件を満足しない旨を表示し、原稿種別情報を変更するか否かを問い合わせる。ここで利用者が、原稿種別情報を変更する指示を入力すると、確認部２３は、当該入力された原稿種別情報を、処理の対象となった画像データに関連付けられている原稿種別情報に上書きして、記憶部１３に格納する。具体的な例として、この確認部２３が表示部１５に表示する問い合わせのインタフェース画面は、図３に示すように、条件を満足しない旨を通知する文字列と、設定を変更するためのボタンＢとを配列したものである。ここでボタンＢのうち、このインタフェース画面を表示する時点で、処理対象の画像データに関連づけられている原稿種別情報に対応するボタンについては、選択されていることを表す状態で表示してもよい。

また、このインタフェース画面では、「読み取られた文字を確認」のようなボタンをさらに配置してもよい。この「読み取られた文字を確認」のボタンを押下する操作が操作部１４を介して行なわれると、確認部２３は、文字列編集部２４に対して文字列編集の処理を開始するよう指示をする。

確認部２３は、文字列編集部２４における処理が終了したときや、原稿種別情報を確認（設定を変更してもしなくてもよい）する操作が行なわれたときに、キーワード抽出部２６に対してキーワード抽出の処理を指示する。また確認部２３は、ＯＣＲ処理で得られた文字列の量が、原稿種別情報に基づいて定められる文字列量条件を満足するときには、キーワード抽出部２６に対してキーワード抽出の処理を指示する。

文字列編集部２４は、確認部２３から入力される指示に従って、文字列編集の処理を開始し、図４に示すような画面を表示部１５に表示する。文字列編集部２４は、ここでは、ＯＣＲ処理の結果、得られた文字列を表示する画面を表示し、編集を受け入れる。ここで編集は、例えば操作部１４がキーボード等を含んでいれば、キーボードを介して入力される指示に従って、テキストを編集するエディタとしての処理を実行することで行なえばよい。文字列編集部２４は、ここで編集を受け入れると、処理対象となった画像データに関連づけて記憶されている文字列の情報に置き換えて、ここで編集された文字列の情報を記憶部１３に格納する。

画像処理部２５は、文字認識部２２から処理開始の指示を受けると、処理対象となった画像データを記憶部１３から読み出し、また、当該処理対象の画像データに関連づけて記憶されている原稿種別情報を参照して、原稿種別情報に基づく所定の処理を実行する。ここで処理の内容は例えば原稿種別情報が「テキスト主体」であれば、画像データのコントラストを強調する処理であり、原稿種別情報が「イメージ主体」であれば、画像データのコントラストを低減するなどの処理である。画像処理部２５は、画像処理を行なった後の画像データを、処理対象の画像データの置き換えて記憶部１３に格納する。

キーワード抽出部２６は、キーワード抽出の指示を受けて、処理対象となった画像データに関連づけられているＯＣＲ処理の結果としての文字列情報に対して、索引作成処理を実行して、その結果得られたキーワードを、処理対象となった画像データに関連づけて格納し、履歴情報登録部２７に履歴登録指示を出力する。ここで索引作成処理とは、例えば一般的な全文検索処理におけるのと同様のもので、文字列データを形態素解析処理等によって単語に分割し、分割して得られた単語の各々について、予め定めた単語リストに含まれる単語の出現頻度（Tf）を演算して、出願頻度の高い順に上位Ｎ番目までの単語をキーワードとして取り出す処理等をいう。このほか、複数の文書における出現頻度の逆数（Idf）を併せて用いてもよい。

なお、このキーワード抽出部２６は、処理対象となった画像データに関連づけられた文字列の量が予め定めた処理要否しきい値に達していない場合は、キーワードの抽出を行なわずに、または文字列全体をキーワードとして処理対象の画像データに関連づけて、履歴情報登録部２７に履歴登録指示を出力してもよい。

履歴情報登録部２７は、履歴登録指示の入力を受けると、図示しないカレンダー部から日時の情報を取得して、当該日時の情報と、処理対象の画像データ（画像処理後の画像データ）と、それに関連づけられているＯＣＲの結果や、原稿種別情報等の情報を履歴情報としてストレージ部１７に蓄積する。なお、利用者を利用者名やパスワードの入力などによって認証して、当該認証によって得られた、利用者を特定する情報を、履歴情報に含めておいてもよい。

すなわち、この履歴情報登録部２７によって、格納される履歴情報は例えば、図５に示すようなものとなる。

検索処理部２８は、操作部１４を介して利用者から検索条件の入力を受け入れる。検索処理部２８は、例えば検索条件として、キーワードの入力を受けて、当該入力されたキーワードに関連づけられている画像データを、ストレージ部１７から選択して、選択された画像データを特定する情報（データ特定情報）のリストを第１検索リストとして記憶部１３に格納する。また、検索処理部２８はさらに、ストレージ部１７から「テキスト主体」との原稿種別情報が関連づけられている画像データを選択して、選択された画像データを特定する情報のリストを第２検索リストとして記憶部１３に格納する。そして検索処理部２８は、第２検索リストから、第１検索リストにも含まれているデータ特定情報を削除する。

検索処理部２８は、図６に示すように、キーワードを含む画像データとして、第１検索リストに含まれるデータ特定情報で特定される画像データの一覧を表示する（Ａ）とともに、併せて、第２検索リスト（第１検索リストとの重複を除いたもの）に含まれるデータ特定情報で特定される画像データの一覧を、キーワードを含まないテキスト主体の画像データの一覧として表示する（Ｂ）。ここで一覧には、日時や利用者名などの情報を含む。また、文字列の量に関する情報をさらに含んでもよい。

なお、ここまでの説明では、確認部２３は、原稿種別情報が「イメージ主体」とされているのに、処理対象の画像データからＯＣＲ処理によって抽出した文字列情報の量が予め定めたしきい値を超えているときに報知を行なって、原稿種別情報の設定を変更するインタフェース画面を表示して、利用者に原稿種別情報の設定変更の機会を与えることとしているが、図３に示すように、ここでの判断の条件は、これだけに限られず、例えば原稿種別情報が「テキスト主体」とされているのに、処理対象の画像データからＯＣＲ処理によって抽出した文字列情報の量が予め定めたしきい値（Ｘ）以上でないときに、条件を満足しないとして報知の処理を行ない、原稿種別情報の設定を変更するインタフェース画面を表示して、利用者に原稿種別情報の設定変更の機会を与えてもよい。なお、図３において、各しきい値はＸ＞Ｚ＞Ｙとなっていてもよい。ここで、Ｚは、原稿種別情報が「テキストとイメージ混在」である場合に対応するしきい値であり、原稿種別情報が「テキストとイメージ混在」となっているときに、ＯＣＲ処理によって抽出した文字列情報の量がこのしきい値Ｚ以上でないときに、条件を満足しないとして報知の処理を行ない、原稿種別情報の設定を変更するインタフェース画面を表示して、利用者に原稿種別情報の設定変更の機会を与えることになる。

さらに本実施の形態においては、原稿種別情報の設定は、スキャナ部１１にて読み取られた画像データに対して画像処理を行なうときの処理パラメータの決定に用いられるものとしているが、スキャナ部１１での読取解像度など、読取の条件を、原稿種別情報に基づいて設定しても構わない。

また、ここまでの説明では、キーワードの抽出を行なう際に形態素解析などの処理によって単語を抽出しているが、これに限らず、Ｎ−Ｇｒａｍ法によって文字列データを分割してキーワードを抽出してもよい。

本実施の形態の画像処理装置は、以上のように構成されているので、例えば複写やスキャナなどで原稿を読み取ったときに、当該読み取った画像データについてＯＣＲ処理によって文字列情報を抽出し、検索用のキーワードを設定するとともに、読取時に指定された原稿種別の情報から推定される文字の量と、ＯＣＲ処理によって得られた文字列情報の文字の量とを比較し、イメージ主体とされながらＯＣＲ処理で抽出された文字量が多い場合や、テキスト主体（あるいは、テキストとイメージの混在）とされながらＯＣＲ処理で抽出された文字量が少ない場合などに、原稿種別の情報の設定を修正する機会を利用者に与える。これによって、原稿種別情報がなるべく適正に設定されるよう促す。そしてこのために、利用者の設定誤りによるＯＣＲの精度低下を防止して、検索の容易性を向上できる。

一方で、検索の処理では、キーワードを用いた検索が行なわれたときに、検索の条件として指定されたキーワードに関連づけられた画像データを列挙するとともに、テキスト主体（あるいは、テキスト主体及びテキストとイメージの混在）との原稿種別情報に関連づけられた画像データを列挙して表示する。この表示によって、キーワードの検索から漏れたテキスト主体の画像データの一覧を参照できるようになり、利用者は、キーワードの検索によって目的の画像データが見つけられない場合においても、他にどのような画像データがあるかを参照でき、検索の利便性を向上できる。

本発明の実施の形態に係る画像処理装置の構成ブロック図である。本発明の実施の形態に係る画像処理装置の機能ブロック図である。本発明の実施の形態に係る画像処理装置での文字列量条件の設定例を表す説明図である。本発明の実施の形態に係る画像処理装置での文字列編集画面例を表す説明図である。本発明の実施の形態に係る画像処理装置での履歴情報の保持例を表す説明図である。本発明の実施の形態に係る画像処理装置での検索結果の表示例を表す説明図である。

符号の説明

１１スキャナ部、１２制御部、１３記憶部、１４操作部、１５表示部、１６プリンタ部、１７ストレージ部、２１画像データ入力部、２２文字認識部、２３確認部、２４文字列編集部、２５画像処理部、２６キーワード抽出部、２７履歴情報登録部、２８検索処理部。

Claims

原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する手段と、
前記画像データに含まれる文字を認識して、文字列情報を生成する手段と、
前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う手段と、
前記原稿種別情報を含む履歴情報を生成して保持する手段と、を含み、
当該保持されている履歴情報が所定の検索処理に供されることを特徴とする画像処理装置。
請求項１に記載の画像処理装置であって、
前記文字列量条件は、原稿種別情報がイメージ主体であるときに、文字列情報の量が予め定めたしきい値を超えないとの条件であることを特徴とする画像処理装置。
請求項１または２に記載の画像処理装置であって、
前記履歴情報を保持する手段は、履歴情報に、さらに文字列情報の量を含めることを特徴とする画像処理装置。
請求項１から３のいずれか一項に記載の画像処理装置であって、
前記文字列情報を提示して、編集をさせる手段をさらに含み、
当該提示ないし編集された文字列情報が前記履歴情報に含めて保持されることを特徴とする画像処理装置。
原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する工程と、
前記画像データに含まれる文字を認識して、文字列情報を生成する工程と、
前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う工程と、
を含むことを特徴とする画像処理装置の制御方法。
コンピュータに、
原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する手順と、
前記画像データに含まれる文字を認識して、文字列情報を生成する手順と、
前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う手順と、
を実行させることを特徴とするプログラム。