JP2007172276A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2007172276A
JP2007172276A JP2005368828A JP2005368828A JP2007172276A JP 2007172276 A JP2007172276 A JP 2007172276A JP 2005368828 A JP2005368828 A JP 2005368828A JP 2005368828 A JP2005368828 A JP 2005368828A JP 2007172276 A JP2007172276 A JP 2007172276A
Authority
JP
Japan
Prior art keywords
character string
information
image data
document
document type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005368828A
Other languages
English (en)
Inventor
Takashi Osawa
隆 大澤
Ayumi Seki
歩 瀬木
Takaaki Sumitomo
高明 住友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005368828A priority Critical patent/JP2007172276A/ja
Publication of JP2007172276A publication Critical patent/JP2007172276A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】利用者の指示誤りを防止し、OCRの精度を向上させて検索を容易にできる画像処理装置を提供する。
【解決手段】原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得し、画像データに含まれる文字を認識して、文字列情報を生成し、当該生成した文字列情報の量が、原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行って、原稿種別情報を含む履歴情報を生成して保持し、当該保持されている履歴情報が所定の検索処理に供される画像処理装置である。
【選択図】図1

Description

本発明は、複写機やスキャナ等によって読み取られる等して得られる画像を処理する画像処理装置に関する。
近年では、複写機等で複写された画像データの履歴を保持することにより、特定の画像データの形成日時や形成指示者を追跡可能とする技術がある(特許文献1)。また、光学的文字認識処理(OCR)等によって、画像データに含まれる文字列情報を抽出し、画像データに関連づけて記憶しておくことで、キーワードを用いて画像データを検索できるようにしているものもある。
特開2002−16788号公報
しかしながら、上記従来の技術においては、OCRの精度によってはキーワードの抽出が適切に行なわれない場合がある。例えば利用者がテキスト主体の原稿を読み取るときに、誤ってイメージ主体の原稿であるとして設定してしまうと、イメージに適した画像処理が行なわれる結果、文字の画像がぼやけてOCR処理の精度が低下してしまう場合がある。このように従来の技術では、利用者の設定誤り等によってOCRの精度が低下し、検索が容易でなくなる場合がある。
本発明は上記実情に鑑みて為されたもので、利用者の指示誤りを防止し、OCRの精度を向上させて検索を容易にできる画像処理装置を提供することを、その目的の一つとする。
上記従来例の問題点を解決するための本発明は、画像処理装置であって、原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する手段と、前記画像データに含まれる文字を認識して、文字列情報を生成する手段と、前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う手段と、前記原稿種別情報を含む履歴情報を生成して保持する手段と、を含み、当該保持されている履歴情報が所定の検索処理に供されることを特徴としている。
ここで前記文字列量条件は、原稿種別情報がイメージ主体であるときに、文字列情報の量が予め定めたしきい値を超えないとの条件であってもよい。また前記履歴情報を保持する手段は、履歴情報に、さらに文字列情報の量を含めることとしてもよい。さらに前記文字列情報を提示して、編集をさせる手段をさらに含み、当該提示ないし編集された文字列情報が前記履歴情報に含めて保持されることとしてもよい。
本発明の一態様は、画像処理装置の制御方法であって、原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する工程と、前記画像データに含まれる文字を認識して、文字列情報を生成する工程と、前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う工程と、を含むことを特徴としている。
本発明の別の態様はプログラムであって、コンピュータに対して、原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する手順と、前記画像データに含まれる文字を認識して、文字列情報を生成する手順と、前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う手順と、を実行させることを特徴としている。
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る画像処理装置は、例えば複写機であって、図1に示すように、スキャナ部11と、制御部12と、記憶部13と、操作部14と、表示部15と、プリンタ部16と、ストレージ部17とを含んで構成されている。
スキャナ部11は、フラットベッドスキャナで構わない。このスキャナ部11は、制御部12から入力される読取指示に従い、読取面に載置されているドキュメントを光学的に読み取って画像データを生成し、制御部12に出力する。
制御部12は、CPU等であり、記憶部13に格納されているプログラムに従って動作する。本実施の形態では、この制御部12は、複写機として機能するよう、各部の制御を行なう。すなわち、操作部14から入力される複写の指示に従い、スキャナ部11に対して読取を指示し、スキャナ部11から入力される画像データに対して、指示された画像処理を行なって、プリンタ部16に出力する。また、本実施の形態では、制御部12は、読み取った画像データを含む処理の履歴の情報(履歴情報)をストレージ部17に格納する処理(履歴記録処理)を実行している。この制御部12の処理の内容については、後に詳しく述べる。
記憶部13は、RAMやROMなどの記憶素子を含んで構成されている。この記憶部13には、制御部12によって実行されるプログラムが格納されている。また、この記憶部13は、制御部12のワークメモリとしても動作する。
操作部14は、表示部15にオーバーレイされたタッチパネルや、テンキーなどである。この操作部14は、利用者の指示操作の内容を受け入れて制御部12に出力する。表示部15は、液晶ディスプレイ等であり、制御部12から入力される指示に従ってインタフェース画面や、情報の表示を行なう。プリンタ部16は、制御部12から入力される指示に従って、制御部12から入力される画像データを印刷出力する。
ストレージ部17は、ハードディスク等を含むディスクデバイスであり、制御部12から入力される指示に従って、履歴情報を保持する。
ここで制御部11の処理の内容について説明する。制御部11が実行するプログラムは、図2に例示するように、画像データ入力部21と、文字認識部22と、確認部23と、文字列編集部24と、画像処理部25と、キーワード抽出部26と、履歴情報登録部27と、検索処理部28とを、機能的に含む。
ここで画像データ入力部21は、操作部14の指示操作により、スキャナ部11における原稿の読取指示を受けて、スキャナ部11に読取指示を出力する。また、この画像データ入力部21は、原稿の読取指示とともに、当該読み取る対象となる原稿が、
(1)テキスト主体
(2)写真等のイメージ主体、
(3)テキスト及びイメージの混在
のいずれであるか、を表す原稿種別情報の入力を受け入れる。
画像データ入力部21は、スキャナ部11が出力する画像データと、ここで入力された原稿種別情報とを関連づけて記憶部13に格納する。
文字認識部22は、記憶部13に格納された画像データの一つを処理対象として選択し、処理対象となった画像データに対して画像処理を行なうよう、画像処理部25に対して処理開始を指示する。そして、画像処理を完了した処理対象の画像データに対して光学的文字認識(OCR)の処理を実行して文字列の情報を抽出し、当該文字列の情報を、処理対象の画像データに関連づけて記憶部13に格納する。
確認部23は、ここで抽出した文字列情報の量が、処理対象の画像データに関連づけられた原稿種別情報に基づいて定められる文字列量条件を満足するか否かを確認する。すなわち本実施の形態では、記憶部13に、原稿種別情報ごとに、図3に示すように、文字列量の条件を設定しておく。この図3では、条件の例として、原稿種別情報が「イメージ主体」であるときには、文字列情報の量が予め定めたしきい値(Y)を超えないとの条件を挙げている。確認部23は、例えば処理対象の画像データに「イメージ主体」との原稿種別情報が関連づけられており、かつ、当該画像データについてのOCR処理の結果、得られた文字の数(文字列量)が、このしきい値(Y)を超える場合に、条件を満足しないと判断する。
確認部23は、ここで条件を満足しない場合に、報知処理を開始し、表示部15に対して条件を満足しない旨を表示し、原稿種別情報を変更するか否かを問い合わせる。ここで利用者が、原稿種別情報を変更する指示を入力すると、確認部23は、当該入力された原稿種別情報を、処理の対象となった画像データに関連付けられている原稿種別情報に上書きして、記憶部13に格納する。具体的な例として、この確認部23が表示部15に表示する問い合わせのインタフェース画面は、図3に示すように、条件を満足しない旨を通知する文字列と、設定を変更するためのボタンBとを配列したものである。ここでボタンBのうち、このインタフェース画面を表示する時点で、処理対象の画像データに関連づけられている原稿種別情報に対応するボタンについては、選択されていることを表す状態で表示してもよい。
また、このインタフェース画面では、「読み取られた文字を確認」のようなボタンをさらに配置してもよい。この「読み取られた文字を確認」のボタンを押下する操作が操作部14を介して行なわれると、確認部23は、文字列編集部24に対して文字列編集の処理を開始するよう指示をする。
確認部23は、文字列編集部24における処理が終了したときや、原稿種別情報を確認(設定を変更してもしなくてもよい)する操作が行なわれたときに、キーワード抽出部26に対してキーワード抽出の処理を指示する。また確認部23は、OCR処理で得られた文字列の量が、原稿種別情報に基づいて定められる文字列量条件を満足するときには、キーワード抽出部26に対してキーワード抽出の処理を指示する。
文字列編集部24は、確認部23から入力される指示に従って、文字列編集の処理を開始し、図4に示すような画面を表示部15に表示する。文字列編集部24は、ここでは、OCR処理の結果、得られた文字列を表示する画面を表示し、編集を受け入れる。ここで編集は、例えば操作部14がキーボード等を含んでいれば、キーボードを介して入力される指示に従って、テキストを編集するエディタとしての処理を実行することで行なえばよい。文字列編集部24は、ここで編集を受け入れると、処理対象となった画像データに関連づけて記憶されている文字列の情報に置き換えて、ここで編集された文字列の情報を記憶部13に格納する。
画像処理部25は、文字認識部22から処理開始の指示を受けると、処理対象となった画像データを記憶部13から読み出し、また、当該処理対象の画像データに関連づけて記憶されている原稿種別情報を参照して、原稿種別情報に基づく所定の処理を実行する。ここで処理の内容は例えば原稿種別情報が「テキスト主体」であれば、画像データのコントラストを強調する処理であり、原稿種別情報が「イメージ主体」であれば、画像データのコントラストを低減するなどの処理である。画像処理部25は、画像処理を行なった後の画像データを、処理対象の画像データの置き換えて記憶部13に格納する。
キーワード抽出部26は、キーワード抽出の指示を受けて、処理対象となった画像データに関連づけられているOCR処理の結果としての文字列情報に対して、索引作成処理を実行して、その結果得られたキーワードを、処理対象となった画像データに関連づけて格納し、履歴情報登録部27に履歴登録指示を出力する。ここで索引作成処理とは、例えば一般的な全文検索処理におけるのと同様のもので、文字列データを形態素解析処理等によって単語に分割し、分割して得られた単語の各々について、予め定めた単語リストに含まれる単語の出現頻度(Tf)を演算して、出願頻度の高い順に上位N番目までの単語をキーワードとして取り出す処理等をいう。このほか、複数の文書における出現頻度の逆数(Idf)を併せて用いてもよい。
なお、このキーワード抽出部26は、処理対象となった画像データに関連づけられた文字列の量が予め定めた処理要否しきい値に達していない場合は、キーワードの抽出を行なわずに、または文字列全体をキーワードとして処理対象の画像データに関連づけて、履歴情報登録部27に履歴登録指示を出力してもよい。
履歴情報登録部27は、履歴登録指示の入力を受けると、図示しないカレンダー部から日時の情報を取得して、当該日時の情報と、処理対象の画像データ(画像処理後の画像データ)と、それに関連づけられているOCRの結果や、原稿種別情報等の情報を履歴情報としてストレージ部17に蓄積する。なお、利用者を利用者名やパスワードの入力などによって認証して、当該認証によって得られた、利用者を特定する情報を、履歴情報に含めておいてもよい。
すなわち、この履歴情報登録部27によって、格納される履歴情報は例えば、図5に示すようなものとなる。
検索処理部28は、操作部14を介して利用者から検索条件の入力を受け入れる。検索処理部28は、例えば検索条件として、キーワードの入力を受けて、当該入力されたキーワードに関連づけられている画像データを、ストレージ部17から選択して、選択された画像データを特定する情報(データ特定情報)のリストを第1検索リストとして記憶部13に格納する。また、検索処理部28はさらに、ストレージ部17から「テキスト主体」との原稿種別情報が関連づけられている画像データを選択して、選択された画像データを特定する情報のリストを第2検索リストとして記憶部13に格納する。そして検索処理部28は、第2検索リストから、第1検索リストにも含まれているデータ特定情報を削除する。
検索処理部28は、図6に示すように、キーワードを含む画像データとして、第1検索リストに含まれるデータ特定情報で特定される画像データの一覧を表示する(A)とともに、併せて、第2検索リスト(第1検索リストとの重複を除いたもの)に含まれるデータ特定情報で特定される画像データの一覧を、キーワードを含まないテキスト主体の画像データの一覧として表示する(B)。ここで一覧には、日時や利用者名などの情報を含む。また、文字列の量に関する情報をさらに含んでもよい。
なお、ここまでの説明では、確認部23は、原稿種別情報が「イメージ主体」とされているのに、処理対象の画像データからOCR処理によって抽出した文字列情報の量が予め定めたしきい値を超えているときに報知を行なって、原稿種別情報の設定を変更するインタフェース画面を表示して、利用者に原稿種別情報の設定変更の機会を与えることとしているが、図3に示すように、ここでの判断の条件は、これだけに限られず、例えば原稿種別情報が「テキスト主体」とされているのに、処理対象の画像データからOCR処理によって抽出した文字列情報の量が予め定めたしきい値(X)以上でないときに、条件を満足しないとして報知の処理を行ない、原稿種別情報の設定を変更するインタフェース画面を表示して、利用者に原稿種別情報の設定変更の機会を与えてもよい。なお、図3において、各しきい値はX>Z>Yとなっていてもよい。ここで、Zは、原稿種別情報が「テキストとイメージ混在」である場合に対応するしきい値であり、原稿種別情報が「テキストとイメージ混在」となっているときに、OCR処理によって抽出した文字列情報の量がこのしきい値Z以上でないときに、条件を満足しないとして報知の処理を行ない、原稿種別情報の設定を変更するインタフェース画面を表示して、利用者に原稿種別情報の設定変更の機会を与えることになる。
さらに本実施の形態においては、原稿種別情報の設定は、スキャナ部11にて読み取られた画像データに対して画像処理を行なうときの処理パラメータの決定に用いられるものとしているが、スキャナ部11での読取解像度など、読取の条件を、原稿種別情報に基づいて設定しても構わない。
また、ここまでの説明では、キーワードの抽出を行なう際に形態素解析などの処理によって単語を抽出しているが、これに限らず、N−Gram法によって文字列データを分割してキーワードを抽出してもよい。
本実施の形態の画像処理装置は、以上のように構成されているので、例えば複写やスキャナなどで原稿を読み取ったときに、当該読み取った画像データについてOCR処理によって文字列情報を抽出し、検索用のキーワードを設定するとともに、読取時に指定された原稿種別の情報から推定される文字の量と、OCR処理によって得られた文字列情報の文字の量とを比較し、イメージ主体とされながらOCR処理で抽出された文字量が多い場合や、テキスト主体(あるいは、テキストとイメージの混在)とされながらOCR処理で抽出された文字量が少ない場合などに、原稿種別の情報の設定を修正する機会を利用者に与える。これによって、原稿種別情報がなるべく適正に設定されるよう促す。そしてこのために、利用者の設定誤りによるOCRの精度低下を防止して、検索の容易性を向上できる。
一方で、検索の処理では、キーワードを用いた検索が行なわれたときに、検索の条件として指定されたキーワードに関連づけられた画像データを列挙するとともに、テキスト主体(あるいは、テキスト主体及びテキストとイメージの混在)との原稿種別情報に関連づけられた画像データを列挙して表示する。この表示によって、キーワードの検索から漏れたテキスト主体の画像データの一覧を参照できるようになり、利用者は、キーワードの検索によって目的の画像データが見つけられない場合においても、他にどのような画像データがあるかを参照でき、検索の利便性を向上できる。
本発明の実施の形態に係る画像処理装置の構成ブロック図である。 本発明の実施の形態に係る画像処理装置の機能ブロック図である。 本発明の実施の形態に係る画像処理装置での文字列量条件の設定例を表す説明図である。 本発明の実施の形態に係る画像処理装置での文字列編集画面例を表す説明図である。 本発明の実施の形態に係る画像処理装置での履歴情報の保持例を表す説明図である。 本発明の実施の形態に係る画像処理装置での検索結果の表示例を表す説明図である。
符号の説明
11 スキャナ部、12 制御部、13 記憶部、14 操作部、15 表示部、16 プリンタ部、17 ストレージ部、21 画像データ入力部、22 文字認識部、23 確認部、24 文字列編集部、25 画像処理部、26 キーワード抽出部、27 履歴情報登録部、28 検索処理部。

Claims (6)

  1. 原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する手段と、
    前記画像データに含まれる文字を認識して、文字列情報を生成する手段と、
    前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う手段と、
    前記原稿種別情報を含む履歴情報を生成して保持する手段と、を含み、
    当該保持されている履歴情報が所定の検索処理に供されることを特徴とする画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記文字列量条件は、原稿種別情報がイメージ主体であるときに、文字列情報の量が予め定めたしきい値を超えないとの条件であることを特徴とする画像処理装置。
  3. 請求項1または2に記載の画像処理装置であって、
    前記履歴情報を保持する手段は、履歴情報に、さらに文字列情報の量を含めることを特徴とする画像処理装置。
  4. 請求項1から3のいずれか一項に記載の画像処理装置であって、
    前記文字列情報を提示して、編集をさせる手段をさらに含み、
    当該提示ないし編集された文字列情報が前記履歴情報に含めて保持されることを特徴とする画像処理装置。
  5. 原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する工程と、
    前記画像データに含まれる文字を認識して、文字列情報を生成する工程と、
    前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う工程と、
    を含むことを特徴とする画像処理装置の制御方法。
  6. コンピュータに、
    原稿が、テキスト主体、イメージ主体、及びこれらの混在のいずれであるか、を表す原稿種別情報とともに、原稿の画像データを取得する手順と、
    前記画像データに含まれる文字を認識して、文字列情報を生成する手順と、
    前記生成した文字列情報の量が、前記原稿種別情報に基づいて定められる文字列量条件を満足しない場合に、所定の報知処理を行う手順と、
    を実行させることを特徴とするプログラム。
JP2005368828A 2005-12-21 2005-12-21 画像処理装置 Pending JP2007172276A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005368828A JP2007172276A (ja) 2005-12-21 2005-12-21 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005368828A JP2007172276A (ja) 2005-12-21 2005-12-21 画像処理装置

Publications (1)

Publication Number Publication Date
JP2007172276A true JP2007172276A (ja) 2007-07-05

Family

ID=38298761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005368828A Pending JP2007172276A (ja) 2005-12-21 2005-12-21 画像処理装置

Country Status (1)

Country Link
JP (1) JP2007172276A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113676609A (zh) * 2020-05-15 2021-11-19 夏普株式会社 图像形成装置以及文档数据分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113676609A (zh) * 2020-05-15 2021-11-19 夏普株式会社 图像形成装置以及文档数据分类方法
CN113676609B (zh) * 2020-05-15 2024-05-14 夏普株式会社 图像形成装置以及文档数据分类方法

Similar Documents

Publication Publication Date Title
JP5223284B2 (ja) 情報検索装置、方法およびプログラム
US7610274B2 (en) Method, apparatus, and program for retrieving data
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
US20070230778A1 (en) Image forming apparatus, electronic mail delivery server, and information processing apparatus
US8635527B2 (en) User interface device, function setting method, and computer program product
JP2007034847A (ja) 検索装置及び検索方法
JP2007293417A (ja) 表示制御装置、画像処理装置、表示制御方法
US9720635B2 (en) Information processing apparatus, method of controlling the same, non-transitory computer readable storage medium, and information processing system
US9003281B2 (en) Image processing apparatus capable of automatically generating help document for workflow, help document generating method and help document generating form
US20110032556A1 (en) Document processing device, document processing method, and recording medium
JP4539720B2 (ja) 画像処理装置および方法ならびにそのためのプログラム
JP4809198B2 (ja) 画像処理機器,記事画像選択方法,プログラム,および記録媒体
US8947754B2 (en) Image processing device displaying a preview image and image processing method and program displaying a preview image
JP2006093917A (ja) 画像読取装置および画像処理装置、画像形成装置
JP4281719B2 (ja) ファイル処理装置、ファイル処理方法、およびファイル処理プログラム
JP2007172276A (ja) 画像処理装置
JP2009026075A (ja) 画像処理装置
JP2007172235A (ja) 履歴管理装置
JP2007336008A (ja) 画像検索装置および方法
JP2020190843A (ja) 文書変換装置
JP2008262484A (ja) 情報処理装置及び情報処理方法
JP2007334670A (ja) 画像処理装置、方法及びプログラム
JP7183623B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2007025160A (ja) 画像形成装置、その制御方法、及びプログラム
JP2008152502A (ja) 文書画像検索装置及びプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115