JP2006260080A - 光学的文字認識システムおよび光学的文字認識方法 - Google Patents

光学的文字認識システムおよび光学的文字認識方法 Download PDF

Info

Publication number
JP2006260080A
JP2006260080A JP2005075783A JP2005075783A JP2006260080A JP 2006260080 A JP2006260080 A JP 2006260080A JP 2005075783 A JP2005075783 A JP 2005075783A JP 2005075783 A JP2005075783 A JP 2005075783A JP 2006260080 A JP2006260080 A JP 2006260080A
Authority
JP
Japan
Prior art keywords
information
unit
character recognition
display
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2005075783A
Other languages
English (en)
Inventor
Yoshiko Suenaga
美子 末永
Hiroki Miyachi
裕樹 宮地
Koichi Mase
浩一 間瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba TEC Corp
Original Assignee
Toshiba Corp
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba TEC Corp filed Critical Toshiba Corp
Priority to JP2005075783A priority Critical patent/JP2006260080A/ja
Priority to US11/290,091 priority patent/US20060210198A1/en
Publication of JP2006260080A publication Critical patent/JP2006260080A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)
  • Facsimiles In General (AREA)

Abstract

【課題】読み取り設定の不備によりOCR認識率が低くなっていることを早い段階でユーザに通知し、再スキャンおよび再OCR処理に要する手間および時間の低減化を図る。
【解決手段】OCRシステム10は、ユーザの入力操作を受け付ける操作部およびユーザに情報を視覚的に提示する表示部とで一体的に構成された操作/表示部11と、原稿(紙面)に記載された情報を画像情報に変換する読取部12と、画像情報をOCR処理して文字情報を得るOCR処理部13と、読取部12およびOCR処理部13の作業を管理するジョブ管理部14と、上記処理部11,12,13,14を制御する制御部16とを具備し、制御部16は、最初のページのOCR処理の結果と読取部12がスキャンした画像とをユーザの対比可能な状態で表示部に表示する制御を行い、キャンセルする旨の入力操作情報を受け取った場合、スキャン処理およびOCR処理を中止する。
【選択図】 図1

Description

本発明は、光学的文字認識システムおよび当該文字認識方法に係り、特に、光学的文字認識処理による文字認識率が低くなってしまった場合、早い段階でユーザに通知する光学的文字認識システムおよび光学的文字認識方法に関する。
従来の光学的文字認識(以下、OCR:Optical Character Recognitionとする)システムおよび当該文字認識方法の一例として、例えば、特許文献1に記載されるように、文字認識時にOCR対象となる原稿の破れを検出した場合、OCR処理を自動的に停止する技術がある。
特開2003−208564号公報
しかしながら、上述した光学的文字認識システムおよび光学的文字認識方法では、OCR対象となる原稿がシステムまたは装置に及ぼす悪影響を懸念して自動停止することはできるが、ユーザの読み取り設定の不備の要因がある場合において自動的にOCR処理を停止するものではない。
つまり、従来の光学的文字認識システムおよび光学的文字認識方法では、ユーザの読み取り設定の不備があった場合、ユーザは、全てのOCR対象にOCR処理を実行した後にOCR結果を見て初めて設定の不備があったことに気付かされることになる。従って、ユーザは、OCR処理終了後、修正画面で認識結果を見ながら一箇所ずつ修正していくか、処理結果を全部破棄して、再度スキャンに原稿をセットし、再スキャン/再OCR処理する等の修正またはやり直し作業を強いられる。特に、OCR対象が多い場合、手間が大きく時間もかかる。
本発明は上述した課題を解決するためになされたものであり、読み取り設定の不備によりOCR認識率が低くなっていることを早い段階でユーザに通知し、再スキャンおよび再OCR処理に要する手間および時間の低減化を図った光学的文字認識システムおよび光学的文字認識方法を提供することを目的とする。
本発明に係る光学的文字認識システムは、上述した課題を解決するため、請求項1に記載したように、ユーザの入力操作を受け付ける操作部と、ユーザに情報を視覚的に提示する表示部と、原稿に記載された情報を画像情報に変換する読取部と、前記画像情報を光学的文字認識処理して文字情報を得る光学的文字認識処理部と、前記読取部および光学的文字認識処理部の作業を管理するジョブ管理部と、前記操作部、表示部、読取部、光学的文字認識処理部およびジョブ管理部を制御する制御部とを具備し、前記制御部は、前記原稿の最初のページを表す画像情報とこの画像情報から得られた文字情報とをユーザが対比可能な状態で前記表示部に表示するともに、キャンセルする旨の入力操作情報を受け取った場合、前記読取部が前記原稿に記載される情報を画像情報に変換する処理および前記光学的文字認識部が行っている前記画像情報から文字情報を得る処理を中止する制御を行うように構成されたことを特徴とする。
ユーザが対比可能な状態とは、請求項2に記載したように、例えば、前記画像情報が表す画像と前記文字情報が表す文字とを前記表示部に並べた状態であったり、請求項3に記載したように、例えば、ページの文字認識率が予め設定した所定の文字認識率を表す閾値よりも低い場合、前記表示部に当該ページにおいて前記閾値よりも数値が低い領域または文字を強調表示する状態である。
本発明に係る光学的文字認識方法は、上述した課題を解決するため、請求項7に記載したように、原稿のページをスキャンして画像が得られると、当該ページの光学的文字認識処理を開始するとともに次ページ以降のスキャン処理を継続し、当該ページの光学的文字認識処理結果が得られると、当該ページ以降のスキャン処理および光学的文字認識処理を継続するとともに、前記画像および前記結果をユーザが対比可能な状態で表示部に表示し、キャンセルする旨の入力操作を操作部が受け付けた場合、継続中のスキャン処理および光学的文字認識処理を直ちに中止することを特徴とする。
本発明に係る光学的文字認識システムおよび光学的文字認識方法によれば、読み取り設定の不備により、光学的文字認識による文字認識率の低下を早い段階でユーザに通知することができるので、再度のスキャンおよび光学的文字認識に要する手間および時間の低減化が図れる。
以下、本発明に係る光学的文字認識(以下、OCR:Optical Character Recognitionとする)システムおよびOCR方法について、添付の図面を参照して説明する。
OCRシステムとは、読み取り対象となる原稿についての画像情報を取得し、取得した画像情報をOCR処理して文字認識するためのシステムである。
図1に、本発明に係るOCRシステムの一実施例であるOCRシステム10の基本的な機能構成を概略的に表した概略図を示す。
図1によれば、OCRシステム10は、OCR処理開始やキャンセル操作等のユーザの入力操作を受け付ける操作部およびユーザに情報を視覚的に提示する表示部とで構成された操作/表示部11と、原稿(紙面)に記載された情報を画像情報に変換する読取部12と、画像情報をOCR処理して文字情報を得るOCR処理部13と、読取部12およびOCR処理部13の作業を管理するジョブ管理部14と、上記処理部11,12,13,14を制御する制御部16とを具備する。
操作/表示部11の操作部は、スキャン開始指示操作およびキャンセル指示操作等のユーザの入力操作を受け付ける機能を有する。操作部が受け付けた操作内容は、入力操作情報として制御部16に送られる。
操作/表示部11の表示部は、OCR処理した各ページのOCR結果等の情報を視覚的にユーザへ提示する機能を有する。従って、表示部12が制御部16から表示情報を受け取ると、表示情報に対応した表示が表示部12になされる。
尚、操作/表示部11の操作部および表示部は、実際のシステムにおいて、それぞれが独立した処理部としてOCRシステム10に具備されていても構わない。
読取部12は、少なくとも1枚以上の用紙を有する(1ページ以上の)原稿を読み取り、画像情報に変換する機能、すなわち、スキャン機能を有する。また、読取部12は、例えば、原稿種類、濃度、下地調整値およびシャープネス等の画像情報に変換(スキャン)する際の条件を設定したスキャン設定情報を取得する。
スキャン設定情報は、例えば、スキャン設定ファイル18等の電子情報として予め記録される。読取部12は、スキャン設定ファイル18を参照することでスキャン設定情報を取得することができる。
また、スキャン設定情報は、ユーザが入力することもできる。この場合、読取部12は、制御部16が操作/表示部11から受け付けた入力操作情報に基づいて生成されたスキャン設定情報を制御部16から受け取ることで取得する。
OCR処理部13は、画像情報から文字情報を得るOCR機能を有する。従って、OCR処理部13は、OCR処理を行い、画像情報から文字情報を得ることができる。
ジョブ管理部14は、読取部12およびOCR処理部13が実行する一連の作業を一つのジョブとして管理する機能を有する。従って、ジョブ管理部14は、制御部16からスキャン開始の入力操作情報を受け付けて、読取部12が行う読み取り(スキャン)処理の作業およびOCR処理部13が行うOCR処理の作業をそれぞれ一つのジョブの中で管理することができる。
また、ジョブ管理部14は、ジョブの作成を開始し、1ページ分のジョブが作成されると作成したジョブを開始する。ジョブが開始されると、ジョブ管理部14は、ジョブの開始の合図を制御部16に送る。一方、全ページ分のジョブについて作成を終了し、作成した全ページのジョブが完了すると、ジョブの完了の合図を制御部16に送る。
さらに、ジョブ管理部14は、読み込んだ画像情報およびOCR処理結果を管理する機能を有する。つまり、ジョブ管理部14は、読取部12が読み込んだ画像情報を、例えば、画像ファイル20等の電子情報として、OCR処理部13がOCR処理した結果として得られる文字情報(以下、OCR情報とする)を、例えば、OCRファイル21等の電子情報として自己に設けられるデータ記録領域や図外に設けられる任意のデータ記録領域に保存したり、読み出したりすることができる。ジョブ管理部14は、画像情報およびOCR情報を制御部16から受け取る。
制御部16は、操作部と表示部とを有する操作/表示部11、読取部12、OCR処理部13およびジョブ管理部14を制御する機能を有し、操作/表示部11、読取部12、OCR処理部13およびジョブ管理部14間で情報のやり取りを行うことができる。
具体的に説明すると、制御部16は、操作/表示部11の操作部からユーザが入力した入力操作情報を受け取る。そして、制御部16は、入力された操作の内容に応じて、操作/表示部11の表示部、読取部12、OCR処理部13およびジョブ管理部14を制御する。制御部16が入力された操作の内容に応じて、操作/表示部11の表示部、読取部12、OCR処理部13およびジョブ管理部14を制御することで、入力操作の内容に対応する必要な処理が実行される。
また、制御部16は、読取部12が原稿の読み取りを行い得られた画像情報を読取部12から受け取る。この画像情報は、ジョブ管理部14に送られ、ジョブ管理部14が所定の場所に受け取った画像情報を保存する。
さらに、制御部16は、OCR処理部13がOCR処理を行った結果、すなわち、OCR情報を受け取る。このOCR情報は、ジョブ管理部14に送られ、ジョブ管理部14が所定の場所に受け取ったOCR情報を保存する。
一方、制御部16は、画像情報およびOCR情報を受け取ると、受け取った画像情報およびOCR情報に基づいて、両者を並べて表示部に表示する表示情報を生成し、生成した表示情報を操作/表示部11に送る。従って、OCRシステム10では、スキャン処理で得られた画像およびOCR結果を表示部に表示させることができる。
他方、制御部16は、ジョブ管理部14からジョブの作成開始および終了の合図を受け取り、必要な各処理部を制御する制御情報を生成する。制御部16は、スキャン処理およびOCR処理について作業の流れを把握しており、例えば、ジョブ作成開始の合図であれば、操作/表示部11がキャンセルの受付可能な状態とする制御情報を生成して操作/表示部11に送ったり、読取部12のスキャンを開始する制御情報を生成して読取部12に送る。尚、OCRシステム10でなされるスキャン処理およびOCR処理についての詳細は、図2および図3を参照して後述する。
このように構成されるOCRシステム10によれば、1ページ目のOCR処理が完了した時点で操作/表示部11の表示部にスキャン処理により得られた画像(画像情報)とOCR結果(OCR情報)を並列的に表示するように構成されるので、読み取り設定の不備により、光学的文字認識による文字認識率の低下を早い段階でユーザに通知することができ、再度のスキャンおよび光学的文字認識に要する手間および時間の低減化が図れる。
また、読み取り設定の不備により光学的文字認識による文字認識率が低くなっている場合には、OCR処理をスキャン処理の実行段階でキャンセルできるので、OCRシステムに必要以上の負荷がかからないようにすることができる。
尚、OCRシステム10は、スキャン処理により得られた画像(画像情報)とOCR結果(OCR情報)を並列的に表示するように構成されるとしたが、OCR結果(OCR情報)をスキャン処理により得られた画像(画像情報)と対比し得る他の方法でユーザに提示するようにOCRシステムを構成しても良い。
OCR結果をスキャン処理により得られた画像と対比し得る他の方法例としては、ページの文字認識率が予め設定した所定の文字認識率を表す閾値よりも低い場合において、制御部16が予め設定される所定の閾値よりも文字認識率を表す数値が低い領域または文字を強調表示する表示情報を生成するOCRシステムを構成しても良い。
他の対比し得る方法の例として、OCRシステム10に警報部をさらに具備させて、ページの文字認識率が低い場合において制御部16が警報部を駆動させる制御を行うOCRシステムを構成しても良い。この場合には、ページ全体の文字認識率が予め設定した値(閾値)以下の場合に警告音を発することができる。
また、1ページ目のOCR処理が完了した時点で操作/表示部11の表示部に画像情報とOCR情報が並列的に表示の設定(以下、確認表示設定とする)をユーザが操作/表示部11から設定できるようにOCRシステムを構成しても良い。
例えば、確認表示設定で設定する項目は、少なくとも、表示時間、表示ページ数、特定部分の拡大表示や全体の縮小表示および表示の切り替えモードから選択される1以上の項目がある。尚、表示の切り替えモードとは、表示の切り替えを手動により行う手動モードと自動で行う自動モードをいう。
制御部16が、確認表示設定の内容に基づき表示部に表示する表示情報を生成することで、OCRシステムにおいては、設定された表示時間またはページ数で次の画像およびOCR結果に表示を切り替えたり、特定部分を拡大表示または全体が見えるように縮小して表示したり、手動モードと自動モードとを自在に切り替えて表示することができる。
また、OCRシステム10において、一定時間経過後、自動的に次のページのOCR結果を表示するように表示部を制御する制御部16を構成したり、手動モードおよび自動モードを任意のタイミングで切り替えるように表示部を制御する制御部16を構成しても良い。
手動モードと自動モードとを任意のタイミングで切り替えられるようにOCRシステムを構成する例としては、OCRシステム10において、「表示の一時停止」および「表示の再開」を受け付けるユーザインターフェイスを用意しておき、操作/表示部11が表示の一時停止および再開についての要求を受け付けて、「表示の一時停止」(表示のみ停止し、スキャン処理およびOCR処理は継続)および「表示の再開」を行うように操作/表示部11の表示部を制御する制御部16を構成すれば良い。
また、OCRシステム10において、1ページ目のOCR処理が完了した時点で操作/表示部11の表示部に画像情報とOCR情報が並列的に表示されている際に「表示の中止」を受け付けるユーザインターフェイスを用意しておき、操作/表示部11が表示の中止を受け付けて画像情報およびOCR情報の表示を中止する制御を行うような制御部16を構成しても良い。
一方、OCRシステム10の操作/表示部11は、本発明をより実効的なものとする観点から、読取部12を用いてスキャンするユーザがその場で参照できる位置関係にあるのが望ましい。
また、OCRシステム10は、図1に示すような操作/表示部11、読取部12、OCR処理部13、ジョブ管理部14および制御部16を必ずしも1装置で構成することを要するものではない。つまり、OCRシステム10は、読取部12、OCR処理部13、ジョブ管理部14および制御部16をそれぞれ独立する別々の装置として構成されていても良い。
他方、OCRシステム10において、キャンセルを受け付けた場合に既に作成を終了したOCR情報を破棄するかをユーザに問い合わせる旨の表示情報を生成して操作/表示部11に送るとともに、操作/表示部11から破棄する旨の操作入力を受け付けた場合には画像情報およびOCR情報を破棄し、操作/表示部11から破棄しない旨の操作入力を受け付けた場合には現状の情報を保持するようにジョブ管理部14を制御する制御部16を構成しても良い。
次に、本発明に係るOCR方法について説明する。本発明に係るOCR方法は、例えば、OCRシステム10等の本発明に係るOCRシステムが作成したジョブを実行することでなされる。
図2および図3は、OCRシステムが実行する作業について一連の流れを説明するシーケンスチャートであり、図2はキャンセル指示がない場合(以下、正常時とする)について、図3はキャンセル指示があった場合(以下、キャンセル時とする)についての一例を表したものである。尚、図2および図3においては、スキャン時のパラメータ設定をユーザが行うものとして説明する。
正常時の場合、図2に示すように、ステップS1〜ステップS19の処理ステップが順次なされる。図2に示す一連の作業は、ジョブ管理部14がジョブの作成を開始する前段階として、まず、操作/表示部11がスキャン時のパラメータの設定を受け付ける(ステップS1)。
パラメータ設定を受け付けると、ステップS1の処理ステップを完了し、続いて、操作/表示部11がスキャン開始を要求する旨の操作入力を受け付ける(ステップS2)。スキャン開始を要求する旨の操作入力の受け付けは、例えば、操作/表示部11に設けられるスキャンボタンが押されることでなされる。操作/表示部11がスキャン開始を要求する旨の操作入力を受け付けると、ステップS2の処理ステップを完了する。
ステップS2の処理ステップが完了すると、制御部16は、パラメータ設定情報およびスキャン開始の操作入力情報を受け取る。そして、ジョブ管理部14を制御する制御情報を生成して、ジョブ管理部14に送る。そして、ジョブ管理部14が制御部16からジョブ開始の制御情報を受け取ると、ジョブ管理部14はジョブの作成を行い、作成したジョブを開始する合図を制御部16に送る(ステップS3)。
ジョブ管理部14がジョブを開始すると、制御部16は、操作/表示部11をキャンセル受付状態に移行させる制御情報を生成して操作/表示部11へ送る。そして、操作/表示部11は、キャンセル受付状態に移行する旨の制御情報を制御部16から受け取ると、キャンセル受付状態に移行する(ステップS4)。
また、制御部16は、操作/表示部11をキャンセル受付状態に移行させる制御を行った後、続いて、読取部12にスキャン処理ステップを開始する旨の制御情報を生成して生成して読取部12へ送る。読取部12は、制御部16から最初のページのスキャンを開始する旨の制御情報を受け取ると、スキャン処理を実行するスキャン処理ステップを開始する(ステップS5〜ステップS8、ステップS15〜ステップS16)。
スキャン処理ステップでは、まず、ステップS5でスキャンを開始する。そして、1ページ分のスキャンを完了すると、ステップS6に進む。ステップS6において、次のページのスキャンを開始する旨の制御情報を制御部16から受け取った場合、すなわち、次の原稿がある場合には、次のページについてのスキャンを行う(ステップS7)。ステップS7の処理ステップが完了すると、続いて、ステップS8に進む。ステップS8以降の処理ステップは、2つの処理ステップが並行してなされる。
一方は、ステップS6に進んでステップS6〜ステップS8の処理ステップを継続する処理ステップであり、他方はステップS9に進んでステップS9以降の処理ステップを実行する処理ステップ(主にOCR処理の実行)である。
ステップS8からステップS6に進むと、ステップS6以降の処理ステップでスキャン処理ステップを継続して、やがて最終ページになると、スキャン動作を停止して(ステップS15)、スキャン処理ステップを終了して(ステップS16)、ステップS17でOCR処理ステップの完了を待機する。
一方、ステップS8からステップS9に進む際、制御部16は、読取部12からスキャンが完了した分のページ登録を行うようにジョブ管理部14を制御する。生成された制御情報は、ジョブ管理部14へ送られ、ジョブ管理部14がスキャンを完了したページの登録を行う(ステップS9)。
ジョブ管理部14が、1ページ目のページ登録を完了すると(ステップS10)、続いて、ステップS11の処理ステップがなされる。また、ステップS10が完了する際、制御部16は、OCR処理を開始するようにOCR処理部13を制御する。生成された制御情報は、OCR処理部13へ送られ、OCR処理部13が、OCR処理ステップを行う(ステップS11〜ステップS14)。
OCR処理ステップでは、まず、OCR処理部13が、ステップS9においてページ登録されたページについてOCR処理を行う(ステップS11)。そして、ページ登録されたページについてOCR処理を完了すると、ステップS12に進み、ステップS12以降で2つの処理ステップがなされる。一方は、ステップS13に進み、ステップS11でなされたOCR処理の結果を表示するOCR結果表示ステップであり、他方は、ステップS14以降で最終ページとなるまでOCR処理を継続する処理ステップである。
ステップS12からステップS13に進む際、制御部16は、OCR結果情報および画像情報を対比可能な状態でユーザに提示するように操作/表示部11の表示部を制御する制御情報を生成する。そして、制御部16から制御情報を受け取った操作/表示部11は、例えば、OCR処理したページのOCR結果をスキャン処理時に取得した画像とともに並べて表示して、OCR結果情報および画像情報を対比可能な状態でユーザに提示する(ステップS13)。
他方、ステップS12からステップS14に進んで、次のページがある場合、すなわち、ステップS9で次のページ登録されている場合、ステップS11に進み、次のページについてOCR処理を行う。そして、最終ページのOCR処理が完了すると、ステップS14からステップS17に進む。
ステップS17で、スキャン処理ステップおよびOCR処理ステップが共に完了すると、ステップS18に進む。ステップS17からステップS18に進む際には、制御部16が、ジョブ作成を終了する旨の合図を受け取り、操作/表示部11のキャンセル受付状態を解除する制御を行う制御情報を生成する。
そして、表示/操作部11が制御部16からキャンセル受付状態を解除する制御を行う制御情報を受け取ると、表示/操作部11は、キャンセル受付状態を解除する(ステップS18)。表示/操作部11がキャンセル受付状態を解除すると、ジョブ管理部14は、ジョブを終了する(ステップS19)。そして、ジョブが終了すると、図2に示す一連の作業の全処理ステップを完了する(END)。
一方、図3は、キャンセル指示があった場合(以下、キャンセル時とする)のシーケンスを表したものである。尚、図2において表されるシーケンスと実質的に重複する処理ステップについては、同じステップ番号を付して説明を省略する。
図3に示すように、スタートしてからOCR結果表示ステップ(ステップS13)がなされるまでの処理ステップは正常時の場合と同様である。そして、OCR結果を見たユーザがOCR処理をキャンセルする旨の指示の操作入力を行い、操作/表示部11が受け付けると(ステップS21)、操作/表示部11から制御部16にOCR処理をキャンセルする旨の操作情報を送る。
制御部16は、受け取った操作情報に基づき読取部12のスキャン処理を停止する制御情報および現在実行中のジョブを中止する旨の情報を生成し、生成した制御情報を読取部12に送るとともにジョブを中止する旨の情報をジョブ管理部14に送る。そして、スキャン動作を停止する旨の制御情報を読取部12が受け取ると、読取部12はスキャン動作の中止を受け付けるとともに(ステップS22)、ジョブ管理部14は、ジョブの中止を受け付ける(ステップS23)。
スキャン動作の中止を受け付けた読取部12は、スキャン動作を中止し(ステップS24)、スキャン処理ステップを強制的に終了する(ステップS25)。また、ジョブの中止を受け付けたジョブ管理部14は、ステップS14でジョブを中止して、続いて、ステップS26に進む。
ステップS26で、スキャン処理ステップおよびOCR処理ステップの両処理ステップの完了が確認されると、続いて、ステップS27でジョブ管理部14はステップS1以降ステップS26までの処理ステップで生成したデータを破棄する(ステップS27)。ステップS27でデータが破棄された後は、ステップS19に進み、ジョブの終了を経て全作業が終了する(END)。
尚、図3では、ジョブ管理部14がステップS27でデータ破棄を行っているが、データを破棄する際にデータ破棄の確認をユーザに確認する問い合わせ表示を行うようにしても構わない。
このようなOCR方法によれば、スキャン中に平行して行うOCR処理の処理結果(OCR結果情報)およびスキャン画像(画像情報)を対比可能な状態でユーザに提示して、キャンセルが指示された場合、OCR処理とともにスキャン動作も中止するので、OCRシステムに必要以上の負荷がかからないようにすることができるとともに、再度のスキャンおよび光学的文字認識に要する手間および時間の低減化が図れる。
以上、本発明に係る光学的文字認識システムおよび光学的文字認識方法では、1ページ目のOCR処理が完了した時点で操作/表示部11の表示部にスキャン処理により得られた画像(画像情報)とOCR結果(OCR情報)を並列的に表示するので、読み取り設定の不備により光学的文字認識による文字認識率が低くなっていることを早い段階でユーザに通知することができ、再度のスキャンおよび光学的文字認識に要する手間および時間の低減化が図れる。
また、読み取り設定の不備により光学的文字認識による文字認識率が低くなっている場合には、OCR処理をスキャン処理の実行段階でキャンセルできるので、OCRシステムに必要以上の負荷がかからないようにすることができる。
本発明に係るOCRシステムの基本的な機能構成を概略的に表す概略図。 本発明に係るOCRシステムがキャンセル指示がない場合(正常時の場合)に実行する一連の作業の一例を流れを追って説明する説明図(シーケンスチャート)。 本発明に係るOCRシステムがキャンセル指示があった場合(キャンセル時の場合)に実行する一連の作業の一例を流れを追って説明する説明図(シーケンスチャート)。
符号の説明
10 OCRシステム
11 操作/表示部(操作部、表示部)
12 読取部
13 光学的文字認識(OCR)処理部
14 ジョブ管理部
16 制御部
18 スキャン設定ファイル(スキャン設定情報)
20 画像ファイル(画像情報)
21 OCRファイル(OCR情報)

Claims (8)

  1. ユーザの入力操作を受け付ける操作部と、
    ユーザに情報を視覚的に提示する表示部と、
    原稿に記載された情報を画像情報に変換する読取部と、
    前記画像情報を光学的文字認識処理して文字情報を得る光学的文字認識処理部と、
    前記読取部および光学的文字認識処理部の作業を管理するジョブ管理部と、
    前記操作部、表示部、読取部、光学的文字認識処理部およびジョブ管理部を制御する制御部とを具備し、
    前記制御部は、前記原稿の最初のページを表す画像情報とこの画像情報から得られた文字情報とをユーザが対比可能な状態で前記表示部に表示するともに、キャンセルする旨の入力操作情報を受け取った場合、前記読取部が前記原稿に記載される情報を画像情報に変換する処理および前記光学的文字認識部が行っている前記画像情報から文字情報を得る処理を中止する制御を行うように構成されたことを特徴とする光学的文字認識システム。
  2. 前記制御部は、前記画像情報が表す画像と前記文字情報が表す文字とを前記表示部に並べて表示する制御を行うように構成されたことを特徴とする請求項1記載の光学的文字認識システム。
  3. 前記制御部は、ページの文字認識率が予め設定した所定の文字認識率を表す閾値よりも低い場合、前記表示部に当該ページにおいて前記閾値よりも数値が低い領域または文字を強調表示する制御を行うように構成されたことを特徴とする請求項1記載の光学的文字認識システム。
  4. 前記制御部は、一定時間経過後、前記原稿における次のページを表す画像情報およびこの画像情報から得られた文字情報へ自動的に切り替えて前記表示部に表示する制御を行うように構成されたことを特徴とする請求項1記載の光学的文字認識システム。
  5. 前記制御部は、前記操作部がページ切り替え要求の入力操作情報を受け付けて、前記原稿における次のページを表す画像情報およびこの画像情報から得られた文字情報へ切り替えて前記表示部に表示する制御を行うことを特徴とする請求項1記載の光学的文字認識システム。
  6. 前記制御部は、前記操作部がモード切り替え要求の入力操作情報を受け付ける度に、一定時間経過後、前記原稿における次のページを表す画像情報およびこの画像情報から得られた文字情報を前記表示部に表示するモードと、前記操作部がページ切り替え要求の入力操作情報を受け付けて前記原稿における次のページを表す画像情報およびこの画像情報から得られた文字情報へ切り替えて表示するモードとを切り替える制御を行うように構成されたことを特徴とする請求項1記載の光学的文字認識システム。
  7. 原稿のページをスキャンして得られた画像に対して光学的文字認識処理した結果が得られると、当該ページ以降のスキャン処理および光学的文字認識処理を継続するとともに、前記画像および前記結果をユーザが対比可能な状態で表示部に表示し、キャンセルする旨の入力操作を操作部が受け付けた場合、継続中のスキャン処理および光学的文字認識処理を直ちに中止することを特徴とする光学的文字認識方法。
  8. キャンセルする旨の入力操作を操作部が受け付けた場合、前記スキャン処理および光学的文字認識処理により得た情報を破棄するか否かについての確認する表示を表示部に表示し、確認結果に対応する入力操作を受け付けて、前記情報の破棄および保存から選択される一方の処理をさらに行うことを特徴とする請求項7記載の光学的文字認識方法。
JP2005075783A 2005-03-16 2005-03-16 光学的文字認識システムおよび光学的文字認識方法 Abandoned JP2006260080A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005075783A JP2006260080A (ja) 2005-03-16 2005-03-16 光学的文字認識システムおよび光学的文字認識方法
US11/290,091 US20060210198A1 (en) 2005-03-16 2005-11-29 Optical-character-recognition system and optical-character-recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005075783A JP2006260080A (ja) 2005-03-16 2005-03-16 光学的文字認識システムおよび光学的文字認識方法

Publications (1)

Publication Number Publication Date
JP2006260080A true JP2006260080A (ja) 2006-09-28

Family

ID=37010416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005075783A Abandoned JP2006260080A (ja) 2005-03-16 2005-03-16 光学的文字認識システムおよび光学的文字認識方法

Country Status (2)

Country Link
US (1) US20060210198A1 (ja)
JP (1) JP2006260080A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023053950A1 (ja) * 2021-09-29 2023-04-06 株式会社 東芝 システム及び情報処理方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7596606B2 (en) * 1999-03-11 2009-09-29 Codignotto John D Message publishing system for publishing messages from identified, authorized senders
US8457448B2 (en) * 2008-02-04 2013-06-04 Hewlett-Packard Development Company, L.P. Removing inserted text from an image using extrapolation for replacement pixels after optical character recognition
JP4644741B2 (ja) * 2009-02-26 2011-03-02 シャープ株式会社 画像処理装置
US8635058B2 (en) * 2010-03-02 2014-01-21 Nilang Patel Increasing the relevancy of media content
JP5124001B2 (ja) * 2010-09-08 2013-01-23 シャープ株式会社 翻訳装置、翻訳方法、コンピュータプログラムおよび記録媒体
WO2014155742A1 (ja) * 2013-03-29 2014-10-02 楽天株式会社 情報処理システム、情報処理システムの制御方法、情報処理装置、情報処理装置の制御方法、情報記憶媒体、及びプログラム
CN114564141A (zh) * 2020-11-27 2022-05-31 华为技术有限公司 文本提取方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652346A (ja) * 1992-08-04 1994-02-25 Nec Eng Ltd 光学文字読取装置
JPH0713991A (ja) * 1993-06-24 1995-01-17 Fuji Xerox Co Ltd 誤認文字修正装置
JPH08185470A (ja) * 1994-12-28 1996-07-16 Sharp Corp 文書読取装置
JP2003208564A (ja) * 2002-01-16 2003-07-25 Toshiba Corp 光学的文字読取装置およびocr搬送帳票の破れ検出方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2175718B (en) * 1985-05-14 1989-10-25 Sharp Kk A translating apparatus
JPS6244877A (ja) * 1985-08-22 1987-02-26 Toshiba Corp 機械翻訳装置
JP2818052B2 (ja) * 1991-05-21 1998-10-30 シャープ株式会社 光学的文字読み取り装置
US5875263A (en) * 1991-10-28 1999-02-23 Froessl; Horst Non-edit multiple image font processing of records
US5517409A (en) * 1992-03-24 1996-05-14 Ricoh Company, Ltd. Image forming apparatus and method having efficient translation function
US5818028A (en) * 1995-06-26 1998-10-06 Telxon Corporation Portable data collection device with two dimensional imaging assembly
CA2284912C (en) * 1997-03-21 2009-02-24 Educational Testing Service System and method for on-line essay evaluation
JPH11143877A (ja) * 1997-10-22 1999-05-28 Internatl Business Mach Corp <Ibm> 圧縮方法、辞書の見出し語インデックス・データを圧縮するための方法、及び機械翻訳システム
US6112193A (en) * 1998-05-22 2000-08-29 Pitney Bowes Inc. Reading encrypted data on a mail piece to cancel the mail piece
JP4377494B2 (ja) * 1999-10-22 2009-12-02 東芝テック株式会社 情報入力装置
US6917723B1 (en) * 2000-04-25 2005-07-12 Psc Scanning, Inc. Optical data reader with control mechanism implemented behind the window
JP4164272B2 (ja) * 2001-04-24 2008-10-15 キヤノン株式会社 画像処理装置及び画像処理方法
GB2382879A (en) * 2001-12-06 2003-06-11 Hewlett Packard Co Image capture device with capture field illumination
JP4216561B2 (ja) * 2002-02-07 2009-01-28 富士フイルム株式会社 サーバ装置
AU2003266173B2 (en) * 2002-08-29 2006-07-27 Siemens Aktiengesellschaft Method and device for reading postal article inscriptions or document inscriptions
US7391527B2 (en) * 2003-04-29 2008-06-24 Hewlett-Packard Development Company, L.P. Method and system of using a multifunction printer to identify pages having a text string

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652346A (ja) * 1992-08-04 1994-02-25 Nec Eng Ltd 光学文字読取装置
JPH0713991A (ja) * 1993-06-24 1995-01-17 Fuji Xerox Co Ltd 誤認文字修正装置
JPH08185470A (ja) * 1994-12-28 1996-07-16 Sharp Corp 文書読取装置
JP2003208564A (ja) * 2002-01-16 2003-07-25 Toshiba Corp 光学的文字読取装置およびocr搬送帳票の破れ検出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023053950A1 (ja) * 2021-09-29 2023-04-06 株式会社 東芝 システム及び情報処理方法

Also Published As

Publication number Publication date
US20060210198A1 (en) 2006-09-21

Similar Documents

Publication Publication Date Title
JP2006260080A (ja) 光学的文字認識システムおよび光学的文字認識方法
US9704221B2 (en) Image processing apparatus and image processing method
JP5772751B2 (ja) 画像処理装置、表示装置およびプログラム
JP2008241963A (ja) 画像形成装置
US20130082960A1 (en) Image display apparatu, display control method, and non-transitory computer-readable recording medium encoded with display control program
JP2008148261A (ja) 画像読取装置
US8804144B2 (en) Method to read images and computer readable storage medium therefor
US20070285737A1 (en) Image forming apparatus, method of controlling image forming apparatus, and controlling program for image forming apparatus
JP4078810B2 (ja) 画像処理装置および画像処理システム
JP2009077306A (ja) 画像読取装置
JP2014036286A (ja) 画像処理装置、表示装置およびプログラム
JP4081984B2 (ja) 画像読取装置、画像読取方法、画像読取プログラムおよび画像読取プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008182430A (ja) 画像形成装置
JP2008099118A (ja) 画像読取装置、画像処理システム、画像処理方法
JP6164020B2 (ja) 画像形成装置およびプログラム
JP2008245148A (ja) 原稿処理装置及びその制御方法
JP5124312B2 (ja) 画像処理プログラム、画像処理方法および電子カメラ
JP2016051977A (ja) 画像読取装置および画像読取プログラム
JP4853447B2 (ja) デジタルカメラと、そのフォーカス制御システム、フォーカス制御方法、フォーカス制御プログラム
JP2005142989A (ja) 画像処理装置、画像処理システムおよび画像処理方法
JP2008263275A (ja) 画像読取システム及び画像読取システムの制御方法
KR20060022823A (ko) 미리보기에서 편집가능한 화상독취장치 및 화상독취방법
JP2006270748A (ja) スキュー補正方法、プログラム、画像処理装置および画像処理システム
JP3949547B2 (ja) 電子デバイスおよびこれを備えた電子デバイスネットワークシステム
JP2014027454A (ja) 画像処理装置、表示装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20100623