JP2006172284A - 画像処理装置、画像処理方法、コンピュータプログラム - Google Patents

画像処理装置、画像処理方法、コンピュータプログラム Download PDF

Info

Publication number
JP2006172284A
JP2006172284A JP2004366014A JP2004366014A JP2006172284A JP 2006172284 A JP2006172284 A JP 2006172284A JP 2004366014 A JP2004366014 A JP 2004366014A JP 2004366014 A JP2004366014 A JP 2004366014A JP 2006172284 A JP2006172284 A JP 2006172284A
Authority
JP
Japan
Prior art keywords
recognition
processing
image
selection
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004366014A
Other languages
English (en)
Other versions
JP4681870B2 (ja
Inventor
Tomotoshi Kanatsu
知俊 金津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004366014A priority Critical patent/JP4681870B2/ja
Priority to US11/300,143 priority patent/US7738702B2/en
Publication of JP2006172284A publication Critical patent/JP2006172284A/ja
Application granted granted Critical
Publication of JP4681870B2 publication Critical patent/JP4681870B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 装置外へ多量の画像データを送出することなく、かつ高いパフォーマンスで認識処理を実行できるようにする。
【解決手段】 本発明では、例えば、スキャナを備えた機器において紙の文書に書かれた内容を認識させようとする際に、読み込み直後に画像に領域分割処理を施し、その結果を利用して部分領域毎に認識動作をオペレータに指示させるようになっているので、認識対象項目ごとに、認識サービスを利用するか、プログラム・サーバからプログラム・モジュールをダウンロードして認識するか、ローカル保存された汎用認識プログラム・モジュールで認識するかの選択を可能とすることで、より効率的に認識処理を実行できるようになる。
【選択図】 図4

Description

本発明は、原稿画像データの認識処理に関するものである。
近年、顧客サービス業等におけるデータの集計、管理、保存などは電子的に行われることが一般的となった。一方、それらのデータを顧客から収集する際などには、可搬性・普遍性に優れたメディアである紙を利用することが依然として多い。
紙に書かれたデータを電子化するためには、紙の内容を電子的なデータである画像へ変換する装置と、さらに画像の中の文字などを認識して意味のあるデータへ変換する処理が必要となる。
紙を画像化するスキャナ装置は、旧来はコンピュータの周辺機器として接続され、コンピュータのプログラムに沿ってのみ動作するものであった。一方、昨今、スキャナを備えた機器自身が汎用のCPUとユーザインタフェースとを塔載し、このCPUで機器制御以外のプログラムも実行できるようになっている場合がある。この場合機器単体でスキャン以外の様々な処理をさせることも可能となっている。
これを利用して、紙を単なる画像に変換するだけに留まらず、認識プログラムを実行し紙の内容を意味のあるデータとして活用することも、スキャン装置単体で実行可能になってきている。
例えば、スキャナ・プリンタ機能などを1台に統合した複合機と呼ばれる装置においては、原稿から宛名文字を読みとって文字コードに変換する処理を内部に持つことで、読みとった宛名をはがきや封筒にプリントアウトする機能を追加することが可能となる。
又、複合機にハードディスク装置とネットワーク機能を付加し、読み取った原稿を蓄積するデータベースとして利用する際に、さらに原稿の内容までを認識することができれば、その文字列から内容に関するキーワードなどを抽出して検索のためのインデックスとして使用することが可能になる。
しかしこの場合、次のような問題点があった。
問題点1.機器に組み込まれるCPUが低速のため、文字認識処理などは処理時間が膨大となる、または使用できるメモリに制限があるため実行不可能な処理があるなど、パフォーマンスが不足する
問題点2.格納しておけるプログラムに限度があるために、処理内容が限定されてしまう。
従来、前記問題点1に対しては、ネットワークに接続された外部のコンピュータへ画像を送信して所望の処理を実行させ、その結果を受信して利用する方法(以下方法Aとする)が提案されている(例えば、特許文献1)。
また、前記問題点2に対しては、プログラムをネットワークに接続されたサーバに保存しておき、使用するプログラムを装置に動的にダウンロードして実行させるという方法(以下方法Bとする)があった(例えば、特許文献2)。
特開2002−269253号公報 特開2003−84929号公報
しかしながら方法Aには、スキャンした画像をまるごと送信してしまうために、画像のサイズが大きい場合にネットワーク帯域を圧迫してしまうという問題があった。特にカラーの原稿を高解像度で処理したい場合、情報主体であるテキスト部分に画像劣化を発生させないためには圧縮率を一定以上高めることができないので、数〜十数MBの画像がネットワークを流れることになっていた。
一方、方法Bは画像を送出しないですむため、ネットワーク帯域を圧迫しないが、機器内のCPUパワー、メモリ資源制限に起因するパフォーマンス不足問題は解消されない。
本発明の目的はこれらの問題を解決するために、処理最中に装置外へ多量の画像データを送出することなく、かつ高いパフォーマンスで処理を実行する画像処理装置および処理方法を提供することにある。
上記課題を解決するために、例えば、本発明の画像処理装置は、原稿画像データを入力する画像入力手段と、前記画像入力手段で入力された原稿画像データから、複数の認識対象領域を抽出する領域分割手段と、前記領域分割手段で抽出された認識対象領域毎に、実行させる認識処理をオペレータに選択させる選択手段と、前記選択手段で選択に応じて、前記認識対象領域毎に、外部の認識装置に送信して認識処理させるか否か判断する判断手段とを有することを特徴とする。
上記課題を解決するために、例えば、本発明の画像処理装置は、原稿画像データを入力する画像入力手段と、前記画像入力手段で入力された原稿画像データから、複数の認識対象領域を抽出する領域分割手段と、前記領域分割手段で抽出された複数の認識対象領域を識別可能な状態でディスプレイに表示させ、前記表示された認識対象領域毎に、実行させる認識処理をオペレータに選択させる選択手段と、前記選択手段で外部の認識装置に送信して認識処理させると選択された場合、当該認識対象領域を当該外部の認識装置に送信して認識処理させ、一方、前記選択手段で外部装置から認識処理プログラムをダウンロードして認識処理させると選択された場合、当該外部装置から認識処理プログラムをダウンロードして認識処理し、さらに一方、前記選択手段で予め格納されている汎用認識処理プログラムを利用して認識処理させると選択された場合、前記予め格納されている汎用認識処理プログラムを利用して認識処理させるように制御する制御手段とを有することを特徴とする。
本発明によれば、スキャナを備えた機器において紙の文書に書かれた内容を認識させようとする際に、読み込み直後に画像に領域分割処理を施し、その結果を利用して部分領域毎に認識動作をオペレータに指示させるようになっているので、認識対象項目ごとに、認識サービスを利用するか、プログラム・サーバからプログラム・モジュールをダウンロードして認識するか、ローカル保存されたプログラム・モジュールで認識するかの選択を可能とすることで、より効率的に認識処理を実行できるようになる。
また、外部の認識サービス・サーバを利用する場合、部分領域を送信するので、ネットワーク負荷が軽くなる。
また、プログラム・モジュールをダウンロードして認識処理する場合、各認識対象領域に適したプログラムが利用可能となる。
(実施例1)
図1に実施例1の画像処理システムの構成図を示す。
本発明に係る画像処理装置100はローカル・エリア・ネットワーク(LAN)あるいはインターネット101などのネットワーク上にあり、該ネットワーク101を介して認識処理サービス・サーバ102、およびモジュール・サーバ103に接続されている。認識処理サービス・サーバ102は、画像をネットワーク経由で受けとり、その内容を認識して、認識結果のデータを当該画像の送信元に返信する機能を有する。モジュール・サーバ103は、画像処理装置100が実行可能なプログラムモジュールを保持し、画像処理装置100の要求に応じて、該要求を満たすプログラムモジュールを送信する。
図2に画像処理装置100のハードウェア構成を示す。
200は画像処理装置100の動作を制御するCPU部、201はCPUがソフトウェアプログラムを実行し、また画像などのデータを一時保持するメモリ部、202はプログラムやデータ、画像などを恒久的に記憶するハードディスクなどの記憶装置部、203は紙原稿を読み取るスキャナ部、204は画像を紙へと記録するプリンタ部、205はキーあるいはディスプレイに附属するタッチパネル等によりユーザから情報入力をおこなう操作部、206はユーザーに情報を提示するディスプレイ部、207はネットワークと接続するネットワークI/F部、であり、これらはそれぞれバス208にて接続されている。
図3に画像処理装置100で実行される本発明を構成するためのソフトウェア(コンピュータプログラム)の構成を示す。
300は機器の基本ソフトウェアであるオペレーションシステム(OS)部であり、301〜308のソフトウェアはこのOSの管理下で動作する。
301はスキャナ部203を制御し、紙面情報を光電変換した画像データをメモリ部201に取り込むスキャナ制御部である。
302はプリンタ部204を制御し、201メモリ部上の画像を紙へと結像させるプリンタ制御部である。
303は記憶装置部202を制御してファイルの読み書きを提供するファイル・システム部である。
304は、ディスプレイ部205および操作部206を通じて情報の入出力制御をおこなうユーザ・インタフェース部である。
305は、スキャンした画像を解析して文字、図画、写真、表、線などの領域を抽出するように制御するための領域分割処理部である。なお、この領域分割処理は公知の領域分割方法を用いればよく、例えば、USP5680478“Method and Apparatus for character recognition”(Shin−Ywan Wangら/ Canon K.K.)などに記載の領域分割方法を用いればよい。この例では、文書画像中の黒画素の8連結輪郭塊、白画素の4連結輪郭塊の集合を抽出し、その形状、大きさ、集合状態などから、文字、絵や図、表、枠、線といった文書に特徴的な領域を抽出している。
306は画像の一部、あるいは全部に対して認識処理などの処理プログラムを実行するモジュール実行部である。ただし、ここで言う処理プログラムとは、CPU200によって実行されるすべてのコード、すなわち機器各部の基本的制御の為に実行されるコードをも含んだ広義のプログラムではなく、装置の機能を拡張する為の、具体的にはスキャンした画像データに処理を施してデータを得るための各種モジュールのコードを指している。
なお、実例としてはJAVA(登録商標)(TM)技術を利用することができる。JAVA(登録商標)(TM)技術ではOS上の1プロセスとして動作する仮想マシンが、この仮想マシン用のコードとして書かれたプログラムモジュールを実行する。
307はモジュールのコードをモジュール・サーバ103からダウンロードするように制御するためのモジュールダウンロード部である。
308は、画像に対する認識処理などを行なう認識処理サービス・サーバ102に対して、画像を送ってその処理結果を受信する、ネットワーク・サービス実行部である。
次に、画像処理装置100の動作を説明する。
ここでは、顧客が記入した登録用紙の内容を電子データ化して利用することを例として説明する。動作の概略は、図5のような顧客が記入した登録用紙をスキャンさせると、記入内容である住所・氏名などを項目毎に認識処理を行い、文字コードに変換したデータを得て、それらのデータと画像とをセットで保管し、かつ図6のような返送用紙をプリントアウトする、ものとする。
この動作の詳細を図4のフローチャートを用いて説明する。
ステップS401では、オペレータが登録用紙をスキャナ部203にセットし、操作部206より読み取り開始を指示するのを検知し、登録用紙をスキャンする。
ステップS402では、スキャナ部203が読み取った画像をメモリ部201に一時保存する。
ステップS403では、メモリに蓄えられた1枚分の画像に対し、ソフトウェア構成図中の領域分割処理部305のプログラムが実行され、文字、図画、写真、表、線などの属性に基づいて複数の領域に分割し、領域分割結果データが得られる。図7に領域分割の様子とその結果データの例700を示す。700では701,703が文字領域、702が表領域となっている。さらに表の中の各セルにおいて、セル中の文字列に対応して文字領域704〜718が抽出されている。なお、領域分割結果データは各領域の矩形座標を保持する。
ステップS404では、画像が適度に縮小され、かつ領域分割結果が当該縮小された画像上に枠として上書きされて、ディスプレイ上に表示される。なお、このとき、認識対象領域を絞ってオペレータの選択作業能率が向上するように、表内の手書き部分らしい大きな文字の領域のみを表示するようにしてもよい。図8にディスプレイ上での表示例を示しており、例えば赤色の枠で各領域が囲まれているものとする。
ステップS405では、オペレータがディスプレイに表示された枠を選択することで、認識対象領域を指定する。この選択指定の方法は、タッチパネルなどで直接枠に触れる形で指定してもよいし、選択対象となる枠を方向キーで選んでから決定キーが押下されるとその枠を指定するように構成してもよい。
ステップS406では、ステップS405でオペレータにより選択された領域を何の項目として認識するかをオペレータに選択させる。ここでは、「住所」「氏名」「電話番号」「選択肢(数字)」「選択肢(英字)」のうちから選はせるものとする。
ステップS407では、領域の認識手段を次の3つの選択肢から選択させる。(1)認識サービス・サーバを利用して認識、(2)プログラム・サーバよりプログラム・モジュールをダウンロードして認識、(3)ローカルのプログラム・モジュールを用いて認識。
なお、このステップS407の認識手段を選択させる際、ステップS406でオペレータが選んだ項目内容に従って、装置がその項目内容を認識するために提供可能な複数の手段を提示するものとする。そして、オペレータがその中から所望の認識手段を選択することが可能となる。
認識手段とその場合のパフォーマンスの関係は実際には個々の事例に依存するが、比較的一般的な特徴をふまえた各手段の例を次に示す。
認識サービス・サーバ利用の場合、画像処理装置のCPUやメモリなどに比べて高性能なCPUや大容量メモリなどを有することができるので、複雑な認識ロジックで構成される認識処理が提供可能である。特にサーバの資源を十分に利用した、大きなサイズの辞書を必要とする多字種の認識、あるいは語データベース照合による後処理補正を伴う認識などを提供できる。なお、複雑な認識ロジックを利用できるので認識精度が高く、性能の高いサーバであれば認識速度も速いという特徴を有するが、ネットワークに画像を送信するため、その画像サイズが大きかったり、あるいは領域ごとの処理で回数が多い場合、通信オーバーヘッドによる処理時間増加がおこりうるという欠点もある。
プログラム・モジュールをダウンロードして認識する場合、その項目の認識処理に特化した認識プログラムをダウンロードさせることができ、ある程度複雑な認識ロジックで構成される認識処理が提供可能であるが、機器の資源(CPU・メモリ)を使用するので認識サービス・サーバでの認識処理に比べると認識精度はやや劣り、また認識速度は遅くなるが、画像を送信する必要がないので通信による時間増加はないという特徴を有する。なお、巨大な辞書などを併せてダウンロードする必要がある場合はそのぶんのパフォーマンスの低下がありうるが、複数の項目を処理する場合などに一度ダウンロードしたモジュールを続けて使用することで、サーバ手段の場合に比べて効率が良くなる場合もある。
ローカルに保存された汎用の認識プログラム・モジュールを利用する場合は、機器CPUが処理するので認識時間がかかるが、画像を含めて一切の送受信をおこなわないので通信による時間増加はない。しかしながら、機器内の限られた保存スペースは、各々の認識対象項目に特化されたプログラムを複数保存するには適さず、汎用性の重視されたプログラムや簡単な認識処理プログラムが保存されているので、認識サービス・サーバを利用する場合やプログラム・モジュールをダウンロードする場合に比べて認識精度は劣ることになる。
本実施例では、オペレータが、「住所」項目を認識させる際には、住所データベースによる認識結果修正処理を備えた住所認識用の認識サービス・サーバによる認識処理を選び、「氏名」と「電話番号」を認識させる際にはそれぞれ人名と電話番号とに特化された文字認識プログラム・モジュールをダウンロードして認識させる認識処理を選び、「選択肢(数字)」を認識する際にはローカルの認識プログラム・モジュールを使用する認識処理を選んだものとする。なお、本実施例では、手書き文字認識処理を例として説明しているが、この認識処理に限るものではなく、活字文字認識処理や印影認識処理、社章等のマーク認識処理などであってもよい。
なお、常にオペレータが3つの選択肢から効率を勘案して選択する例に限定される必要はない。例えば、項目の認識に適当なローカルのプログラム・モジュールが存在しない場合は(3)の選択肢を表示しないようにしてもいいし、あるいは例えば、精度あるいは効率が著しく低い認識手段は提示しないようにしてもいいし、プログラム・モジュールコード量と画像のサイズを比較して総量の少ないほうを推奨する形で提示するような、半自動でオペレータの選択を補助するようにしてもよい。
また、3つの選択肢に対して、それぞれ異なる使用料を課す仕組みを加え、それに発生する料金をオペレータに提示したり、該料金を選択条件として選択肢を表示する際の絞込みに利用したりするようにしてもよい。この際、ダウンロードしたプログラム・モジュールの使用回数に制限をするなどしてもよい。
図4に戻って、ステップS407で(1)の選択肢が選ばれた場合、ステップS408に進む。ステップS408では、選択された認識サービス・サーバに対して認識処理をリクエストするとともに、その認識対象領域を切りとった画像を該サーバへ送信する。そしてその認識結果を認識サービス・サーバより受信してS413へ進む。
ステップS407で(2)の選択肢が選ばれた場合、ステップS409に進む。ステップS409では、プログラム・サーバに対して、S405で選択された項目を認識するためのプログラム・モジュールのダウンロードをリクエストする。ただし、使用するプログラム・モジュールが既に実行部にロードされていた場合はリクエストはおこなわない。プログラム・モジュールを受信後、ステップS410で当該ダウンロードしたプログラムを実行して認識結果を取得し、S413に進む。
ステップS407で(3)の選択肢が選ばれた場合、ステップS411に進む。ステップS411では、ローカルファイル等に保存されたプログラム・モジュールをプログラム・モジュール実行部にロードする。ステップS412でこのプログラムを実行して認識結果を取得し、S413に進む。
ステップS413では、項目と認識結果とを対にしてメモリに蓄積する。
ステップS414では、オペレータが別の領域を認識するか、認識を終了するかを選択する。別の領域を認識する場合はS405に戻り、認識を終了する場合はS415に進む。
ステップS415では、各項目と認識結果とが対になるデータのリストと、読みとった画像とをファイル・システムに保存する。
ステップS416では、データのリストから必要項目の認識結果を読み出して返送用紙を作成する。例えば、返送用紙フォーマットの所定項目に、対応する認識結果の文字コード列からなる内容に基づいて文字フォントで書き出して紙にプリント出力する。例えば、作成された返送用紙の出力結果は図6のようになる。
以上述べたように、オペレータが紙の原稿内容を装置に認識させようとするときに、読み込み直後に画像に領域分割処理を施し、その結果を利用して部分領域毎に認識動作をオペレータに指示させるように構成されている。
したがって、認識サービス・サーバーを利用して認識させるように指示された場合は、部分領域のみの画像が送信されるのでネットワークに大きな負荷が発生しない。
また、プログラム・サーバからプログラム・モジュールをダウンロードして認識処理をおこなうように指示された場合は、認識対象となる項目に則したプログラムを選択して利用することができ、項目ごと最適なパフォーマンスを得ることができる。
また、認識対象項目ごとに、認識サービスを利用するか、プログラム・サーバからプログラム・モジュールをダウンロードして認識するか、ローカル保存されたプログラム・モジュールで認識するか、の選択が可能なので、より細かなパフォーマンス最適化が可能である。更に、認識にかかる料金も勘案して処理を選択できるので、ユーザーの予算に応じて適切な認識処理を行なうことができる。
また、図9のように用紙毎にフォーマットが異なるような原稿を読み込んだ場合においても、領域分割処理をおこない、各領域の所望の項目に対して所望の認識処理をオペレータがすばやく指示することができる。
(実施例2)
実施例1では、スキャンした画像を解析する領域分割処理部は予め機器に組み込まれているソフトウェア構成の一部としたが、他の認識プログラム・モジュールと同様に、処理の際にプログラム・サーバからダウンロードして実行する領域分割処理モジュールとして構成してもよい。その場合でも、実施例1と同じ効果が得られる。
(実施例3)
上述した実施例1乃至2において、オペレータに対して認識手段の選択肢を提示する前に、項目領域の画像の項目種別を認識するローカルプログラム・モジュールを実行し、その結果によって提示する認識手段を変更してもよい。たとえば、項目内容の種別が印刷文字か手書き文字か、あるいは印鑑の押印影かを判別するプログラムを用いて、その結果により印刷ならばローカルの、手書ならばプログラム・サーバの、印影ならば認識サーバによる認識手段を提示させてもよい。その場合でも上述した実施例と同じ効果が得られるとともに、各項目内容に適した認識手段が提示されるのでオペレータは選択肢を選びやすくなる。
また、上述した実施例において、領域分割処理の結果を修正する処理を加えても良い。例えば、ステップS404で画像と領域分割結果の枠とを表示した際に、オペレータの操作により領域範囲を修正したり、新たな領域範囲を追加したりすることができるようにすればよい。このように構成すれば、領域分割で失敗した領域に対しても認識処理を行なうことができる。
以上、実施例1乃至3で述べたように、本発明によれば、オペレータがスキャナを備えた機器において対話的操作で紙の文書に書かれた内容を認識させようとする際に、読み込み直後に画像に領域分割処理を施し、その結果を利用して部分領域毎に認識動作をオペレータに指示させるようになっているので、認識対象項目ごとに、認識サービスを利用するか、プログラム・サーバからプログラム・モジュールをダウンロードして認識するか、ローカル保存されたプログラム・モジュールで認識するかの選択を可能とすることで、より効率的に認識処理を実行できるようになる。
画像処理システムの構成図 画像処理装置の構成図 画像処理装置のソフトウェア構成例 実施例1における処理フローチャート 顧客記入済みの登録用紙例 返送用紙例 領域分割結果データを示す図 ディスプレイに表示された画像と各領域とを示す図 様々なフォーマットの原稿画像を示す図

Claims (16)

  1. 原稿画像データを入力する画像入力手段と、
    前記画像入力手段で入力された原稿画像データから、複数の認識対象領域を抽出する領域分割手段と、
    前記領域分割手段で抽出された認識対象領域毎に、実行させる認識処理をオペレータに選択させる選択手段と、
    前記選択手段で選択に応じて、前記認識対象領域毎に、外部の認識装置に送信して認識処理させるか否か判断する判断手段と
    を有することを特徴とする画像処理装置。
  2. 前記選択手段では、認識処理の選択肢として、外部の認識装置に送信して認識処理させる第1の選択肢と、外部装置からプログラムをダウンロードして認識処理させる第2の選択肢と、前記画像処理装置に格納されている認識処理プログラムを利用して認識処理させる第3の選択肢と、を提供してオペレータに選択させることを特徴とする請求項1に記載の画像処理装置。
  3. 前記判断手段は、前記選択手段で第1の選択肢が選択された認識対象領域を、前記外部の認識装置に送信して認識処理させると判断することを特徴とする請求項2に記載の画像処理装置。
  4. 前記判断手段は、前記選択手段で第2の選択肢が選択された認識対象領域に対して、前記外部装置からプログラムをダウンロードし、前記画像処理装置において当該認識対象領域の認識処理させると判断することを特徴とする請求項2又は3のいずれかに記載の画像処理装置。
  5. 前記判断手段は、前記選択手段で第2の選択肢が選択された認識対象領域に対して、前記プログラムをダウンロード済みの場合は、当該ダウンロード済みのプログラムを利用し、前記画像処理装置において当該認識対象領域の認識処理させると判断することを特徴とする請求項4に記載の画像処理装置。
  6. 前記判断手段は、前記選択手段で第3の選択肢が選択された認識対象領域に対して、前記画像処理装置内に格納されている認識処理プログラム・モジュールをロードし、前記画像処理装置において当該認識対象領域の認識処理させると判断することを特徴とする請求項2乃至5のいずれかに記載の画像処理装置。
  7. 前記選択手段は、前記領域分割手段で抽出した各認識対象領域の種別を判別し、各認識対象領域の種別に応じて選択可能な認識処理を決定し、当該決定された選択可能な認識処理の中からオペレータに選択させることを特徴とする請求項1に記載の画像処理装置。
  8. 前記選択手段で選択された認識処理を各認識対象領域に対して実行して得た認識結果を、前記原稿画像領域と対応付けて保存する保存手段を更に有することを特徴とする請求項1に記載の画像処理装置。
  9. 前記選択手段で選択された認識処理を各認識対象領域に対して実行して得た認識結果に基づいて、出力用の原稿を作成する作成手段を更に有することを特徴とする請求項1に記載の画像処理装置。
  10. 前記選択手段では、前記領域分割手段で抽出された複数の認識対象領域を識別可能な状態でディスプレイに表示させ、当該識別可能に表示された複数の認識対象領域からオペレータにより選択された認識対象領域に対して、実行させる認識処理を選択させることを特徴とする請求項1に記載の画像処理装置。
  11. 原稿画像データを入力する画像入力手段と、
    前記画像入力手段で入力された原稿画像データから、複数の認識対象領域を抽出する領域分割手段と、
    前記領域分割手段で抽出された複数の認識対象領域を識別可能な状態でディスプレイに表示させ、前記表示された認識対象領域毎に、実行させる認識処理をオペレータに選択させる選択手段と、
    前記選択手段で外部の認識装置に送信して認識処理させると選択された場合、当該認識対象領域を当該外部の認識装置に送信して認識処理させ、一方、前記選択手段で外部装置から認識処理プログラムをダウンロードして認識処理させると選択された場合、当該外部装置から認識処理プログラムをダウンロードして認識処理し、さらに一方、前記選択手段で予め格納されている汎用認識処理プログラムを利用して認識処理させると選択された場合、前記予め格納されている汎用認識処理プログラムを利用して認識処理させるように制御する制御手段と
    を有することを特徴とする画像処理装置。
  12. 画像を処理する装置を制御するための画像処理方法であって、
    原稿画像データを入力する画像入力ステップと、
    前記画像入力ステップで入力された原稿画像データから、複数の認識対象領域を抽出する領域分割ステップと、
    前記領域分割ステップで抽出された認識対象領域毎に、実行させる認識処理をオペレータに選択させる選択ステップと、
    前記選択ステップで選択に応じて、前記認識対象領域毎に、外部の認識装置に送信して認識処理させるか否か判断する判断ステップと
    を有することを特徴とする画像処理方法。
  13. 画像を処理する装置を制御するための画像処理方法であって、
    原稿画像データを入力する画像入力ステップと、
    前記画像入力ステップで入力された原稿画像データから、複数の認識対象領域を抽出する領域分割ステップと、
    前記領域分割ステップで抽出された複数の認識対象領域を識別可能な状態でディスプレイに表示させ、前記表示された認識対象領域毎に、実行させる認識処理をオペレータに選択させる選択ステップと、
    前記選択ステップで外部の認識装置に送信して認識処理させると選択された場合、当該認識対象領域を当該外部の認識装置に送信して認識処理させ、一方、前記選択ステップで外部装置から認識処理プログラムをダウンロードして認識処理させると選択された場合、当該外部装置から認識処理プログラムをダウンロードして認識処理し、さらに一方、前記選択ステップで予め格納されている汎用認識処理プログラムを利用して認識処理させると選択された場合、前記予め格納されている汎用認識処理プログラムを利用して認識処理させるように制御する制御ステップと
    を有することを特徴とする画像処理方法。
  14. 原稿画像データを入力する画像入力ステップと、
    前記画像入力ステップで入力された原稿画像データから、複数の認識対象領域を抽出する領域分割ステップと、
    前記領域分割ステップで抽出された認識対象領域毎に、実行させる認識処理をオペレータに選択させる選択ステップと、
    前記選択ステップで選択に応じて、前記認識対象領域毎に、外部の認識装置に送信して認識処理させるか否か判断する判断ステップと
    の各ステップをコンピュータに実行させるためのコンピュータプログラム。
  15. 原稿画像データを入力する画像入力ステップと、
    前記画像入力ステップで入力された原稿画像データから、複数の認識対象領域を抽出する領域分割ステップと、
    前記領域分割ステップで抽出された複数の認識対象領域を識別可能な状態でディスプレイに表示させ、前記表示された認識対象領域毎に、実行させる認識処理をオペレータに選択させる選択ステップと、
    前記選択ステップで外部の認識装置に送信して認識処理させると選択された場合、当該認識対象領域を当該外部の認識装置に送信して認識処理させ、一方、前記選択ステップで外部装置から認識処理プログラムをダウンロードして認識処理させると選択された場合、当該外部装置から認識処理プログラムをダウンロードして認識処理し、さらに一方、前記選択ステップで予め格納されている汎用認識処理プログラムを利用して認識処理させると選択された場合、前記予め格納されている汎用認識処理プログラムを利用して認識処理させるように制御する制御ステップと
    の各ステップをコンピュータに実行させるためのコンピュータプログラム。
  16. 請求項14又は15のいずれかに記載のコンピュータプログラムを格納した、コンピュータ読取可能な記憶媒体。
JP2004366014A 2004-12-17 2004-12-17 画像処理装置、画像処理方法、コンピュータプログラム Expired - Fee Related JP4681870B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004366014A JP4681870B2 (ja) 2004-12-17 2004-12-17 画像処理装置、画像処理方法、コンピュータプログラム
US11/300,143 US7738702B2 (en) 2004-12-17 2005-12-14 Image processing apparatus and image processing method capable of executing high-performance processing without transmitting a large amount of image data to outside of the image processing apparatus during the processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004366014A JP4681870B2 (ja) 2004-12-17 2004-12-17 画像処理装置、画像処理方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2006172284A true JP2006172284A (ja) 2006-06-29
JP4681870B2 JP4681870B2 (ja) 2011-05-11

Family

ID=36595812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004366014A Expired - Fee Related JP4681870B2 (ja) 2004-12-17 2004-12-17 画像処理装置、画像処理方法、コンピュータプログラム

Country Status (2)

Country Link
US (1) US7738702B2 (ja)
JP (1) JP4681870B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016071892A (ja) * 2014-09-30 2016-05-09 キヤノンマーケティングジャパン株式会社 帳票システムと、その処理方法及びプログラム
JP5945645B1 (ja) * 2016-02-09 2016-07-05 株式会社リクルートホールディングス 商品データ登録端末、商品データ登録方法および商品データ登録プログラム
JP2019057174A (ja) * 2017-09-21 2019-04-11 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP2022104498A (ja) * 2020-12-28 2022-07-08 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8455978B2 (en) 2010-05-27 2013-06-04 Sang-Yun Lee Semiconductor circuit structure and method of making the same
US20070283170A1 (en) * 2006-06-05 2007-12-06 Kabushiki Kaisha Toshiba System and method for secure inter-process data communication
JP5208043B2 (ja) * 2009-04-16 2013-06-12 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US8723335B2 (en) 2010-05-20 2014-05-13 Sang-Yun Lee Semiconductor circuit structure and method of forming the same using a capping layer
CN103544473B (zh) * 2013-09-17 2016-09-07 广东工业大学 一种基于机器视觉的电子连接器检测方法
CN104680161A (zh) * 2015-01-09 2015-06-03 安徽清新互联信息科技有限公司 一种身份证数字识别方法
CN106909216B (zh) * 2017-01-05 2020-05-22 华南理工大学 一种基于Kinect传感器的仿人机械手控制方法
CN107516090B (zh) * 2017-09-11 2021-09-17 北京百度网讯科技有限公司 一体化人脸识别方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0438585A (ja) * 1990-06-04 1992-02-07 Fuji Facom Corp 文字認識装置
JPH096899A (ja) * 1995-06-19 1997-01-10 Canon Inc 画像処理装置及び方法
JPH1011530A (ja) * 1996-06-25 1998-01-16 Canon Inc 画像入出力方法及び装置
JPH11306281A (ja) * 1998-04-27 1999-11-05 Nec Corp 認識条件指定方式および認識条件指定方法ならびに認識条件指定機能を計算機上に生成するプログラムを記録した記録媒体
JP2002269497A (ja) * 2001-03-07 2002-09-20 Ricoh Co Ltd 文書入力代行方法、文書入力代行システム及び記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61206090A (ja) * 1985-03-11 1986-09-12 Mitsubishi Electric Corp 文字読取装置
US5265174A (en) * 1989-03-03 1993-11-23 Canon Kabushiki Kaisha Pattern recognition apparatus
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
EP0677817B1 (en) * 1994-04-15 2000-11-08 Canon Kabushiki Kaisha Page segmentation and character recognition system
JP3423413B2 (ja) * 1994-06-21 2003-07-07 キヤノン株式会社 手書き情報認識装置及び方法
US6055333A (en) * 1995-12-28 2000-04-25 Motorola, Inc. Handwriting recognition method and apparatus having multiple selectable dictionaries
US6343148B2 (en) * 1998-07-22 2002-01-29 International Business Machines Corporation Process for utilizing external handwriting recognition for personal data assistants
JP4377494B2 (ja) * 1999-10-22 2009-12-02 東芝テック株式会社 情報入力装置
JP2002269253A (ja) 2001-03-13 2002-09-20 Ricoh Co Ltd 電子文書変換サービスシステムおよび電子文書変換サービスシステムの課金方法
JP2003084929A (ja) 2001-09-13 2003-03-20 Canon Inc 画像処理装置、画像処理方法およびプログラム
US20030164819A1 (en) * 2002-03-04 2003-09-04 Alex Waibel Portable object identification and translation system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0438585A (ja) * 1990-06-04 1992-02-07 Fuji Facom Corp 文字認識装置
JPH096899A (ja) * 1995-06-19 1997-01-10 Canon Inc 画像処理装置及び方法
JPH1011530A (ja) * 1996-06-25 1998-01-16 Canon Inc 画像入出力方法及び装置
JPH11306281A (ja) * 1998-04-27 1999-11-05 Nec Corp 認識条件指定方式および認識条件指定方法ならびに認識条件指定機能を計算機上に生成するプログラムを記録した記録媒体
JP2002269497A (ja) * 2001-03-07 2002-09-20 Ricoh Co Ltd 文書入力代行方法、文書入力代行システム及び記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016071892A (ja) * 2014-09-30 2016-05-09 キヤノンマーケティングジャパン株式会社 帳票システムと、その処理方法及びプログラム
JP5945645B1 (ja) * 2016-02-09 2016-07-05 株式会社リクルートホールディングス 商品データ登録端末、商品データ登録方法および商品データ登録プログラム
JP2017142615A (ja) * 2016-02-09 2017-08-17 株式会社リクルートホールディングス 商品データ登録端末、商品データ登録方法および商品データ登録プログラム
WO2017138592A1 (ja) * 2016-02-09 2017-08-17 株式会社リクルートホールディングス 商品データ登録端末、商品データ登録方法および商品データ登録プログラム
JP2019057174A (ja) * 2017-09-21 2019-04-11 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP7030462B2 (ja) 2017-09-21 2022-03-07 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP2022104498A (ja) * 2020-12-28 2022-07-08 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム
JP7417116B2 (ja) 2020-12-28 2024-01-18 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム

Also Published As

Publication number Publication date
US20060133671A1 (en) 2006-06-22
US7738702B2 (en) 2010-06-15
JP4681870B2 (ja) 2011-05-11

Similar Documents

Publication Publication Date Title
US7738702B2 (en) Image processing apparatus and image processing method capable of executing high-performance processing without transmitting a large amount of image data to outside of the image processing apparatus during the processing
JP6891073B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP6968647B2 (ja) スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
US7930292B2 (en) Information processing apparatus and control method thereof
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
JP5164368B2 (ja) 画像処理装置、画像処理方法
US8131081B2 (en) Image processing apparatus, and computer program product
JP6107756B2 (ja) 電子文書生成システム、電子文書生成装置およびプログラム
US20120011429A1 (en) Image processing apparatus and image processing method
US20020133543A1 (en) Device, method, and program for data transmission as well as computer readable recording medium stored with program
JP2019057174A (ja) スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP4956319B2 (ja) 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
US7792804B2 (en) Data registration method and apparatus
JPH08202607A (ja) 画像ファイリング方法及びその装置
US8219594B2 (en) Image processing apparatus, image processing method and storage medium that stores program thereof
US8743383B2 (en) Image processing apparatus storing destination information and information indicating whether a user is allowed to print image data and control method therefor
US7557943B2 (en) Image data management method of multiple sets of image data
JP5747344B2 (ja) 文書管理システム、文書管理サーバ及びその制御方法、プログラム
JP2004214991A (ja) 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法
JP2006331274A (ja) ネットワーク文書管理システム、及びその制御方法、並びに記憶媒体
US20100165395A1 (en) Image processing apparatus, image processing system, and control method for image processing apparatus
JP5800217B2 (ja) レンダリング方法
JP2009289265A (ja) 画像処理装置、画像処理方法
JP2022026215A (ja) 画像形成装置及びその制御方法、プログラム
KR100585752B1 (ko) 이동 통신 단말기의 문자 인식을 통한 문서 저장 및 전송방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071122

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110207

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140210

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees