JP4398474B2 - 画像内の処理対象の位置を特定する画像処理装置 - Google Patents

画像内の処理対象の位置を特定する画像処理装置 Download PDF

Info

Publication number
JP4398474B2
JP4398474B2 JP2006550542A JP2006550542A JP4398474B2 JP 4398474 B2 JP4398474 B2 JP 4398474B2 JP 2006550542 A JP2006550542 A JP 2006550542A JP 2006550542 A JP2006550542 A JP 2006550542A JP 4398474 B2 JP4398474 B2 JP 4398474B2
Authority
JP
Japan
Prior art keywords
image
image data
document
processing target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006550542A
Other languages
English (en)
Other versions
JPWO2006070476A1 (ja
Inventor
広隆 千葉
嗣男 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2006070476A1 publication Critical patent/JPWO2006070476A1/ja
Application granted granted Critical
Publication of JP4398474B2 publication Critical patent/JP4398474B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30144Printing quality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、スキャナやデジタルカメラ等の画像入力装置で入力された画像データから、画像データに含まれる処理対象の位置を特定する画像処理装置に関する。
図21は、従来の文字認識処理の入力と認識の例を示している。従来、手書き文字や活字文字を含む帳票等の原稿の文字認識処理を行う場合、以下の手順で画像処理を行っていた。
1.原稿サイズ以上の読み取り領域を有するフラットベットスキャナ等の画像入力装置で原稿全体を読み込んで、読み取り画像11を生成する。
2.認識処理時に、あらかじめ準備した原稿のレイアウト情報12を文字認識のテンプレートとして指定して、文字認識処理13を行う。
ここで、原稿全体を一度に読み取ることのできないハンドヘルドイメージスキャナやデジタルカメラ等の画像入力装置を用いた場合には、以下のいずれかの方法で文字認識処理を行う必要が生じる。
(1)原稿内の複数の領域のそれぞれについて、画像入力装置の大きさに合わせたレイアウト情報と処理方法を指定するテンプレートを作成しておき、ユーザが領域毎に使用するテンプレートを選択する。例えば、図22に示す例では、2つの読み取り画像14および15について、レイアウト情報16および17がそれぞれ選択され、文字認識処理18が行われる。
(2)読み取った画像データから元の原稿を再構成し、原稿全体をカバーする画像入力装置と同等な入力画像を準備する。
このうち、(2)については、原稿サイズよりも小さな画像入力装置で入力した画像を結合し、原画像を生成する方法が知られている(例えば、特許文献1参照)。この方法では、分割して読み取られた2つの文書画像の文字領域が検出され、文字認識部は、文字領域内の活字文字を認識して文字コードを取得する。重なり位置検出部は、2つの文書画像の文字領域間で、文字領域の位置および大きさと文字コードを比較し、一致度が高い行画像の位置を重なり位置として画像結合部に出力する。画像結合部は、その重なり位置で2つの文書画像を結合する。
しかしながら、この方法では、結合面に手書き文字がある場合には正しく文字認識することができず、正確な結合画像が生成されない。
また、文字認識処理では、あらかじめ準備したテンプレートを原稿に応じてユーザが選択するか、読み取り画像とすべてのテンプレートのマッチング処理を行う必要がある。
このとき、認識対象の領域を自動的に特定する方法として、図23に示すように、原稿21にバーコード(1次元コード)22と位置補正用の印23〜26を記録する方法が知られている(例えば、特許文献2参照)。バーコード22には、認識対象画像データとして抽出すべき領域27〜29および領域27〜29に対する画像処理内容が記録され、原稿21には、バーコード22に加えて、領域27〜29の位置補正用の印23〜26が記録される。
しかしながら、この方法では、バーコード22と位置補正用の印23〜26を記録する必要があり、かつ、印23〜26がすべて読めないような分割読み取りに対応することは不可能である。
特許文献3は、画像データとコードを組み合わせて印刷画像を生成する印刷情報処理システムに関し、特許文献4は、動画像のシーン変化を検出する方法に関する。
日本特許出願公開 特開2000−278514号公報 日本特許出願公開 特開2003−271942号公報 日本特許出願公開 特開2000−348127号公報 日本特許出願公開 特開平06−133305号公報
本発明の課題は、原稿全体を一度に読み取ることのできない画像入力装置で入力された画像データに含まれる処理対象の位置を自動的に特定することである。
本発明の画像処理装置は、格納部、認識部、および抽出部を備える。格納部は、複数の処理対象と複数のコードを含む原稿の部分画像の画像データを格納する。認識部は、それらのコードのうち部分画像に含まれるコードを認識して、そのコードに対する処理対象領域の相対的な位置を表す相対位置情報を取得する。抽出部は、相対位置情報を用いて部分画像内における処理対象領域の位置を特定し、特定された処理対象領域から処理対象の画像データを抽出する。
原稿内には、相対位置情報を取得するために必要なコードがあらかじめ複数個配置されている。例えば、画像入力装置により原稿が分割して読み取られた場合、原稿の一部分の画像が部分画像として格納部に格納される。認識部は、その部分画像に含まれるコードの認識処理を行い、認識結果に基づいて相対位置情報を取得する。抽出部は、得られた相対位置情報を用いて、コードに対応する処理対象領域の位置を特定し、処理対象の画像データを抽出する。
このような画像処理装置によれば、ハンドヘルドイメージスキャナやデジタルカメラ等の画像入力装置により入力された部分画像の画像データから、処理対象の画像データを自動的に抽出することができる。
格納部は、例えば、後述する図19のRAM(random access memory)1902に対応し、認識部および抽出部は、例えば、図19のCPU(Central Processing Unit )1904に対応する。
以下、図面を参照しながら、本発明を実施するための最良の形態を詳細に説明する。
本実施形態では、原稿サイズに依存しない画像入力装置を使用して原稿を読み取るために、1項目以上のレイアウト情報を記録したコードと項目を原稿内に配置する。そして、画像処理装置は、画像入力装置により入力された画像データから、まず、コードに記録されたレイアウト情報を認識し、次に、その情報から処理対象の項目の画像データを抽出する。
図1は、このようなコード画像処理において、原稿から読み取られた画像の例を示している。この場合、原稿内の各項目に対応するように2次元コード111−1〜111−4、112−1、112−2、113−1、および113−4が配置され、原稿は3つの画像101〜103に分割されて読み取られる。
各2次元コードには、2次元コードに対する項目領域の相対位置の情報と、原稿内における項目領域の絶対位置の情報を記録しておく。例えば、2次元コード111−1には、図2に示すように、項目領域201の相対位置および絶対位置の情報が記録される。相対位置は、2次元コード111−1の位置202を原点とする相対座標系における項目領域201の座標値で表される。また、絶対位置は、あらかじめ決められた原稿内の基準点203を原点とする絶対座標系における項目領域201の座標値で表される。
図3は、2次元コード111−1に記録された領域情報の例を示している。(20,−10)および(1000,40)は項目領域201の相対位置情報であり、(40,100)は項目領域201の絶対位置情報である。この例では、各項目に対して1つの2次元コードが設けられているが、複数の項目に対して1つの2次元コードが設けられる場合は、項目毎に領域情報が記録される。
原稿の読み取り後、画像処理装置は、2次元コードを認識してこの領域情報を取り出し、相対位置情報を用いて項目領域を特定し、その領域の画像データを切り出す。さらに、絶対位置情報を用いて、原稿全体の文字認識用のレイアウト情報から対象項目のレイアウト情報を切り出し、項目領域の画像データに対象項目のレイアウト情報を適用して、対象項目のみの文字認識処理を行う。
このような2次元コードを用いれば、原稿内の項目の画像データを切り出すとともに、原稿全体のレイアウト情報のうち項目に対応するレイアウト情報を切り出すことが可能になる。したがって、読み取り画像内に項目領域の位置補正用の印が含まれていなくても、文字認識処理を実行することができる。
図4は、このような画像データ抽出処理のフローチャートである。画像処理装置は、まず、原稿から画像を読み取り(ステップ401)、読み取った画像に含まれる2次元コードを認識する(ステップ402)。そして、認識結果に含まれる領域情報に基づいて、対応する項目領域の画像データを抽出する(ステップ403)。
次に、分割して読み取られた画像から原稿全体の画像を再構成する方法について説明する。この場合、2次元コードに原稿属性情報を記録しておき、画像処理装置は、原稿属性情報を用いて、各読み取り画像から抽出された画像データを再配置することにより、原稿画像を再構成する。
図5は、このような画像再構成処理を示している。この例では、図1に示した3つの読み取り画像101〜103から原稿画像501が生成される。例えば、2次元コード111−1〜111−4、112−1、112−2、113−1、および113−2には、図6に示すように、領域情報に加えて、原稿識別情報等の原稿属性情報が記録される。
画像処理装置は、複数回に分けて部分原稿の読み取りを行った後、各2次元コードを認識し、同じ原稿属性情報を有する2次元コードの領域情報に基づいて切り出された画像データを使用して、原稿画像501を再構成する。このとき、2次元コードの画像データを含めて再構成してもよく、2次元コードの画像データを削除して再構成してもよい。
このように、2次元コードに記録した原稿属性情報とレイアウト情報を使用することで、原稿を複数回に分けて読み取った場合でも、容易に元の原稿の画像を復元することができる。
図7は、このような画像再構成処理のフローチャートである。画像処理装置は、まず、原稿から画像を読み取り(ステップ701)、読み取った画像に含まれる2次元コードを認識する(ステップ702)。このとき、読み取った画像に2次元コードが含まれているか否かをチェックし(ステップ703)、2次元コードが含まれていれば、図4のステップ403と同様にして、項目領域の画像データを抽出する(ステップ705)。そして、ステップ701以降の処理を繰り返す。
ステップ703において画像に2次元コードが含まれていなければ、それまでに抽出された画像データのうち同じ原稿属性情報に対応するものを使用して、原稿画像を再構成する(ステップ704)。
次に、抽出された画像データに対して文字認識等の処理を自動的に適用する方法について説明する。この場合、2次元コードに処理情報を記録しておき、画像処理装置は、各読み取り画像から抽出された画像データに対して、処理情報により指定された処理を自動的に実行する。
2次元コードには、図8に示すように、領域情報および原稿属性情報に加えて、その項目領域に適用される処理を表すアクションが記録される。例えば、アクションとして文字認識およびサーバ保存が記録されていた場合、画像処理装置は、その情報に基づき、対応する項目領域の画像データの文字認識処理を行い、処理結果のデータをサーバに保存する。アクションとして、画像データをそのままファイルに保存する処理を記録しておくことも可能である。
このように、2次元コードに画像データの処理情報を記録しておくことで、文字認識や画像データのままの保存等、画像読み取り後の後処理を自動化することができる。したがって、項目毎に異なる処理を行う場合でも、ユーザは、画像データを手作業で分別して処理を実施する必要がない。
図9は、このような自動画像処理のフローチャートである。図9のステップ901〜903の処理は、図4のステップ401〜403の処理と同様である。画像データが抽出されると、画像処理装置は、対応する2次元コードに記録された処理情報に基づいて、指定された処理を自動的に実行する(ステップ904)。
次に、原稿幅よりも読み取り幅が小さな画像入力装置を使用した場合に、読み取り幅より大きな項目領域を分割して読み取る方法について説明する。例えば、デジタルカメラの接写撮影機能を使用した場合がこれに相当する。この場合、1つの項目領域に対して、2次元コードを同一原稿内の異なる場所に、例えば、項目領域を挟むようにして2個以上配置しておく。
図10は、このような2次元コードの配置例を示している。この例では、原稿1001の各項目を左右から挟むようにして、2次元コード1011−iと1012−i(i=1,2,3,4)が配置されている。
この原稿1001が画像1002と画像1003に分割されて読み取られた場合、画像処理装置は、2次元コード1012−iおよび1012−iに記録された相対位置情報を用いて、1つの項目に対応する画像データを2つの読み取り画像1002および1003からそれぞれ切り出す。そして、2次元コード1012−iおよび1012−iに記録された絶対位置情報を用いて、原稿全体の画像1004を再構成する。
これにより、1つの項目領域が2回に分けて読み取られた場合でも、その項目に対応する画像データを再構成して抽出することができる。
図11は、このような画像再構成処理のフローチャートである。図11のステップ1101〜1103および1105の処理は、図7のステップ701〜703および705の処理と同様である。
ステップ1103において画像に2次元コードが含まれていなければ、画像処理装置は、次に、項目領域の画像データが抽出されたか否かをチェックする(ステップ1104)。抽出された画像データがあれば、そのうちの1つの画像データを選択し(ステップ1106)、その画像データが1つの項目領域の分割部分に相当するか否かをチェックする(ステップ1107)。
画像データが分割部分に相当する場合、同じ項目領域に対応する他の分割部分の画像データを用いて、その項目領域全体の画像データを再構成する(ステップ1108)。そして、次の画像データについてステップ1104以降の処理を繰り返す。ステップ1107において画像データが1つの項目領域の全体に相当する場合は、そのままステップ1104以降の処理を繰り返す。
次に、原稿の使用可能領域を狭めることなく、2次元コードを配置する方法について説明する。この場合、2次元コードを項目の印刷色とは異なる色で、項目と重ねて印刷する。例えば、項目の内容が黒で印刷されている場合、2次元コードは黒以外の色で印刷される。これにより、2次元コードの追加のために原稿の使用面積が制限されることがなくなる。
図12は、このような原稿のレイアウト例を示している。この例では、各項目の印刷文字の上に、2次元コード1201−i(i=1,2,3,4)が異なる色で重ねて印刷されている。画像処理装置は、この原稿の読み取り画像から2次元コードのみを分離して認識し、項目領域の画像データを切り出す。異なる色を用いた2次元コードと文字の重畳印刷と認識には、例えば、前述した特許文献3に記載された方法が用いられる。
次に、領域情報等を2次元コードの代わりにデータ管理サーバに記録しておき、読み取り時に利用する方法について説明する。2次元コードは、記録される情報の量によって、ある程度の印刷面積を必要とする。そこで、2次元コードの面積をできるだけ小さくするために、上述した領域情報、原稿属性情報、および処理情報をサーバに記録し、2次元コードには、図13に示すように、サーバ内の情報を特定する保管番号等の識別情報のみを記録しておく。
画像処理装置は、2次元コードに記録された識別情報を用いてサーバを参照し、対応する項目の情報を取得する。そして、取得した情報を2次元コードの認識結果として用いて、項目領域の画像データを切り出し、文字認識等の必要な処理を行う。
このように、2次元コードに本来記録するべき内容をサーバに保存することで、2次元コードの印刷面積を小さくすることができる。
図14は、このような画像データ抽出処理のフローチャートである。図14のステップ1401、1402、および1404の処理は、図4のステップ401〜403の処理と同様である。ステップ1402において2次元コードが認識されると、画像処理装置は、認識結果の識別情報を用いてデータ管理サーバを参照し、対応する保存情報を取得する(ステップ1403)。そして、認識結果を取得情報と置き換えて、項目領域の画像データを抽出する。
ところで、ハンドヘルドイメージスキャナやデジタルカメラの他に、動画像撮影が可能な動画像入力カメラもある。このような入力装置を用いた場合、従来のコード認識では、入力動画像を順次認識しながらコード認識を行っていた。しかし、本実施形態では、原稿に含まれる2次元コードと項目領域の両方の画像が同時に必要であり、2次元コードと項目領域が入力対象として確定したところで、画像認識を行う必要がある。従来のコード認識はコードのみに着目していたので、本実施形態の認識処理には適用できない。
そこで、本実施形態では、原稿を移動させて静止したところを入力対象とする原稿の移動動作に着目し、原稿の動画像を入力しながらシーン検出処理を行って、動画像から原稿の動きを検出し、原稿が静止したときに認識処理を行うように、画像処理装置を制御する。
図15は、このような画像処理装置の構成図である。図15の画像処理装置は、動画像入力装置1501、動き検出部1502、およびコード認識部1503を備える。動画像入力装置1501は、例えば、図16に示すような動画像入力カメラ1601であり、その下を移動する原稿1602の動画像を入力する。
動き検出部1502は、シーン検出処理を行って、動画像に含まれる認識対象の動きを検出する。このシーン検出処理では、例えば、前述した特許文献4に記載された方法が用いられ、動画像を符号化してその符号量の変化からシーン変化を検出する。コード認識部1503は、認識対象が静止したことが検出されたときに、2次元コードの認識処理を行って、対応する項目領域の画像データ1504を切り出す。
例えば、動画像の符号量が図17に示すように変化した場合、時刻T1からT2までの間は原稿が移動しているとみなされ、時刻T2以降は静止しているとみなされる。そこで、コード認識部1503は、原稿が安定するまで待って、時刻T3に認識処理を開始する。
シーン検出の結果により認識処理を制御することで、動画像入力カメラにより入力された画像に対しても、本発明を適用することが可能になる。
図18は、このようなコード認識処理のフローチャートである。画像処理装置は、まず、原稿の動画像を入力し(ステップ1801)、シーン検出処理を行って(ステップ1802)、認識対象が静止したか否かをチェックする(ステップ1803)。認識対象が静止していなければ、ステップ1801以降の処理を繰り返し、認識対象が静止すれば、その画像に含まれる2次元コードの認識処理を行う(ステップ1804)。
図19は、上述した画像処理装置を情報処理装置(コンピュータ)を用いて構成した場合の構成図である。図19の画像処理装置は、通信装置1901、RAM(random access memory)1902、ROM(read only memory)1903、CPU(Central Processing Unit )1904、媒体駆動装置1905、外部記憶装置1906、画像入力装置1907、表示装置1908、および入力装置1909を備え、それらはバス1910により互いに接続されている。
RAM1902は、入力された画像データを格納し、ROM1903は、処理に用いられるプログラム等を格納する。CPU1904は、RAM1902を利用してプログラムを実行することにより、必要な処理を行う。図15の動き検出部1502およびコード認識部1503は、RAM1902またはROM1903に格納されたプログラムに対応する。
入力装置1909は、例えば、キーボード、ポインティングデバイス、タッチパネル等であり、ユーザからの指示や情報の入力に用いられる。画像入力装置1907は、例えば、ハンドヘルドイメージスキャナ、デジタルカメラ、動画像入力カメラ等であり、原稿画像の入力に用いられる。また、表示装置1908は、ユーザへの問い合わせや処理結果等の出力に用いられる。
外部記憶装置1906は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。画像処理装置は、この外部記憶装置1906に、プログラムおよびデータを格納しておき、必要に応じて、それらをRAM1902にロードして使用する。
媒体駆動装置1905は、可搬記録媒体1911を駆動し、その記録内容にアクセスする。可搬記録媒体1911は、メモリカード、フレキシブルディスク、光ディスク、光磁気ディスク等の任意のコンピュータ読み取り可能な記録媒体である。ユーザは、この可搬記録媒体1911にプログラムおよびデータを格納しておき、必要に応じて、それらをRAM1902にロードして使用する。
通信装置1901は、LAN(Local Area Network)等の任意の通信ネットワークに接続され、通信に伴うデータ変換を行う。画像処理装置は、必要に応じて、プログラムおよびデータを外部の装置から通信装置1901を介して受け取り、それらをRAM1902にロードして使用する。通信装置1901は、図14のステップ1403においてデータ管理サーバにアクセスする際にも用いられる。
図20は、図19の画像処理装置にプログラムおよびデータを提供する方法を示している。可搬記録媒体1911やサーバ2001のデータベース2011に格納されたプログラムおよびデータは、画像処理装置2002のRAM1902にロードされる。サーバ2001は、そのプログラムおよびデータを搬送する搬送信号を生成し、ネットワーク上の任意の伝送媒体を介して画像処理装置2002に送信する。CPU1904は、そのデータを用いてそのプログラムを実行し、必要な処理を行う。
分割して読み取られた画像を示す図である。 2次元コードと項目領域を示す図である。 領域情報を示す図である。 第1の画像データ抽出処理のフローチャートである。 第1の画像再構成処理を示す図である。 原稿属性情報を示す図である。 第1の画像再構成処理のフローチャートである。 処理情報を示す図である。 自動画像処理のフローチャートである。 第2の画像再構成処理を示す図である。 第2の画像再構成処理のフローチャートである。 2次元コードと文字の重畳印刷を示す図である。 サーバ内保管番号を示す図である。 第2の画像データ抽出処理のフローチャートである。 動画像を入力してコード認識を行う画像処理装置の構成図である。 動画像の入力方法を示す図である。 動画像における符号量の変化を示す図である。 動画像を入力してコード認識を行う処理のフローチャートである。 画像処理装置の構成図である。 プログラムおよびデータの提供方法を示す図である。 従来の第1の文字認識処理を示す図である。 従来の第2の文字認識処理を示す図である。 従来の認識対象特定方法を示す図である。

Claims (9)

  1. 複数の処理対象と複数のコードを含む原稿が複数部分に分割して読み取られたとき、各部分の部分画像の画像データを格納する格納部と、
    前記複数のコードのうち前記部分画像に含まれるコードを認識して、該コードに対する処理対象領域の相対的な位置を表す相対位置情報および原稿属性情報を取得する認識部と、
    前記相対位置情報を用いて前記部分画像内における前記処理対象領域の位置を特定し、特定された処理対象領域から処理対象の画像データを抽出し、抽出された画像データから前記原稿属性情報に従って原稿全体の画像データを構成する抽出部と
    を備えることを特徴とする画像処理装置。
  2. 複数の処理対象と複数のコードを含む原稿が複数部分に分割して読み取られたとき、各部分の部分画像の画像データを入力して格納部に格納し、
    前記複数のコードのうち部分画像に含まれるコードを認識して、該コードに対する処理対象領域の相対位置を表す相対位置情報および原稿属性情報を取得し、
    前記相対位置情報を用いて部分画像内における前記処理対象領域の位置を特定し、
    特定された処理対象領域から処理対象の画像データを抽出し、
    抽出された画像データから前記原稿属性情報に従って原稿全体の画像データを構成する処理をコンピュータに実行させることを特徴とするプログラム。
  3. 前記部分画像に含まれるコードから、前記原稿内における前記処理対象領域の絶対位置を表す絶対位置情報を取得し、該絶対位置情報を用いて原稿全体のレイアウト情報から該処理対象領域のレイアウト情報を抽出し、前記処理対象の画像データに該処理対象領域のレイアウト情報を適用して、該処理対象の画像データの文字認識を行う処理を、前記コンピュータに実行させることを特徴とする請求項2記載のプログラム。
  4. 前記複数の処理対象のうち少なくとも1つの処理対象に対応して、前記原稿内の異なる場所に2個以上のコードが配置されており、該処理対象の処理対象領域が複数部分に分割して読み取られたとき、前記相対位置情報を用いて各部分画像から処理対象の一部の画像データを抽出し、抽出された画像データから該処理対象全体の画像データを構成する処理を、前記コンピュータに実行させることを特徴とする請求項2記載のプログラム。
  5. 前記部分画像に含まれるコードから、前記処理対象の画像データに対して実行すべき処理を表す処理情報を取得し、該処理情報により指定された処理を、前記コンピュータに実行させることを特徴とする請求項2記載のプログラム。
  6. 前記原稿内において前記処理対象とコードが異なる色で重ねて印刷されているとき、前記部分画像から該コードを分離して認識する処理を、前記コンピュータに実行させることを特徴とする請求項2記載のプログラム。
  7. 前記相対位置情報がサーバに保存されているとき、前記部分画像に含まれるコードから、該サーバ内の相対位置情報を特定する識別情報を取得し、該識別情報を用いて該サーバから該相対位置情報を取得する処理を、前記コンピュータに実行させることを特徴とする請求項2記載のプログラム。
  8. 前記原稿の動画像を入力しながら該原稿が移動しているか否かを検出し、該原稿が静止したときに入力された部分画像を用いて、該部分画像に含まれるコードを認識する処理を、前記コンピュータに実行させることを特徴とする請求項2記載のプログラム。
  9. 格納部が、複数の処理対象と複数のコードを含む原稿が複数部分に分割して読み取られたとき、各部分の部分画像の画像データを入力して格納部に格納し、
    認識部が、前記複数のコードのうち前記部分画像に含まれるコードを認識して、該コードに対する処理対象領域の相対位置を表す相対位置情報および原稿属性情報を取得し、
    抽出部が、前記相対位置情報を用いて前記部分画像内における前記処理対象領域の位置を特定し、特定された処理対象領域から処理対象の画像データを抽出し、抽出された画像データから前記原稿属性情報に従って原稿全体の画像データを構成する
    ことを特徴とする画像処理方法。
JP2006550542A 2004-12-28 2004-12-28 画像内の処理対象の位置を特定する画像処理装置 Expired - Fee Related JP4398474B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2004/019648 WO2006070476A1 (ja) 2004-12-28 2004-12-28 画像内の処理対象の位置を特定する画像処理装置

Publications (2)

Publication Number Publication Date
JPWO2006070476A1 JPWO2006070476A1 (ja) 2008-06-12
JP4398474B2 true JP4398474B2 (ja) 2010-01-13

Family

ID=36614603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006550542A Expired - Fee Related JP4398474B2 (ja) 2004-12-28 2004-12-28 画像内の処理対象の位置を特定する画像処理装置

Country Status (4)

Country Link
US (1) US20070242882A1 (ja)
EP (1) EP1833022A4 (ja)
JP (1) JP4398474B2 (ja)
WO (1) WO2006070476A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7574063B2 (en) * 2003-07-23 2009-08-11 Canon Kabushiki Kaisha Image coding method and apparatus
GB0702090D0 (en) * 2007-02-02 2007-03-14 Fracture Code Corp Aps Virtual code window
JP2008193580A (ja) * 2007-02-07 2008-08-21 Ricoh Co Ltd 情報処理装置
JP2010160636A (ja) * 2009-01-07 2010-07-22 Koncheruto:Kk 不動産登記関係書類の作成支援装置
FR2946773A1 (fr) * 2009-06-12 2010-12-17 Bertrand Labaye Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique.
GB2473228A (en) * 2009-09-03 2011-03-09 Drs Data Services Ltd Segmenting Document Images
JP5479083B2 (ja) * 2009-12-25 2014-04-23 キヤノン株式会社 画像処理装置及びその制御方法並びにプログラム
EP2362327A1 (en) 2010-02-19 2011-08-31 Research In Motion Limited Method, device and system for image capture, processing and storage
JP2011227543A (ja) * 2010-04-15 2011-11-10 Panasonic Corp 帳票処理装置及び帳票処理方法及び記録媒体
FR2993082B1 (fr) * 2012-07-05 2014-06-27 Holdham Surface imprimee et dispositif et procede de traitement d'images d'une telle surface imprimee
JP6179592B2 (ja) * 2013-05-31 2017-08-16 日本電気株式会社 画像認識装置、その処理方法、およびプログラム
JP2015049833A (ja) * 2013-09-04 2015-03-16 トッパン・フォームズ株式会社 帳票情報入力システム
US9298997B1 (en) * 2014-03-19 2016-03-29 Amazon Technologies, Inc. Signature-guided character recognition
FR3028644B1 (fr) * 2014-11-13 2018-02-02 Advanced Track & Trace Formulaires, dispositifs mettant en œuvre ce formulaire et procedes mettant en œuvre ce formulaire
US10395081B2 (en) * 2016-12-09 2019-08-27 Hand Held Products, Inc. Encoding document capture bounds with barcodes
JP6954229B2 (ja) * 2018-05-25 2021-10-27 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像形成装置
US20220024241A1 (en) * 2018-10-09 2022-01-27 Interman Corporation Portable type calendar and notebook
CN112789179B (zh) 2018-10-09 2023-05-09 因特曼股份有限公司 笔记本及页摄影分离应用程序

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58103266A (ja) * 1981-12-15 1983-06-20 Toshiba Corp 文字画像処理装置
JPH0359778A (ja) * 1989-07-28 1991-03-14 Toshiba Corp 画像処理装置
EP0610968A1 (en) * 1989-12-13 1994-08-17 Mita Industrial Co. Ltd. Image forming apparatus
JP3183691B2 (ja) * 1991-11-19 2001-07-09 株式会社リコー 画像合成装置
US5307423A (en) * 1992-06-04 1994-04-26 Digicomp Research Corporation Machine recognition of handwritten character strings such as postal zip codes or dollar amount on bank checks
JP3193928B2 (ja) * 1992-06-29 2001-07-30 株式会社東芝 画像形成装置
JP3315766B2 (ja) * 1992-09-07 2002-08-19 富士通株式会社 画像データ符号化方法、その方法を用いた画像データ符号化装置、画像データ復元方法、その方法を用いた画像データ復元装置、シーン変化検出方法、その方法を用いたシーン変化検出装置、シーン変化記録装置、及び画像データのシーン変化記録・再生装置
US5452105A (en) * 1992-11-19 1995-09-19 Sharp Kabushiki Kaisha Joint-portion processing device for image data for use in an image processing apparatus
JPH09285763A (ja) * 1996-04-22 1997-11-04 Ricoh Co Ltd 画像読取印刷装置
DE69737495T2 (de) * 1997-04-14 2008-01-10 Hewlett-Packard Development Company, L.P., Houston Verfahren und Vorrichtung zur Bildabtastung
JPH1125209A (ja) * 1997-07-04 1999-01-29 Toshiba Corp 情報入力装置、情報入力方法、記憶媒体、及び二次元バーコード印刷装置
JPH1185895A (ja) * 1997-09-03 1999-03-30 Olympus Optical Co Ltd コードパターン読取装置
JPH1186014A (ja) * 1997-09-08 1999-03-30 Fujitsu Ltd 文書画像表示方法および表示装置
JP3432736B2 (ja) * 1997-10-29 2003-08-04 シャープ株式会社 画像処理装置
JP3821267B2 (ja) * 1999-01-18 2006-09-13 富士通株式会社 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
US6594403B1 (en) * 1999-01-29 2003-07-15 Xerox Corporation Systems and methods for registering scanned documents
JP4148597B2 (ja) * 1999-06-03 2008-09-10 富士通株式会社 印刷情報処理システム、印刷装置および記録媒体
JP2002052366A (ja) * 2000-08-10 2002-02-19 Toshiba Corp 区分装置と区分情報の認識方法
JP2003216893A (ja) * 2002-01-23 2003-07-31 Sharp Corp カメラ付携帯情報端末
US20030142358A1 (en) * 2002-01-29 2003-07-31 Bean Heather N. Method and apparatus for automatic image capture device control
JP4019063B2 (ja) * 2003-04-18 2007-12-05 光雄 中山 光学端末装置、画像処理方法およびシステム
EP1619874B1 (en) * 2003-04-25 2016-02-03 Oki Data Corporation Watermark information detection method

Also Published As

Publication number Publication date
EP1833022A4 (en) 2010-07-14
WO2006070476A1 (ja) 2006-07-06
EP1833022A1 (en) 2007-09-12
JPWO2006070476A1 (ja) 2008-06-12
US20070242882A1 (en) 2007-10-18

Similar Documents

Publication Publication Date Title
JP4398474B2 (ja) 画像内の処理対象の位置を特定する画像処理装置
JP5364845B2 (ja) オーバーヘッドスキャナ装置、画像処理方法、および、プログラム
RU2421814C2 (ru) Способ формирования составного изображения
US10671662B2 (en) Method and system for analyzing an image generated by at least one camera
US10007846B2 (en) Image processing method
US20130250379A1 (en) System and method for scanning printed material
US20170099403A1 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
US7864985B1 (en) Automatic operator-induced artifact detection in document images
JP2007141159A (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP2017120503A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
US8355583B2 (en) Image processing apparatus and apparatus for searching operator
JP5094682B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2006018754A (ja) 指紋読取方法、指紋読取システム及びプログラム
CN114139666A (zh) 物料标识标签的生成方法、装置、计算机设备和存储介质
US10703112B2 (en) Image to script converter
EP1202213A2 (en) Document format identification apparatus and method
JP2022069813A (ja) 文字読取装置及び検査装置
US20160295036A1 (en) Image processing device, image processing method, program, and recording medium
JP5147640B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2002024838A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP7318289B2 (ja) 情報処理装置およびプログラム
JP2003223610A (ja) 文字認識装置及び文字認識方法
JP6907565B2 (ja) 画像処理装置および画像処理プログラム
JP6639257B2 (ja) 情報処理装置及びその制御方法
US20110157658A1 (en) Imaging processing apparatus, method for controlling the same, and program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091020

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091022

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees