JP4738180B2 - 画像処理装置および電子ファイル生成方法 - Google Patents

画像処理装置および電子ファイル生成方法 Download PDF

Info

Publication number
JP4738180B2
JP4738180B2 JP2006008495A JP2006008495A JP4738180B2 JP 4738180 B2 JP4738180 B2 JP 4738180B2 JP 2006008495 A JP2006008495 A JP 2006008495A JP 2006008495 A JP2006008495 A JP 2006008495A JP 4738180 B2 JP4738180 B2 JP 4738180B2
Authority
JP
Japan
Prior art keywords
image
character data
file
data
dimensional code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006008495A
Other languages
English (en)
Other versions
JP2007193409A (ja
Inventor
泰久 小出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2006008495A priority Critical patent/JP4738180B2/ja
Priority to US11/653,248 priority patent/US7835037B2/en
Priority to EP07100676.1A priority patent/EP1808799B1/en
Publication of JP2007193409A publication Critical patent/JP2007193409A/ja
Application granted granted Critical
Publication of JP4738180B2 publication Critical patent/JP4738180B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)
  • Character Discrimination (AREA)

Description

本発明は、符号化コードの含まれる紙文書を光学的読み取り処理(スキャン)して電子ファイル化する画像処理において、符号化コードに含まれる文書等の関連情報を電子ファイル内に埋め込み、電子ファイルの全文検索時には関連情報を含めて検索対象とし、実用性の高い検索を可能とした画像処理装置および電子ファイル生成方法に関するものである。
近年、インターネットに接続することにより、多くの情報を取得することが可能となっており、また、誰でも容易にインターネットに接続できる環境も整っている。そして、雑誌、新聞記事、広告等の視認可能に印刷された画像や文字の情報において、表示することのできないさらに詳細な情報を開示するために、この視認可能な情報に加えて2次元コードを付与して、これに関連するより詳細な情報を得られるように、関連情報のURL(Uniform Resource Locator)、リンク先等を表示することが行われている。
これに伴い2次元コードを用いて、バイナリデータまたは文字データ等を符号化して画像データとすることが普及している。例えば、2次元コードの1つであるQRコード(登録商標)はエラーコレクションコードを有する信頼性の高い符号化手段であり、JIS(日本工業標準調査会)により標準化されている(非特許文献1参照)。そして、従来の符号化コードとして用いられているバーコードと比較して、2次元コードは多くのデータをコード化することが可能となっている。
特許文献1には、前述したように2次元コードとしてURLを挿入した文書を紙文書に印刷し、紙文書をカメラにて読み取る際に2次元コードから復号したURL情報を表示する情報閲覧システムが提案され特許登録されている。また、特許文献2には、紙文書内の2次元コード等の付加情報(格納場所を示すポインタ情報)を用いて、データベース内の関連文書を検索する画像処理システムに関する技術が公開されている。
さらに、紙文書等に印刷された状態で管理されていた文字情報も、光学的読取装置等により電子データとして画像データに変換され、さらにはOCR(Optical Character Recognition)処理することにより文字データに変換され、電子ファイル化することも行われている。
特許第3518304号 特開2005−149096号公報 財団法人日本規格協会 番号:JIS X0510 「2次元コードシンボル(QRコード基本仕様)」
しかしながら、前述の特許文献2に記載の技術によると、2次元コードなどの符号化コードを用いてデータベース内の文書を容易に検索することが可能となるが、例えば符号化コードを含む電子文書が、構築されたデータベースの外に持ち出された場合は、符号化された付加情報にアクセスするときに、再度符号化コードをデコードしてもアクセスすることができない。
また、特許文献1の場合にも、符号化コードの付加情報に含まれている情報は関連文書の位置情報を示したURLなどのリンク情報に過ぎないため、文書内の文字情報を検索する全文検索を行うシステムなどでは文書情報の符号化コードをデコードしてURL等のリンク先にアクセスしない限り、そのリンク先の文書情報の内容についての検索結果を得ることは不可能であった。
本発明は、前記背景技術の問題を解決することに指向するものであり、紙文書において関連した情報としてファイル位置情報を含んだ符号化コードを有する場合に、この紙文書から読み取った画像データを電子ファイル化する際、紙文書に有する符号化コードの関連する情報から得られる文字データも含んだ文書ファイルを作成して、文書ファイルを全文検索する際には、紙文書の文字データと符号化コードの関連する情報の文字データに対して、高速なキーワード検索を実行することを可能とした画像処理装置および電子ファイル生成方法を提供することを目的とする。
(1)原稿の画像を読み取り該画像を表す画像データを生成する画像読取り装置(8);
前記画像データの中の前記原稿上の2次元コード画像の2次元コードを検出する検出手段(901);
前記2次元コードを抽出する抽出手段(902);
該抽出手段が抽出した2次元コードを復号するデコーダ(903);
該デコーダが復号したデータに基づき該データに関連するファイルを検索し、該ファイルの文字データを検索する文字データ検索手段(904);
画像データが表す画像の文字を検出四文字データを生成するOCR処理手段(905);および、
原稿を読取った前記画像データから前記OCR処理手段が生成した文字データに前記検索手段が検索した文字データを追加したテキストデータを電子ファイル化するファイル作成手段(910);
を備えた画像処理装置(1)。
これによれば、電子ファイル化した紙文書から読み取った画像データに有する2次元コードに含まれる関連情報を、テキストデータの全文検索の対象とでき、実用性の高い検索ができる。
なお、理解を容易にする為に括弧内には、図面に示し後述する実施態様の対応又は相当要素の符号を、例示として参考までに付記した。以下も同様である。
(2)画像データが表す画像の文字を検出し文字データを生成するOCR処理手段(905);および、前記文字データ検索手段(904)が文字データを検索しなかった場合に、前記ファイルに対して前記OCR処理手段(905)を用いて文字認識をして文字データを生成し出現回数が多い文字データを前記追加する文字データとして前記ファイル作成手段(910)に与える文字データ作成手段(906);を更に備える、上記(1)に記載の画像処理装置。
(3)前記文字データ作成手段(906)は、前記OCR処理手段(905)が前記ファイルに対して文字認識をして生成した文字データに対して単語検索して出現回数が多い単語を抽出して該単語を表す文字データを前記追加する文字データとして前記ファイル作成手段(910)に与える;上記(2)に記載の画像処理装置。
(4)ファイルの音声情報を検出し該音声情報が表す文字の文字データを生成する音声処理手段(907);および、前記文字データ検索手段(904)が文字データを検索しなかった場合に、前記ファイルに対して前記音声処理手段(907)を用いて音声認識をして文字データを生成し出現回数が多い文字データを前記追加する文字データとして前記ファイル作成手段(910)に与える文字データ作成手段(906);を更に備える、上記(1)に記載の画像処理装置。
(5)前記文字データ作成手段(906)は、前記音声処理手段(907)が生成した文字データに対して単語検索して出現回数が多い単語を抽出して該単語を表す文字データを前記追加する文字データとして前記ファイル作成手段(910)に与える;上記(4)に記載の画像処理装置。
(6)前記ファイル作成手段(910)は、前記文字データ作成手段(906)が作成した文字データを、複数のレイヤーで構成された電子ファイルの、前記レイヤーの少なくとも1つに追加する;上記()〜(5)のいずれか1つに記載の画像処理装置。
(7)前記ファイル作成手段(910)は、前記文字データ作成手段(906)が作成した文字データを、テキストレイヤー,画像レイヤーで構成された電子ファイルの、前記テキストレイヤーに追加する;上記()〜(5)のいずれか1つに記載の画像処理装置。
(8)前記ファイル作成手段(910)は、前記原稿の前記2次元コード画像があった位置又はその近傍に、前記文字データ作成手段が作成した文字データを配置する;上記(6)または(7)記載の画像形成装置。
(9)前記2次元コード画像の2次元コードを検出する検出手段(901)は、前記画像読取り装置(8)が生成した画像データ内から前記2次元コード画像の矩形を抽出することにより、復号化する2次元コードの画像データを選択する;上記(1)に記載の画像処理装置。
(10)原稿の画像を読み取り該画像を表す画像データを生成する画像読取り装置(8),画像データが表す画像の文字を検出し文字データを生成するOCR処理手段(905)および該OCR処理手段が生成した文字データを電子ファイル化する手段(A,B)を含む画像処理装置(1)の、
前記画像読取り装置(8)によって原稿の画像を読み取り該画像を表す画像データを生成し、
前記電子ファイル化する手段(A,B)によって、前記画像データの中の前記原稿上の2次元コード画像の2次元コードを検出し、検出した2次元コードを抽出し、抽出した2次元コードを復号し、復号したデータに基づき該データに関連するファイルを検索し、該ファイルの文字データを検索し、該文字データを、原稿を読取った前記画像データから前記OCR処理手段が生成した文字データに追加したテキストデータを電子ファイル化する、電子ファイル生成方法。
これによれば、電子ファイル化した紙文書から読み取った画像データに有する2次元コードに含まれる関連情報を、テキストデータの全文検索の対象とでき、実用性の高い検索ができる。
(11)前記画像処理装置(1)は、画像データが表す画像の文字を検出し文字データを生成するOCR処理手段(905)を含み;前記電子ファイル化する手段(A,B)は、前記ファイルの文字データの検索で文字データ得られない場合には、前記ファイルに対して前記OCR処理手段(905)を用いて文字認識をして文字データを生成し出現回数が多い文字データを前記追加する文字データとする;上記(10)に記載の電子ファイル生成方法。
(12)前記電子ファイル化する手段(A,B)は、前記OCR処理手段(905)が生成した文字データに対して単語検索して出現回数が多い単語を抽出して該単語を表す文字データを前記追加する文字データとする;上記(11)に記載の電子ファイル生成方法。
(13)前記画像処理装置(1)は、ファイルの音声情報を検出し該音声情報が表す文字の文字データを生成する音声処理手段(907)を含み;前記電子ファイル化する手段(A,B)は、前記ファイルの文字データの検索で文字データ得られない場合には、前記ファイルに対して前記音声処理手段(907)を用いて音声認識をして文字データを生成し出現回数が多い文字データを前記追加する文字データとする;上記(10)に記載の電子ファイル生成方法。
(14)前記電子ファイル化する手段(A,B)は、前記音声処理手段(907)が生成した文字データに対して単語検索して出現回数が多い単語を抽出して該単語を表す文字データを前記追加する文字データとする;上記(13)に記載の電子ファイル生成方法。
(15)前記電子ファイル化する手段(A,B)は、前記追加する文字データを、複数のレイヤーで構成された電子ファイルの、前記レイヤーの少なくとも1つに追加する;上記(10)〜(14)のいずれか1つに記載の電子ファイル生成方法。
(16)前記電子ファイル化する手段(A,B)は、前記追加する文字データを、テキストレイヤー,画像レイヤーで構成された電子ファイルの、前記テキストレイヤーに追加する;上記(10)〜(14)のいずれか1つに記載の電子ファイル生成方法。
(17)前記電子ファイル化する手段(A,B)は、前記原稿の前記2次元コード画像があった位置又はその近傍に、前記追加する文字データを配置する;上記(15)又は(16)に記載の電子ファイル生成方法。
(18)前記電子ファイル化する手段(A,B)は、前記2次元コード画像の2次元コードの検出において、前記画像読取り装置(8)が生成した画像データ内から前記2次元コード画像の矩形を抽出することにより、復号化する2次元コードの画像データを選択する;上記(10)に記載の電子ファイル生成方法。
本発明によれば、電子ファイル化した紙文書から読み取った画像データに有する2次元コードに含まれた関連情報も、テキストデータの全文検索の対象として実用性の高い検索ができるという効果を奏する。
以下、図面を参照して本発明における実施形態を詳細に説明する。また、本発明の実施形態においては、画像処理装置として、コピー機能,ファクシミリ(FAX)機能,プリント機能,スキャナ機能および入力画像(前述の各機能において入力された画像)を配信する機能等を複合したいわゆるMFP(Multi Function Peripheral)と称されるデジタルカラー複合機に適用した例を示す。
図1は本実施形態の画像処理装置であるデジタルカラー複合機を概略的に示す外観斜視図である。デジタルカラー複合機1は、転写紙などの媒体に画像を形成する画像形成手段である印刷装置7の上部に、原稿から画像を読み取る画像読取手段である画像読取装置8を配設した構成とされている。
また、画像読取装置8の装置外面には、オペレータに対する表示とオペレータからの機能設定等の各種の入力を許容する操作パネルPが設けられている。さらに、操作パネルPの下部には、記憶媒体M(図示せず)に記憶されているプログラムコードや画像データ等を読み取る、または記憶媒体Mに対してプログラムコードや画像データ等を書き込む装置である外部メディア入出力装置9が、記憶媒体Mの挿入を許容する挿入口を外部に露出させて設けられている。
図2は本実施形態のデジタルカラー複合機の概略構成を示すブロック図である。図2に示すように、画像処理ユニット部Aと情報処理ユニット部Bとに大別されており、図1に示した印刷装置7および画像読取装置8は画像処理ユニット部Aに属し、操作パネルPおよび外部メディア入出力装置9は情報処理ユニット部Bに属している。
まず、画像処理ユニット部Aについて説明する。印刷装置7および画像読取装置8を備える画像処理ユニット部Aは、画像処理ユニット部Aにおける画像処理全般の制御を行う画像処理制御ユニット10を備えており、この画像処理制御ユニット10には、印刷装置7を制御する印刷制御ユニット11と、画像読取装置8を制御する画像読取制御ユニット12とが接続されている。
そして、印刷制御ユニット11は、画像処理制御ユニット10の制御に従って印刷装置7に対して画像データを含む印刷指示を出力し、印刷装置7に転写紙などの媒体に画像を形成して出力させる。また、画像読取制御ユニット12は、画像処理制御ユニット10の制御により画像読取装置8を駆動し、原稿の表面に対するランプ照射の反射光をミラーおよびレンズにより受光素子(例えば、CCD(Charge Coupled Device)に集光して読み取り、A/D変換してRGB各8bitのデジタル画像データを生成する。
このような画像処理制御ユニット10は、メインプロセッサであるCPU(Central Processing Unit)13と、画像読取装置8から読み込んだ画像データを印刷装置7による作像に供すべく一旦格納しておくメモリデバイス(例えば、SDRAM(Synchronous Dynamic Random Access Memory)等)14と、制御プログラム等を記憶したROM(Read Only Memory)15と、システムログ,システム設定,ログ情報等を記録しておく電源オフ時にもデータの保持が可能なNVRAM16とをバス接続したマイクロコンピュータ構成とされている。
また、画像処理制御ユニット10には、多量の画像データの蓄積やジョブ履歴等の記憶装置となるHDD(Hard Disk Drive)17、装置内部に設けられた集線装置であるHUB19を介して画像処理ユニット部AをLAN2に接続するためのLAN制御部18、FAX制御を行うFAX制御ユニット20が接続されている。このFAX制御ユニット20は、公衆電話網21に通じる構内交換機(PBX)22に接続されており、デジタルカラー複合機1は、遠隔のファクシミリ装置と交信することができる。
加えて、画像処理制御ユニット10には、表示制御ユニット23および操作入力制御ユニット24が接続されている。表示制御ユニット23は、画像処理制御ユニット10のコントロールによって制御パネルI/F25に接続された通信ケーブル26を介して情報処理ユニット部Bに対して画像表示制御信号を出力し、情報処理ユニット部Bの操作パネルPに対して画像表示の制御を行う。
また、操作入力制御ユニット24は、情報処理ユニット部Bの操作パネルPからのオペレータによる機能設定や入力操作に応じた入力制御信号を、画像処理制御ユニット10のコントロールによって制御パネルI/F25に接続された通信ケーブル26を介して入力する。すなわち、画像処理ユニット部Aは、情報処理ユニット部Bの操作パネルPを通信ケーブル26を介して直接モニタすることができる構成になっている。
したがって、画像処理ユニット部Aは、従来の画像処理装置が備える画像処理ユニットに対して通信ケーブル26を接続し、情報処理ユニット部Bの操作パネルPを利用するようにしたものである。すなわち、画像処理ユニット部Aの表示制御ユニット23および操作入力制御ユニット24は、操作パネルPに接続されているものとして動作している。
このような構成により、画像処理ユニット部Aは、外部(LAN2を介してサーバーコンピュータ3,クライアントコンピュータ4と、公衆電話網21を介してファクシミリ装置5等)からの画像情報である印刷データおよびプリント指示するコマンドを解析し、印刷データを出力画像データとして印刷できる状態にビットマップ展開し、印刷モードをコマンドから解析し動作を決定している。その印刷データおよびコマンドをLAN制御部18あるいはFAX制御ユニット20を通じて受信し動作する。
また、画像処理ユニット部Aは、SDRAM14やHDD17に記憶されている印刷データ、原稿読み取りデータ、これらを出力用に処理した出力画像データ、およびそれらを圧縮した圧縮データを外部(サーバーコンピュータ3,クライアントコンピュータ4,ファクシミリ装置5等)に転送することができる。
次に、操作パネルPを備える情報処理ユニット部Bについて説明する。情報処理ユニット部Bは、一般にパーソナルコンピュータといわれるような情報処理装置に用いられる汎用のOS(Operating System)によって制御されるマイクロコンピュータ構成とされている。情報処理ユニット部Bは、メインプロセッサであるCPU31を有しており、このCPU31には、CPU31の作業用領域となるRAMや起動プログラムなどを記憶した読出し専用メモリであるROMで構成されるメモリユニット32と、OSやアプリケーションプログラムを記憶するHDD等の記憶装置34に対するデータの入出力を制御する記憶装置制御ユニット35とがバス接続されている。
また、CPU31には、情報処理ユニット部BをHUB19を介してLAN2に接続するためのLAN制御部33が接続されている。このLAN制御部33に割り当てられるネットワークアドレスであるIPアドレスは、前述した画像処理ユニット部AのLAN制御部18に割り当てられるIPアドレスとは異なるものである。すなわち、本実施形態のデジタルカラー複合機1には、2つのIPアドレスが割り当てられていることになる。つまり、画像処理ユニット部Aと情報処理ユニット部BとはLAN2に接続されていることになり、画像処理ユニット部Aと情報処理ユニット部Bとの間においてはデータ交換が可能な構成になっている。さらに、CPU31には、操作パネルPを制御する表示制御ユニット36および操作入力制御ユニット37が接続されている。
また、図3は操作パネルの構成を示す平面図である。図3に示すように、操作パネルPは、例えばLCD(Liquid Crystal Display)である表示装置40と、操作入力装置41とで構成されている。操作入力装置41は、表示装置40の表面に積層された超音波弾性波方式等のタッチパネル41aと、複数のキーを有するキーボード41bとで構成されている。キーボード41bには、画像読み取りの開始を宣言するためのスタートキー、数値入力を行うためのテンキー、読み取った画像データの送信先を設定する読取条件設定キー、クリアキー等が設けられている。
すなわち、図2に示すように表示制御ユニット36は、画像表示制御信号を制御パネルI/F38を介して表示装置40に出力し、画像表示制御信号に応じた所定事項を表示装置40に表示させる。一方、操作入力制御ユニット37は、操作入力装置41におけるオペレータからの機能設定や入力操作に応じた入力制御信号を、制御パネルI/F38を介して受信する。
加えて、CPU31には、画像処理ユニット部Aの制御パネルI/F25と通信ケーブル26を介して接続されている制御パネル通信ユニット39が接続されている。制御パネル通信ユニット39は、画像処理ユニット部Aから出力された画像表示制御信号を受信し、また、操作パネルPからのオペレータによる機能設定や入力操作に応じた入力制御信号を画像処理ユニット部Aに転送する。なお、詳細は後述するが、制御パネル通信ユニット39で受信した画像処理ユニット部Aからの画像表示制御信号は操作パネルPの表示装置40用にデータ変換処理されてから表示制御ユニット36に出力され、
また、操作パネルPからのオペレータによる機能設定や入力操作に応じた入力制御信号は画像処理ユニット部Aでの仕様に応じた形式にデータ変換処理されてから制御パネル通信ユニット39に入力される。上述したように記憶装置34には、CPU31が実行するOSやアプリケーションプログラムが格納されている。この意味で、記憶装置34は、アプリケーションプログラムを記憶する記憶媒体として機能する。
このデジタルカラー複合機1では、ユーザが電源を投入するとCPU31がメモリユニット32内の起動プログラムを起動させ、記憶装置34よりOSをメモリユニット32内のRAMに読み込み、このOSを起動させる。このようなOSは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。OSのうち代表的なものとしては、Windows(登録商標)等が知られている。これらのOS上で走る動作プログラムをアプリケーションプログラムと呼んでいる。情報処理ユニット部BのOSは、外部の情報処理装置(サーバーコンピュータ3,クライアントコンピュータ4等)と同様のOS、すなわち汎用のOS(例えば、Windows(登録商標)等)とされている。
図4は本発明の実施形態1における画像処理装置において、紙文書からスキャンして電子ファイル化する処理を示すフローチャートである。
紙文書から読み取った画像データから原稿内にある2次元コードの領域を検索する(S401)。処理S401の2次元コードの領域検出は、画像データ内の矩形領域を抽出することで実施する。ここで、2次元コードの検索処理について、図5(a)〜(d)を参照しながらQRコード(登録商標)の画像を例にとって説明する。図5(a)はスキャンした画像データの2次元コードの領域部分を示す例である。さらに、図5(a)に対して輪郭を抜き出す処理を行った画像が図5(b)である。図5(b)は輪郭部分が黒、それ以外を白色とした2値画像である。この例では「ロバートのオペレータ」と呼ばれる1次微分により輪郭画像を得た。矩形領域の検出は輪郭の連結成分を矩形で結ぶことで行う。図5(c)は図5(b)の輪郭部すなわち黒色部の連結成分を検出し連結部分を矩形で囲んだ図である。さらに、得られた矩形の連結部分を検出し連結矩形を形成させると図5(d)のように1つの大きな矩形となり、2次元コードの領域の外接する矩形領域を得ることができる。さらに、QRコード(登録商標)は規格上正方形であることから、検出した矩形領域のうち、正方形に近いものだけを2次元コード領域として抽出することができる。
処理S401において、2次元コード領域が検出されたか否か確認を行う(S402)。2次元コード領域が検出された場合(S402のYes)、2次元コード領域の画像を抽出する(S403)。処理S403の2次元コード領域の抽出処理は、2次元コードが外接する矩形だけを抜き出して新たな画像データを作成する。処理403により抽出した2次元コードをデコードする(S404)。
処理S404において2次元コードのデコードが成功した否か確認を行う(S405)。処理S405でデコードの成功を確認した場合(S405のYes)、デコード結果から2次元コードに関連する情報から文字データを作成する(S407)。2次元コードの文字データの作成処理については後述する。
また、前述した処理S402において、2次元コード領域が検出されなかった場合(S402のNo)、また、処理S405において、2次元コードのデコードが成功しなかった場合(S405のNo)、処理S408へと進む。
紙文書から読み取った画像データ全体をOCR処理する(S408)。このOCR処理した結果は文字の座標データを含む文字データである。さらに、文字データをテキストレイヤー化する(S409)。テキストレイヤーはHTML(Hyper Text Markup Language)のように文字の座標情報を埋め込めるフォーマットが望ましい。この際に、2次元コード部分の文字データがある場合は、処理S401で検索した2次元コードの存在する領域座標の位置および/または近傍に、処理S407にて作成した2次元コードの文字データを埋め込む。さらに、読み取った画像データの減色の処理を行う(S410)。画像データはユーザからの設定または固定的な設定値に基づく処理により、インデックスカラー、グレースケールおよび白黒2値化等の減色処理が施される。
画像データの圧縮の処理を行う(S411)。読み取った画像データのサイズが小さくなるようJPEG(Joint Photographic Expert Group),MMR(Modified Modified Read),PNG(Portable Network Graphics)等の圧縮画像フォーマットに変換され画像レイヤー化する(S412)。さらに、文書ファイルの作成処理を行う(S413)。電子ファイル化した文書ファイルのフォーマットとしては、文書フォーマットとして広く普及しているPDF(Portable Document Format)を用いることでレイヤー構成の文書ファイルを作成することができる。なお、ここでは圧縮した画像データの画像レイヤーをデフォルトでの可視レイヤー、テキストレイヤーを不可視レイヤーとして設定するが、この可視レイヤーおよび不可視レイヤーの設定はPDFファイルのリーダーソフトウェアであるAdobe Reader(アドビシステムズ社製)等で閲覧時に容易に選択することができる。
図6は2次元コードに関連する情報から文字データの作成について示したフローチャートであり、図4に示す処理S407の処理である。図6を参照しながら文字データの作成について説明する。
2次元コードに関連する情報がファイルの位置情報かそれ以外のものかの判定する(S601)。処理S601の判定結果が位置情報でない場合(S601のNo)、処理S611へ移りデコード結果の文字データをそのまま文字データとして適用する。
処理S601においてデコード結果の関連する情報がファイルの位置情報の場合(S601のYes)、ファイルの位置情報がリンク先の文書番号か否かを判定する(S602)。ここで意味する文書番号とは、例えばファイルサーバーとリンクしたプリンタが印刷しようとする文書に任意の桁数の通し番号を表現する情報を2次元コードとして付加し印刷した場合などで、文書にユニークな番号が付加されている場合である。
処理S602において文書番号の場合(S602のYes)、前述したファイルサーバー内を検索対象として文書番号のファイルにアクセスする(S604)。一方、処理S602において文書番号でなく(S602のNo)、さらにデコード結果のリンク先がURLであると判定された場合(S603)、画像処理装置はWeb上のURLの示すファイルにアクセスする(S605)。
前述の処理S604,S605においてアクセスした関連する情報のファイル参照が可能か否か確認し(S606)、参照可能な場合(S606のYes)、さらに、関連する情報のファイルが文字データを含んでいるか否かを判定する(S607)。処理S607において文字データを含まない場合(S607のNo)、関連する情報のファイルからOCR処理等により文字データの作成処理を行う(S608)。この処理S608において、関連する情報の文字データを作成する処理として、関連情報のファイル内容をテキスト化し文字データとして出力する。このテキスト化し文字データとする処理は後述する。
そして、前述の処理S607,S608における2次元コードの文字データから単語を検索し、単語の出現数の多い順にランキングを作成する(S609)。続いて、作成したランキングからキーワードとして抜き出す単語を選出する(S610)。
ここで、ランキングを用いたキーワードの選出について図7を用いて説明する。単語の抽出は予め画像処理装置内において固定の条件を有している。例えば、本実施形態1において図7に示すように、漢字2文字以上またはカタカナの単語を対象としている。この条件を満たした単語の出現数の上位の10個をランキングした表の一部を図7に示す。図7において「スカイスクレーパー」が4回、「階調」が3回「タクシー」が3回、「イエロー」が2回、そして「摩天楼」が1回となった。また、予め画像処理装置内の固定条件としては、前述した例に限られるものではなく、抽出する単語としてカタカナと漢字を組み合わせた単語としても良い。
本実施形態1ではランキングデータのうち上位の3個までをキーワードとして選出するようにしている。この例では図7に示すように、「スカイスクレーパー」、「階調」、「タクシー」が上位の3個にランキングされていることから、キーワードとして選出されることになる。
そして、紙文書から読み取った画像データ上の2次元コードの領域に、この2次元コードに関連する情報に基づく文字データから選出したキーワードを埋め込んだ文字データとして作成する(S611)。また、処理S610において選出したキーワードを先にデコードした2次元コードのデータに加えて、新たな2次元コードを作成する(S612)。なお、作成した新たな2次元コードは、図4の処理S413で作成した文書ファイルの可視レイヤー上で、処理S401で検索した2次元コードの存在する領域の位置に上書きされる。
また、図8は関連する情報のファイルに文字データを含まない場合、この情報ファイルから文字データを作成するフローチャートを示す図であり、図6における処理S608の処理である。
まず、関連する情報のファイルが文字データか否かを確認するため、ファイルの拡張子からファイルフォーマットを判定する。このため、関連する情報のファイルがBMP,JPEGなどの画像データか否かの確認を行う(S801)。処理S801においてファイルが画像データである場合(S801のYes)、画像データのOCR処理を行い文字データを作成する(S802)。
また、処理S801において画像データでない場合(S801のNo)、音声データか否かを判定する(S803)。処理S803においてファイルがWAVなどの音声データである場合(S803のYes)、例えば、Via Voice(IBM社製)等のソフトウェアを用いる音声認識手段により音声データを再生し(S804)、さらに音声認識処理して文字データを作成する(S805)。
また、処理S803においてファイルのフォーマットが画像データ、音声データにも当てはまらない場合(S803のNo)、文字データは出力されず処理は終了する。
以上のように、光学的に紙文書から読み取った画像データから電子ファイル化した文書ファイルを作成する場合、紙文書に有する2次元コードに含まれた関連情報の文字データも全文検索の対象とすることができ、実用性の高い全文検索を実行することが可能となる。
また、図9は本実施形態1における画像処理装置の概略構成を示すブロック図であり、図中の矢印はデータの流れの一例を示したもので、これにより機能が限定されるものではない。紙文書を光学的に読み取った(スキャン)入力である画像データは2次元コード領域検出部901で2次元コードの有無を判定される。画像抽出部902は2次元コードと判定された領域を抽出するモジュールで、2次元コード領域から抽出した画像を2次元コードデコーダ903へ渡す。
2次元コードデコーダ903は2次元コードを文字データに変換し、関連ファイル検索部904に文字データとして渡す。関連ファイル検索部904はデコードした文字データがファイル位置情報か否か判断してファイル検索を行うほか、検索したファイルに文字データがある場合、文字データを検索したファイルと共に2次元コード文字データ作成部906に出力する。
2次元コード文字データ作成部906は文字データを関連ファイル検索部904から受け取っていない場合は、同時に転送された関連ファイルのフォーマットに応じて、関連ファイルをOCR処理部905または音声処理部907に出力し文字データを得る。その後、文字データに対して単語検索を実施し、出現回数からキーワードのランキングを作成し、キーワードを抽出して文字データ化して文書ファイル作成部910へ出力する。
また、OCR処理部905は、紙文書から読み取った画像データを入力としてOCR処理を行いOCR処理した結果を文書ファイル作成部910へ出力する。画像減色処理部908は読み取った画像データを適当な色数に減色した減色画像を画像圧縮処理部909に出力する。画像圧縮処理部909は入力された画像データを適当なフォーマットに圧縮した画像データを作成し、文書ファイル作成部910へ出力する。
そして、文書ファイル作成部910において、入力された圧縮した画像データ、OCR処理した文字データ、2次元コードの関連する情報に基づく文字データを文書ファイルとして合成し、例えばPDFなどのマルチレイヤーフォーマットの文書ファイルを生成する。
図10(a)は本実施形態1における紙文書から読み取った画像データであり、(b)は電子ファイル化した文字データ、(c)は電子ファイル化した画像データとして作成された文書ファイルの模式図である。図10(a)において、1001は読み取った画像データに付加された2次元コードである。図10(b)は電子ファイル化したテキストレイヤーを示し、図10(a)の画像データ上で2次元コード1001の存在する位置に2次元コード1001をデコードした結果の関連する情報のファイル内容から抽出した文字データ1002が埋め込まれている。その他の文字データは図10(a)に示す読み取った画像データをOCR処理して得られた文字データである。また、図10(c)は読み取った画像データを白黒2値化等の処理をして電子ファイル化した画像レイヤーである。作成される電子ファイル化された文書ファイルは、図10(c)を可視レイヤー、図10(b)を不可視レイヤーとしたマルチレイヤーフォーマットの文書ファイルとなる。
なお、図10(c)の画像データにおける2次元コード1003は、図10(a)の2次元コード1001に代えて、図6の処理S612において作成した新たな2次元コードとする。これにより、図9の画像減色処理部908,画像圧縮処理部909における処理により劣化して、再印刷した2次元コードをデコードしたときにエラーすることを防ぎ、さらに、再作成時に2次元コード1001をデコードした内容を含めることから、より詳細な関連情報を得るようにすることもできる。
また、図10(b),(c)として、テキストレイヤーと画像レイヤーを可視,不可視レイヤーのマルチレイヤーとしたが、文字データのテキストレイヤーに画像レイヤーの画像部分を形成した1つの可視レイヤーとしても良く、さらには、2層以上のマルチレイヤーとしても良い。
図11(a)〜(f)は本実施形態1で作成されるテキストレイヤーの画像処理の過程を模式的に示した図である。図11(a)は2次元コード1001を有する読み取った画像データを示す図である。画像処理装置は前述の2次元コード1001の領域を検出する処理によりを特定する(図11(b)参照)、2次元コード領域1001’を用いて図11(a)の読み取った画像データから2次元コード1001を抽出した画像を作成する(図11(c)参照)。
2次元コード1001は2次元コードデコーダ903(図9参照)で文字データ化され、さらに関連する情報のファイルを検索した結果から該当のファイル内容から出現頻度の高いキーワードの中から一部を追加した文字データ1002を得る(図11(d)参照)。
一方、読み取った画像はOCR処理部905によって文字の領域をOCR処理して文字化された文字データを得る(図11(e)参照)。この図11(e)の文字データに図11(d)の文字データが追加されてテキストレイヤーが作成される(図11(f)参照)。
以上に説明したように、紙文書の文字データと2次元コードの文字データを含んだ電子ファイル化した文書ファイルが作成でき、この文書ファイルを検索する全文検索の際に2次元コードに含まれている紙文書に関連した情報も検索対象とすることができる。
図12は本発明の実施形態2における画像処理装置において、紙文書から読み取った画像データを文字画像と背景画像に分離して処理を行うフローチャートである。図12を参照しながら本実施形態2における読み取った画像データに対して文字部と背景部を分離して異なる圧縮を行う処理について説明する。
読み取った画像データから原稿内にある2次元コードの領域を検索する(S1201)。処理S1201の2次元コードの領域検出は、実施形態1と同様に画像データ内の矩形領域を抽出することで実施する。2次元コードの有無を確認し(S1202)、2次元コード領域が検出された場合(S1202のYes)、2次元コード領域の画像を抽出する(S1203)。処理S1203における2次元コード領域の抽出処理は、2次元コードが外接する矩形だけを抜き出して新たな画像データを作成する。処理S1203により抽出した2次元コードをデコード処理する(S1204)。また、処理S1202において、2次元コード領域が検出されなかった場合(S1202のNo)は処理S1208へと移行する。
処理S1204において2次元コードのデコードが成功したか否か確認を行う(S1205)。2次元コードのデコード処理が成功を確認した場合(S1205のYes)はデコード結果に基づいた処理を行う(S1207)。この処理S1207において、2次元コードに関連する情報から文字データの作成は、前述の図6の処理S601〜S612で説明した処理と同一である。その後の処理として、2次元コードに関連する情報が画像、音声等のデータの場合においても、これらのデータから文字データを作成する。この文字データの作成する手段についても、図8の処理S801〜S805を用いて説明した処理と同一である。
次に、2次元コードを除く読み取った画像データの画像全体をOCR処理する(S1208)。OCR処理した結果は文字の座標データを含む文字データである。この文字データをテキストレイヤー化する(S1209)。また、読み取った画像から文字部分を抽出し、文字画像と背景画像に分離する(S1210)。さらに、文字画像を減色し(S1211)、続いて文字画像を圧縮する(S1212)。文字画像の圧縮減色がインデックスカラーの場合はPNG、白黒2値の場合はMMR-TIFF(MMR-Tagged Image File Format)などを用いることができる。
また、分離した背景画像の解像度縮小処理を行う(S1213)。解像度縮小処理は背景画像のサイズを低減するために実施する。背景画像の圧縮処理を行う(S1214)。背景画像には写真など色数の多い領域が含まれる可能性が高いため、多くの色表現に適したJPEGなどを用いることができる。
処理した文字画像と背景画像から画像レイヤー化する(S1215)。その後、文書ファイルを作成する(S1216)。文書ファイルのフォーマットは文字画像の透過などの機能が使用できるPDFが適当である。背景画像を可視レイヤーとし、この背景画像の上に透過色を用いた文字画像を不可視レイヤーとして重ねる。文字画像をOCR結果の文字データと2次元コードの関連する情報から得た文字データとすることにより、視認性が良くかつ文字データを含む文書ファイルを作成することができ、全文検索等が可能となる。
図13は本実施形態2における画像処理装置の概略構成を示すブロック図である。紙文書を光学的に読み取った(スキャン)入力である画像データは2次元コード領域検出部1301で2次元コードの有無を判定される。画像抽出部1302は2次元コードと判定された領域を抽出するモジュールで、2次元コード領域から抽出した画像を2次元コードデコーダ1303へ渡す。
2次元コードデコーダ1303は2次元コードを文字データに変換し、関連ファイル検索部1304に文字データとして渡す。関連ファイル検索部1304はデコードした文字データがファイル位置情報か否か判断した上でファイル検索を行うほか、検索したファイルに文字データがある場合は文字データを検索したファイルと共に2次元コード文字データ作成部1307に出力する。
2次元コード文字データ作成部1307は文字データを関連ファイル検索部1304から受け取っていない場合は、同時に転送された関連ファイルのフォーマットに応じて、関連ファイルをOCR処理部1306または音声処理部1308に出力し文字データを得る。その後、文字データに対して単語検索を実施し、出現回数からキーワードのランキングを作成し、キーワードを抽出して文字データ化して文書ファイル作成部1311へ出力する。
また、OCR処理部1306は、読み取った画像データを入力としてOCR処理を行いOCR処理した結果を文書ファイル作成部1311へ出力する。また、画像分離部1305は読み取った画像データを文字画像と背景画像に分離する。画像減色処理部1309は文字画像を適当な色数に減色し減色画像を画像圧縮処理部1310に出力する。画像解像度変更部1312は背景画像のサイズ縮小を目的とした解像度縮小を実施する。
画像圧縮処理部1310は文字画像および背景画像の各画像を適当なフォーマットに圧縮した画像データを作成し文書ファイル作成部1311へ出力する。文書ファイル作成部1311は、文字画像,背景画像からなる画像データ、およびOCR処理した文字データ,2次元コードの関連する情報から得た文字データを合成した文字データから、PDFなどのマルチレイヤーフォーマットの文書ファイルを生成する。
これにより、紙文書を電子ファイル化した文書ファイルに対して全文検索等を実行した際に、紙文書に2次元コードを用いて添付された補足資料等の情報を含めた検索を行うことができる。
以上のように、光学的に紙文書から読み取った画像データから電子ファイル化した文書ファイルを作成する場合、紙文書に有する2次元コードに含まれた関連情報の文字データも全文検索の対象とすることができ、実用性の高い全文検索を実行することが可能となる。
本発明に係る画像処理装置および電子ファイル生成方法は、電子ファイル化した紙文書から読み取った画像データに有する2次元コードに含まれた関連情報も全文検索の対象として実用性の高い検索ができ、符号化コードに含まれる関連情報を電子ファイル内に埋め込み、全文検索時には関連情報を含んだ検索を行う画像処理装置および処理方法として有用である。
本発明の実施形態の画像処理装置であるデジタルカラー複合機を概略的に示す外観斜視図 本実施形態のデジタルカラー複合機の概略構成を示すブロック図 本実施形態のデジタルカラー複合機の操作パネルの構成を示す平面図 本発明の実施形態1における画像処理装置の紙文書から電子ファイル化する処理を示すフローチャート (a)〜(d)はQRコード(登録商標)を例とした2次元コードの検索処理を説明する図 本実施形態1における2次元コードの関連情報から文字データ作成のフローチャート 本実施形態1におけるキーワード選出する漢字2文字以上またはカタカナの単語の例を示す図 本実施形態1における関連情報ファイルに文字データを含まない場合の文字データ作成のフローチャート 本実施形態1における画像処理装置の概略構成を示すブロック図 本実施形態1における(a)は紙文書から読み取った画像データ、(b)は電子ファイル化した文字データ、(c)は電子ファイル化した画像データを示す模式図 (a)〜(f)は作成されるテキストレイヤーの画像処理過程を示す模式図 本発明の実施形態2における画像処理装置の紙文書から読み取った画像データを文字画像と背景画像に分離処理するフローチャート 本実施形態2における画像処理装置の概略構成を示すブロック図
1 デジタルカラー複合機
2 LAN
3 サーバーコンピュータ
4 クライアントコンピュータ
5 ファクシミリ装置
7 印刷装置
8 画像読取装置
9 外部メディア入出装置
10 画像処理制御ユニット
11 印刷制御ユニット
12 画像読取制御ユニット
13,31 CPU
14 SDRAM
15 ROM
16 NVRAM
17 HDD
18,33 LAN制御部
19 HUB
20 FAX制御ユニット
21 公衆電話網
22 構内交換機(PBX)
23,36 表示制御ユニット
24,37 操作入力制御ユニット
25,38 制御パネルI/F
26 通信ケーブル
32 メモリユニット
34 記憶装置
35 記憶装置制御ユニット
40 表示装置
41 操作入力装置
41a タッチパネル
41b キーボード
A 画像処理ユニット部
B 情報処理ユニット部
P 操作パネル

Claims (18)

  1. 原稿の画像を読み取り該画像を表す画像データを生成する画像読取り装置;
    前記画像データの中の前記原稿上の2次元コード画像の2次元コードを検出する検出手段;
    前記2次元コードを抽出する抽出手段;
    該抽出手段が抽出した2次元コードを復号するデコーダ;
    該デコーダが復号したデータに基づき該データに関連するファイルを検索し、該ファイルの文字データを検索する文字データ検索手段;
    画像データが表す画像の文字を検出し文字データを生成するOCR処理手段;および、
    原稿を読取った前記画像データから前記OCR処理手段が生成した文字データに前記検索手段が検索した文字データを追加したテキストデータを電子ファイル化するファイル作成手段;
    を備えた画像処理装置。
  2. 前記文字データ検索手段が文字データを検索しなかった場合に、前記ファイルに対して前記OCR処理手段を用いて文字認識をして文字データを生成し出現回数が多い文字データを前記追加する文字データとして前記ファイル作成手段に与える文字データ作成手段;を更に備える、請求項1に記載の画像処理装置。
  3. 前記文字データ作成手段は、前記OCR処理手段が前記ファイルに対して文字認識をして生成した文字データに対して単語検索して出現回数が多い単語を抽出して該単語を表す文字データを前記追加する文字データとして前記ファイル作成手段に与える;請求項2に記載の画像処理装置。
  4. ファイルの音声情報を検出し該音声情報が表す文字の文字データを生成する音声処理手段;および、前記文字データ検索手段が文字データを検索しなかった場合に、前記ファイルに対して前記音声処理手段を用いて音声認識をして文字データを生成し出現回数が多い文字データを前記追加する文字データとして前記ファイル作成手段に与える文字データ作成手段;を更に備える、請求項1に記載の画像処理装置。
  5. 前記文字データ作成手段は、前記音声処理手段が生成した文字データに対して単語検索して出現回数が多い単語を抽出して該単語を表す文字データを前記追加する文字データとして前記ファイル作成手段に与える;請求項4に記載の画像処理装置。
  6. 前記ファイル作成手段は、前記文字データ作成手段が作成した文字データを、複数のレイヤーで構成された電子ファイルの、前記レイヤーの少なくとも1つに追加する;請求項〜5のいずれか1つに記載の画像処理装置。
  7. 前記ファイル作成手段は、前記文字データ作成手段が作成した文字データを、テキストレイヤー,画像レイヤーで構成された電子ファイルの、前記テキストレイヤーに追加する;請求項〜5のいずれか1つに記載の画像処理装置。
  8. 前記ファイル作成手段は、前記原稿の前記2次元コード画像があった位置又はその近傍に、前記文字データ作成手段が作成した文字データを配置する;請求項6または7記載の画像形成装置。
  9. 前記2次元コード画像の2次元コードを検出する検出手段は、前記画像読取り装置が生成した画像データ内から前記2次元コード画像の矩形を抽出することにより、復号化する2次元コードの画像データを選択する;請求項1に記載の画像処理装置。
  10. 原稿の画像を読み取り該画像を表す画像データを生成する画像読取り装置,画像データが表す画像の文字を検出し文字データを生成するOCR処理手段および該OCR処理手段が生成した文字データを電子ファイル化する手段を含む画像処理装置の、
    前記画像読取り装置によって原稿の画像を読み取り該画像を表す画像データを生成し、
    前記電子ファイル化する手段によって、前記画像データの中の前記原稿上の2次元コード画像の2次元コードを検出し、検出した2次元コードを抽出し、抽出した2次元コードを復号し、復号したデータに基づき該データに関連するファイルを検索し、該ファイルの文字データを検索し、該文字データを、原稿を読取った前記画像データから前記OCR処理手段が生成した文字データに追加したテキストデータを電子ファイル化する、電子ファイル生成方法。
  11. 前記電子ファイル化する手段は、前記ファイルの文字データの検索で文字データ得られない場合には、前記ファイルに対して前記OCR処理手段を用いて文字認識をして文字データを生成し出現回数が多い文字データを前記追加する文字データとする;請求項10に記載の電子ファイル生成方法。
  12. 前記電子ファイル化する手段は、前記OCR処理手段が前記ファイルに対して文字認識して生成した文字データに対して単語検索して出現回数が多い単語を抽出して該単語を表す文字データを前記追加する文字データとする;請求項11に記載の電子ファイル生成方法。
  13. 前記画像処理装置は、ファイルの音声情報を検出し該音声情報が表す文字の文字データを生成する音声処理手段を含み;前記電子ファイル化する手段は、前記ファイルの文字データの検索で文字データ得られない場合には、前記ファイルに対して前記音声処理手段を用いて音声認識をして文字データを生成し出現回数が多い文字データを前記追加する文字データとする;請求項10に記載の電子ファイル生成方法。
  14. 前記電子ファイル化する手段は、前記音声処理手段が生成した文字データに対して単語検索して出現回数が多い単語を抽出して該単語を表す文字データを前記追加する文字データとする;請求項13に記載の電子ファイル生成方法。
  15. 前記電子ファイル化する手段は、前記追加する文字データを、複数のレイヤーで構成された電子ファイルの、前記レイヤーの少なくとも1つに追加する;請求項10〜14のいずれか1つに記載の電子ファイル生成方法。
  16. 前記電子ファイル化する手段は、前記追加する文字データを、テキストレイヤー,画像レイヤーで構成された電子ファイルの、前記テキストレイヤーに追加する;請求項10〜14のいずれか1つに記載の電子ファイル生成方法。
  17. 前記電子ファイル化する手段は、前記原稿の前記2次元コード画像があった位置又はその近傍に、前記追加する文字データを配置する;請求項15または16記載の電子ファイル生成方法。
  18. 前記電子ファイル化する手段は、前記2次元コード画像の2次元コードの検出において、前記画像読取り装置が生成した画像データ内から前記2次元コード画像の矩形を抽出することにより、復号化する2次元コードの画像データを選択する;請求項10に記載の電子ファイル生成方法。
JP2006008495A 2006-01-17 2006-01-17 画像処理装置および電子ファイル生成方法 Active JP4738180B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006008495A JP4738180B2 (ja) 2006-01-17 2006-01-17 画像処理装置および電子ファイル生成方法
US11/653,248 US7835037B2 (en) 2006-01-17 2007-01-16 Image processing apparatus and image processing method
EP07100676.1A EP1808799B1 (en) 2006-01-17 2007-01-17 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006008495A JP4738180B2 (ja) 2006-01-17 2006-01-17 画像処理装置および電子ファイル生成方法

Publications (2)

Publication Number Publication Date
JP2007193409A JP2007193409A (ja) 2007-08-02
JP4738180B2 true JP4738180B2 (ja) 2011-08-03

Family

ID=37872323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006008495A Active JP4738180B2 (ja) 2006-01-17 2006-01-17 画像処理装置および電子ファイル生成方法

Country Status (3)

Country Link
US (1) US7835037B2 (ja)
EP (1) EP1808799B1 (ja)
JP (1) JP4738180B2 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL176673A0 (en) * 2006-07-03 2007-07-04 Fermon Israel A variably displayable mobile device keyboard
JP2008124996A (ja) * 2006-11-15 2008-05-29 Canon Inc 画像処理装置、および画像処理方法
US20080212901A1 (en) * 2007-03-01 2008-09-04 H.B.P. Of San Diego, Inc. System and Method for Correcting Low Confidence Characters From an OCR Engine With an HTML Web Form
JP4424422B2 (ja) * 2008-01-18 2010-03-03 富士ゼロックス株式会社 情報処理装置、情報処理システム、プログラム
US8254785B1 (en) * 2008-05-15 2012-08-28 Sprint Communications Company L.P. Optical image processing to wirelessly transfer a voice message
JP2010028309A (ja) * 2008-07-16 2010-02-04 Canon Inc 装置、方法、プログラムおよび記憶媒体
JP2010028819A (ja) * 2008-07-22 2010-02-04 Toshiba Corp 画像処理装置、画像処理方法及び画像読取装置
JP2010055259A (ja) * 2008-08-27 2010-03-11 Konica Minolta Business Technologies Inc 画像処理装置、画像処理プログラム及び画像処理方法
JP2011249996A (ja) * 2010-05-25 2011-12-08 Fuji Xerox Co Ltd 画像処理装置、画像送信装置及びプログラム
US8970918B2 (en) * 2010-09-20 2015-03-03 Kabushiki Kaisha Toshiba Document management system and method thereof
JP5811708B2 (ja) * 2010-09-30 2015-11-11 ブラザー工業株式会社 画像処理システム、画像処理方法、中継装置、及び、中継プログラム。
JP5598269B2 (ja) 2010-11-08 2014-10-01 ブラザー工業株式会社 通信装置、通信装置の制御プログラム、および中継装置
JP5906677B2 (ja) 2010-11-08 2016-04-20 ブラザー工業株式会社 通信システム、通信装置、中継装置の制御プログラム、および中継装置の制御方法
US8439275B2 (en) 2011-04-06 2013-05-14 Eastman Kodak Company Multi-resolution optical codes
US8807435B2 (en) 2011-04-06 2014-08-19 Eastman Kodak Company Decoding multi-resolution optical codes
US8511575B2 (en) 2011-04-27 2013-08-20 Intellectual Ventures Fund 83 Llc Digital image file including optical code
US8665472B2 (en) 2011-04-27 2014-03-04 Intellectual Ventures Fund 83 Llc Producing an image and optical file from a visible first digital image and from a visible second digital image of a machine-readable optical code which encodes information associated with or derived from the first digital image
US8763904B2 (en) 2011-04-27 2014-07-01 Intellectual Ventures Fund 83 Llc Visibly forming an image and optical code
US8967482B2 (en) 2011-05-23 2015-03-03 Intellectual Ventures Fund 83 Llc Image selection method using machine-readable codes
US8596523B2 (en) 2011-07-28 2013-12-03 Intellectual Ventures Fund 83 Llc Index print with machine-readable codes
US8646691B2 (en) 2011-09-13 2014-02-11 Intellectual Ventures Fund 83 Llc Apparatus and method for using machine-readable codes
US20130163028A1 (en) * 2011-12-23 2013-06-27 Udo Klein Accessing current data by using code images
US8534542B2 (en) 2012-01-17 2013-09-17 Intellectual Ventures Fund 83 Llc Making an ordered element list
US20140210857A1 (en) * 2013-01-28 2014-07-31 Tencent Technology (Shenzhen) Company Limited Realization method and device for two-dimensional code augmented reality
JP6402453B2 (ja) * 2013-03-11 2018-10-10 株式会社リコー 情報処理装置、プログラム、情報処理システム及び情報処理方法
US20140347500A1 (en) * 2013-05-22 2014-11-27 Synchronoss Technologies, Inc. Apparatus and method of document tagging by pattern matching
RU2571379C2 (ru) * 2013-12-25 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Интеллектуальная обработка электронного документа
US10405163B2 (en) * 2013-10-06 2019-09-03 Staton Techiya, Llc Methods and systems for establishing and maintaining presence information of neighboring bluetooth devices
US9661260B2 (en) 2014-02-03 2017-05-23 Synchronoss Technologies, Inc. Photograph or video tagging based on peered devices
RU2656581C2 (ru) * 2014-06-24 2018-06-05 Общество с ограниченной ответственностью "Аби Девелопмент" Редактирование содержимого электронного документа
JP2016143182A (ja) * 2015-01-30 2016-08-08 株式会社リコー 情報処理装置、プログラム
JP6398779B2 (ja) * 2015-02-23 2018-10-03 セイコーエプソン株式会社 画像ファイル生成装置、画像読取装置、及び画像ファイル生成装置の制御プログラム
US9762761B2 (en) * 2016-01-26 2017-09-12 Kabushiki Kaisha Toshiba Image forming apparatus and printing sheet to be watched by using smart glass
JP7211086B2 (ja) * 2019-01-11 2023-01-24 ブラザー工業株式会社 テンプレート作成プログラム及び印刷装置
US11537669B1 (en) 2021-06-09 2022-12-27 Citrix Systems, Inc. Preparation of signature fields within electronic documents
US11586806B1 (en) * 2021-06-30 2023-02-21 Citrix Systems, Inc. Distributed electronic signature processing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000231505A (ja) * 1999-02-10 2000-08-22 Ricoh Co Ltd データオブジェクト群の自動命名方法およびその記憶媒体
JP2003274320A (ja) * 2002-03-15 2003-09-26 Konica Corp 画像撮像装置、画像情報処理装置及び画像情報処理方法
JP2004248245A (ja) * 2002-06-20 2004-09-02 Fuji Xerox Co Ltd 文書処理装置
JP2004355536A (ja) * 2003-05-30 2004-12-16 Fuji Xerox Co Ltd 情報処理装置、情報処理方法、情報処理プログラム、情報端末装置
JP2005149096A (ja) * 2003-11-14 2005-06-09 Canon Inc 画像処理システム及び画像処理方法
JP2005184238A (ja) * 2003-12-17 2005-07-07 Ricoh Co Ltd 画像データ構造、画像データ構築方法、画像作成方法、画像作成プログラムおよび記録媒体

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US599664A (en) * 1898-02-22 Adjustable window-screen
JP3689127B2 (ja) 1993-04-22 2005-08-31 ゼロックス コーポレイション 文書処理システムと文書処理方法
US7387253B1 (en) * 1996-09-03 2008-06-17 Hand Held Products, Inc. Optical reader system comprising local host processor and optical reader
US20020170966A1 (en) * 1995-07-27 2002-11-21 Hannigan Brett T. Identification document including embedded data
JP3727995B2 (ja) 1996-01-23 2005-12-21 キヤノン株式会社 文書処理方法及び装置
US5848202A (en) * 1996-02-26 1998-12-08 Document Handling Technologies, Inc. System and method for imaging and coding documents
US6910184B1 (en) * 1997-07-25 2005-06-21 Ricoh Company, Ltd. Document information management system
US5999664A (en) 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
JP3518304B2 (ja) 1998-01-19 2004-04-12 株式会社豊田中央研究所 情報閲覧システム
US6546385B1 (en) * 1999-08-13 2003-04-08 International Business Machines Corporation Method and apparatus for indexing and searching content in hardcopy documents
US7188186B1 (en) * 1999-09-03 2007-03-06 Meyer Thomas W Process of and system for seamlessly embedding executable program code into media file formats such as MP3 and the like for execution by digital media player and viewing systems
JP4317334B2 (ja) * 2000-09-08 2009-08-19 株式会社リコー 画像形成装置及び文書管理システム
US7398225B2 (en) * 2001-03-29 2008-07-08 American Express Travel Related Services Company, Inc. System and method for networked loyalty program
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
JP4224228B2 (ja) 2001-08-24 2009-02-12 株式会社リコー 文書管理システム及び文書管理方法
FR2837011B1 (fr) 2002-03-05 2004-05-28 Comptacom Procede de lecture automatique d'un document sur lequel est apposee une etiquette pre-imprimee a completer, etiquette, systeme et procede de comptabilite correspondants
JP2004326491A (ja) * 2003-04-25 2004-11-18 Canon Inc 画像処理方法
JP4284100B2 (ja) 2003-04-25 2009-06-24 グローリー株式会社 循環式硬貨入出金機の精査処理装置
JP2005149210A (ja) 2003-11-17 2005-06-09 Canon Inc 画像処理装置及びその制御方法、プログラム
JP4579750B2 (ja) * 2005-04-01 2010-11-10 富士フイルム株式会社 記録シート使用回数集計方法及び装置、並びに、医用画像処理装置
JP4702947B2 (ja) * 2006-02-02 2011-06-15 キヤノン株式会社 コード情報の印刷装置、印刷方法、復元装置、復元方法およびコンピュータプログラム
WO2008004029A2 (fr) * 2006-05-11 2008-01-10 Eric Pajot Systeme de location automatise
US8032858B2 (en) * 2007-08-28 2011-10-04 International Business Machines Corporation Method and system for navigationally displaying HTTP session entry and exit points

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000231505A (ja) * 1999-02-10 2000-08-22 Ricoh Co Ltd データオブジェクト群の自動命名方法およびその記憶媒体
JP2003274320A (ja) * 2002-03-15 2003-09-26 Konica Corp 画像撮像装置、画像情報処理装置及び画像情報処理方法
JP2004248245A (ja) * 2002-06-20 2004-09-02 Fuji Xerox Co Ltd 文書処理装置
JP2004355536A (ja) * 2003-05-30 2004-12-16 Fuji Xerox Co Ltd 情報処理装置、情報処理方法、情報処理プログラム、情報端末装置
JP2005149096A (ja) * 2003-11-14 2005-06-09 Canon Inc 画像処理システム及び画像処理方法
JP2005184238A (ja) * 2003-12-17 2005-07-07 Ricoh Co Ltd 画像データ構造、画像データ構築方法、画像作成方法、画像作成プログラムおよび記録媒体

Also Published As

Publication number Publication date
EP1808799A1 (en) 2007-07-18
US20070188823A1 (en) 2007-08-16
US7835037B2 (en) 2010-11-16
JP2007193409A (ja) 2007-08-02
EP1808799B1 (en) 2015-12-23

Similar Documents

Publication Publication Date Title
JP4738180B2 (ja) 画像処理装置および電子ファイル生成方法
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
CN101600032B (zh) 信息处理装置、信息处理方法、控制程序及记录介质
JP4371965B2 (ja) 画像処理装置、画像処理方法
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
JP4393161B2 (ja) 画像処理装置及び画像処理方法
JP4208780B2 (ja) 画像処理システム及び画像処理装置の制御方法並びにプログラム
JP2007034847A (ja) 検索装置及び検索方法
CN1829273A (zh) 图像处理装置及其方法
JP2006270418A (ja) 画像処理装置およびその方法
US20120001937A1 (en) Information processing system, information processing apparatus, and information processing method
JP4574313B2 (ja) 画像処理装置および方法
JP4539720B2 (ja) 画像処理装置および方法ならびにそのためのプログラム
JP4338189B2 (ja) 画像処理システム及び画像処理方法
JP5153277B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2004214991A (ja) 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法
JP3234736B2 (ja) 入出力一体型情報操作装置
JP2006319668A (ja) 情報処理装置、ユーザ端末および画像処理システム
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2006331222A (ja) 画像読取装置及び情報処理装置
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP2007336008A (ja) 画像検索装置および方法
JP5211941B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2006033756A (ja) 画像処理装置、画像処理装置の制御方法、プログラム及び印刷物
JP2000306076A (ja) 画像処理装置及び制御方法及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081120

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100614

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110426

R151 Written notification of patent or utility model registration

Ref document number: 4738180

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3