JP2007025815A - 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム - Google Patents

画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム Download PDF

Info

Publication number
JP2007025815A
JP2007025815A JP2005203581A JP2005203581A JP2007025815A JP 2007025815 A JP2007025815 A JP 2007025815A JP 2005203581 A JP2005203581 A JP 2005203581A JP 2005203581 A JP2005203581 A JP 2005203581A JP 2007025815 A JP2007025815 A JP 2007025815A
Authority
JP
Japan
Prior art keywords
image
file format
feature amount
character recognition
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005203581A
Other languages
English (en)
Inventor
Keiko Nakanishi
恵子 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005203581A priority Critical patent/JP2007025815A/ja
Publication of JP2007025815A publication Critical patent/JP2007025815A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】 画像を読み込んだ後、領域識別、文字認識をして、自動で出力ファイル形式を判断し、出力ファイル形式のファイルで保存して、必要な情報を残し、ファイルの容量を減少させることを目的とする。
【解決手段】 画像を入力する画像入力手段と、画像入力手段より得られる入力画像から特徴量(テキスト、図、表などの領域)を抽出する画像特徴量抽出手段と、入力画像のある領域を文字認識する文字認識手段と、抽出された画像特徴量と前記文字認識した結果の文字列から、出力ファイル形式を自動で判断する出力ファイル形式判断手段と、入力画像を前記判断された出力ファイル形式に変換するファイル形式変換手段と、変換したファイル形式のファイルを保存するファイル保存手段とからなる。
【選択図】 図1

Description

本発明は画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラムに関し、例えば入力画像を領域識別、文字認識し、データ形式を変換するために用いて好適な技術に関する。
画像を読み込んだ場合、画像ファイル形式のファイルで保存されていた。他の形式のファイルに保存する場合は、画像ファイル形式のファイルを指定して他の形式のファイルに変換するか、ファイル形式を予め指定して読み込ませる必要があった。また、デジタルカメラの場合は、他のファイルの指定はできず、画像形式のファイルに保存された。
しかしながら、従来の画像処理方法で、画像を読み込むと画像ファイル形式のファイルで保存され、ファイルの容量が大きくなった。外部のディスクに保存すると、ディスク容量が足りなくなることが多かった。また、他のファイル形式に変換して、保存する場合は、わざわざファイルを指定して、変換、保存をする必要があった。また、画像ファイルは、JPEG形式で保存されることが多いが、JPEGで多少のデータの損失がある場合は、小さな文字の認識率が下がるという欠点があった。
本発明は前述の問題点にかんがみ、画像を読み込んだ後、領域識別、文字認識をして、自動で出力ファイル形式を判断し、出力ファイル形式のファイルで保存して、必要な情報を残し、ファイルの容量を減少させることができるようにすることを目的としている。
本発明は、画像を入力する画像入力工程と、前記画像入力手段より得られる入力画像から特徴量を抽出する画像特徴量抽出工程と、前記入力画像のある領域を文字認識する文字認識工程と、前記抽出された画像特徴量と前記文字認識した結果の文字列から出力ファイル形式を自動で判断する出力ファイル形式判断工程と、前記入力画像を前記判断された出力ファイル形式に変換するファイル形式変換工程と、前記変換したファイル形式のファイルを保存するファイル保存工程とを有することを特徴とする画像処理方法等、を提供する。
本発明によれば、画像を読み込んだ後、出力ファイル形式を自動で判断して、出力ファイル形式のファイルに変換してファイルを保存するため、ファイルの容量を減少させる効果がある。
(第1の実施の形態)
次に本発明に係る画像処理装置の一実施形態を図面に基づいて説明する。
図1は、本発明に係る画像処理装置の一実施形態を示すブロック図である。
図1において、画像処理装置は、スキャナ、カメラ、あるいはファイル読み込み装置などの画像入力手段11を有し、この画像入力手段11から画像を画像データとして入力する。
画像入力手段11はバス17に接続され、バス17を介して処理を実行するプロセッサ12に接続されている。バス17にはさらにキーボード13、ディスク14、メモリ15、出力手段16が接続されている。
メモリ15は、プロセッサ12において処理制御情報を作成する際の一時データ記憶、あるいは画像入力手段11で読み込んだ画像データ15bを蓄積する。また、変換した出力ファイル形式の出力ファイル15aを一時記憶する。また、後述するフローチャートに対応するような処理をコンピュータに実行させるための制御プログラム15cが格納される。
プロセッサ12は、メモリ15に格納された制御プログラム15cを実行することにより、画像特徴量抽出手段12a、文字認識手段12b、出力ファイル形式判定手段12c、データ変換手段12d、ファイル保存手段12eとして機能する。
キーボード13は、出力形式に対応した出力ファイル形式の指定などの指示操作を行い、ディスク14は、補助記憶装置として機能する。出力ファイル形式に変換したファイルを蓄積する。出力手段16は、ディスプレイ、プリンタ等であり、入力された画像の表示、出力ファイルの印刷等の各種情報を出力する。
画像入力手段11で読み取った画像は、画像データ15bとしてメモリ15に格納される。画像データ15bはプロセッサ12に設けられた画像処理手段(図示せず。)等により2値化処理されて、画像特徴量抽出手段12aに送られる。そして、黒ドットのヒストグラムを取るなどして画像に含まれる領域を識別し、画像データ15bに含まれる領域をテキスト、図、表等に属性分類し、さらに解像度、各領域の位置情報、大きさ情報等を抽出し、メモリ15およびディスク14に保存する。
図2は、本実施の形態における入力画像の一例を示す図であり、図3は、本実施の形態における図2の入力画像に対する特徴量抽出結果の一例を示す図である。図3において、31、32、33はテキスト領域、34は図の領域、35は罫線、36は表領域である。
図4は、本実施の形態における出力形式(表形式、カード形式、文書画像形式等)と出力ファイル形式(CSVファイル、RTFファイル等)の対応表を示す図である。
図4において、例えば、出力形式が表形式のときは、出力ファイル形式をCSVファイルやRTFファイル、TXTファイル等の表形式で保存できるファイル形式の1つを設定しておく。図4では、表形式にcsvファイル41を、カード形式にvCARDファイル42を、テキスト形式にTXTファイル43を、文書図形形式にHTMLファイル44を、画像形式にJPEGファイル45を設定している。また、出力ファイル形式は、予め決めていてもよいし、ユーザが指定できるようにしてもよい。
図5は、本実施の形態における自動で出力ファイル形式を判断する処理の一例を示すフローチャートである。
処理が開始されると、ステップS501では、画像を入力部(スキャナ、デジタルカメラ等)より読み取って、メモリに転送する。
次に、ステップS502において、ステップS501で読み込んだ画像から特徴量(テキスト、図、表などの領域)を抽出する。ここでは、二値化や傾斜補正等の前処理も含んでいる。画像中のテキスト、図、表、罫線などの各領域を取り出し、各領域に関する領域情報(ブロック番号、属性、位置、大きさ等の情報)をメモリに記憶する。
次に、ステップS503において、抽出した特徴量に表領域があるか否かを判断する。この判断の結果、表領域がある場合は、ステップS504に進み、ない場合は、ステップS508に進む。
ステップS503の判断の結果、表領域がある場合は、ステップS504において、表領域やテキスト領域を文字認識する。次に、ステップS505において、ステップS502で抽出した特徴量に図領域があるか否かを判断する。この判断の結果、図領域がある場合は、ステップS506において、文書図形形式と判断する。また、ステップS505の判断の結果、図領域がない場合は、ステップS507において、表形式と判断する。なお、このステップS505の処理を省いて、ステップS504の後に、表形式と判断し、図を省いてファイルに変換する処理にしてもよい。
一方、ステップS503の判断の結果、表領域がない場合は、ステップS508において、ステップS502で抽出した特徴量にテキスト領域があるか否かを判断する。この判断の結果、テキスト領域がある場合は、ステップS509に進み、ない場合は、ステップS515において、画像形式と判断する。
ステップS508の判断の結果、テキスト領域がある場合は、ステップS509において、テキスト領域を文字認識する。次に、ステップS510において、文字認識した結果の文字データから、属性を判断する。属性判断は、予めキー文字(URLの場合は、http、//、co.jp、com、・・・、住所の場合は、都道府県名等)を登録しておき、そのキー文字が文字データに含まれるかどうかを判断する。
次に、ステップS511において、属性判断した結果にURLがあるか否かを判断する。この判断の結果、URLがある場合は、ステップS512に進み、ない場合は、ステップS513の処理へジャンプする。
ステップS512の判断の結果、URLがある場合は、ステップS512において、URLと判断した文字列にハイパーリンクをつける。次に、ステップS513において、ステップS502で抽出した特徴量に図領域があるか否かを判断する。この判断の結果、図領域がある場合は、ステップS514において、文書図形形式と判断する。また、図領域がない場合は、ステップS516に進む。なお、このステップS513の処理を省いて、図を省いてファイルに変換する処理にしてもよい。
次に、ステップS516において、ステップS510で属性判断した結果に名刺属性(住所、氏名、電話番号等、名刺と判断する属性)が含まれるかどうかを判断する。この判断の結果、名刺属性がある場合は、ステップS517に進み、ない場合は、ステップS519において、テキスト形式と判断する。
ステップS516の判断の結果、名刺属性がある場合は、ステップS517において、名刺属性が含まれない行の行数がある数値(任意の整数)より少ないかどうかを判断する。この判断の結果、少ない場合は、名刺であると判断し、ステップS518において、カード形式とする。多い場合は、ステップS519において、テキスト形式と判断する。
以上のように入力画像から出力形式を判断する。そして、図4に示すような対応表から、判断した出力形式に対応する出力ファイル形式を決め、出力ファイル形式に変換して、メモリまたは補助記憶装置に保存する。そして、処理を終了する。
以上の述べたように、本実施の形態によれば、画像を読み込んだ後、出力ファイル形式を自動で判断して、出力ファイル形式のファイルに変換してファイルを保存するため、ファイルの容量を減少させることができる。
(本発明に係る他の実施の形態)
前述した本発明の実施の形態における画像処理装置を構成する各手段、並びに画像処理方法の各ステップは、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
また、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施の形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施の形態の機能を実現するソフトウェアのプログラム(実施の形態では図5に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接、あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM、DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、前記ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記録媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施の形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施の形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施の形態の機能が実現される。
本発明に係る画像処理装置の一実施形態を示すブロック図である。 本実施の形態における入力画像の例を示す図である。 図2の画像を特徴量抽出した結果を示す図である。 本実施の形態における出力形式と出力ファイル形式の対応の例を示す図である。 本実施の形態における出力ファイル形式を自動で判断する処理の一実施形態を示すフローチャートである。
符号の説明
11 スキャナ、カメラ等の画像入力手段
12 プロセッサ
12a 画像特徴量抽出手段
12b 文字認識手段
12c 出力ファイル形式判定手段
12d データ変換手段
12e ファイル保存手段
13 キーボード
14 ディスク
15 メモリ
16 ディスプレイ、プリンタ等の出力手段

Claims (10)

  1. 画像を入力する画像入力工程と、
    前記画像入力工程より得られる入力画像から特徴量を抽出する画像特徴量抽出工程と、
    前記画像入力工程で入力された入力画像のある領域を文字認識する文字認識工程と、
    前記画像特徴量抽出工程で抽出された画像特徴量と前記文字認識工程で文字認識した結果の文字列とから、出力ファイル形式を自動で判断する出力ファイル形式判断工程と、
    前記画像入力工程で入力された入力画像を前記出力ファイル形式判断工程で判断された出力ファイル形式に変換するファイル形式変換工程と、
    前記ファイル形式変換工程で変換したファイル形式のファイルを保存するファイル保存工程とを有することを特徴とする画像処理方法。
  2. 前記ファイル形式変換工程は、前記画像特徴量抽出工程で抽出された画像特徴量に表領域がある場合は、表形式ファイルに変換することを特徴とする請求項1に記載の画像処理方法。
  3. 前記ファイル形式変換工程は、前記画像特徴量抽出工程で抽出された画像特徴量がテキスト領域の場合は、前記文字認識工程で文字認識した結果の文字列をキー文字で属性を判断する属性判断工程を有し、前記属性判断工程で判断された属性がURLと判断されたときは、ハイパーリンクに変換することを特徴とする請求項1に記載の画像処理方法。
  4. 前記ファイル形式変換工程は、前記画像特徴量抽出工程で抽出された画像特徴量がテキスト領域の場合は、前記文字認識工程で文字認識した結果の文字列を前記属性判断工程で属性を判断し、前記属性に住所、氏名、会社名等が含まれる場合、前記特徴量抽出工程で抽出したテキスト領域の属性に住所、氏名、会社名等を含まない行の行数から、名刺と判断された場合は、カード形式ファイル(vCARD等)に変換することを特徴とする請求項3に記載の画像処理方法。
  5. 前記ファイル形式変換工程は、前記画像特徴量抽出工程で抽出された画像特徴量がテキスト領域の場合は、前記文字認識工程で文字認識した結果の文字列を前記属性判断工程で属性を判断し、前記属性がどの属性にも属さない場合は、テキスト形式ファイルに変換することを特徴とする請求項3に記載の画像処理方法。
  6. 前記ファイル形式変換工程は、文書画像形式に変換することを特徴とする請求項1に記載の画像処理方法。
  7. 前記出力ファイル形式を出力形式毎に指定できる指定工程を有することを特徴とする請求項1に記載の画像処理方法。
  8. 画像を入力する画像入力手段と、
    前記画像入力手段より得られる入力画像から特徴量を抽出する画像特徴量抽出手段と、
    前記画像特徴量抽出手段で抽出された画像特徴量のテキスト領域を文字認識する文字認識手段と、
    前記画像特徴量抽出手段で抽出された画像特徴量と前記文字認識手段で文字認識した結果とから、出力ファイル形式を自動で判断する出力ファイル形式判断手段と、
    前記画像入力手段で入力された入力画像を前記出力ファイル形式判断手段で判断された出力ファイル形式に変換するファイル形式変換手段と、
    前記ファイル形式変換手段で変換したファイル形式のファイルを保存するファイル保存手段とを有することを特徴とする画像処理装置。
  9. 画像を入力する画像入力手段と、
    前記画像入力手段より得られる入力画像から特徴量を抽出する画像特徴量抽出手段と、
    前記画像特徴量抽出手段で抽出された画像特徴量のテキスト領域を文字認識する文字認識手段と、
    前記画像特徴量抽出手段で抽出された画像特徴量と前記文字認識手段で文字認識した結果とから、出力ファイル形式を自動で判断する出力ファイル形式判断手段と、
    前記画像入力手段で入力された入力画像を前記出力ファイル形式判断手段で判断された出力ファイル形式に変換するファイル形式変換手段と、
    前記ファイル形式変換手段で変換したファイル形式のファイルを保存するファイル保存手段とを有することを特徴とするデジタルカメラ。
  10. 請求項1に記載の方法の各工程をコンピュータにて実施させることを特徴とするコンピュータプログラム。
JP2005203581A 2005-07-12 2005-07-12 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム Pending JP2007025815A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005203581A JP2007025815A (ja) 2005-07-12 2005-07-12 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005203581A JP2007025815A (ja) 2005-07-12 2005-07-12 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2007025815A true JP2007025815A (ja) 2007-02-01

Family

ID=37786523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005203581A Pending JP2007025815A (ja) 2005-07-12 2005-07-12 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2007025815A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010098744A (ja) * 2008-10-20 2010-04-30 Toshiba Corp 画像処理装置及び画像処理方法
CN103258197A (zh) * 2012-02-17 2013-08-21 柯尼卡美能达商用科技株式会社 图像处理装置及其控制方法
JP2014048754A (ja) * 2012-08-29 2014-03-17 Kyocera Document Solutions Inc 画像処理装置
CN112380851A (zh) * 2020-12-02 2021-02-19 好活(昆山)网络科技有限公司 一种基于大数据的文字识别系统及方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010098744A (ja) * 2008-10-20 2010-04-30 Toshiba Corp 画像処理装置及び画像処理方法
CN103258197A (zh) * 2012-02-17 2013-08-21 柯尼卡美能达商用科技株式会社 图像处理装置及其控制方法
JP2013171294A (ja) * 2012-02-17 2013-09-02 Konica Minolta Inc 画像処理装置
US9277094B2 (en) 2012-02-17 2016-03-01 Konica Minolta Business Technologies, Inc. Image processing apparatus and recording medium
CN103258197B (zh) * 2012-02-17 2017-10-13 柯尼卡美能达商用科技株式会社 图像处理装置及其控制方法
JP2014048754A (ja) * 2012-08-29 2014-03-17 Kyocera Document Solutions Inc 画像処理装置
CN112380851A (zh) * 2020-12-02 2021-02-19 好活(昆山)网络科技有限公司 一种基于大数据的文字识别系统及方法

Similar Documents

Publication Publication Date Title
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP4871668B2 (ja) 画像処理システム、画像処理方法及びプログラム
US20070153303A1 (en) Image processing device, image processing method, image processing system, and information recording medium
JP2006146878A (ja) 電子文書管理プログラム、電子文書管理装置
JP3962748B2 (ja) 情報処理装置及びその方法
JP2014013534A (ja) 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム
US7453594B2 (en) Document filing apparatus for storing information added to a document file
JP2007025815A (ja) 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム
JP2006025129A (ja) 画像処理システム及び画像処理方法
JPH11272654A (ja) 文書編集装置及び方法
JP2008282094A (ja) 文字認識処理装置
JP2007328432A (ja) 帳票処理装置、帳票処理方法及びプログラム
JP4143245B2 (ja) 画像処理方法および装置並びに記憶媒体
JP2017021654A (ja) 文書管理サーバ及びシステム
JP4872285B2 (ja) 文書管理装置、文書管理システムおよび文書管理方法
JP2021047792A (ja) 情報処理装置及びプログラム
JP2005094383A (ja) 文書配信システム及び記録媒体
JP2001202362A (ja) 文字編集処理装置
JP2008244612A (ja) 画像処理装置及び方法
JP5343584B2 (ja) 情報処理装置及びプログラム
JP5018601B2 (ja) 受信文書の言語判別方法及び受信文書翻訳システム並びにその制御プログラム
JP2007299321A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体
JP2007081472A (ja) 画像処理装置、画像形成装置、及び画像形成システム
JP2005092461A (ja) データ編集装置及びその制御方法並びに制御プログラム
JP2000196857A (ja) 印刷装置、情報読取装置、画像処理装置、画像処理システム、情報読取方法、及び記憶媒体