JP4859054B2 - 画像処理装置、画像処理方法、プログラムおよび記録媒体 - Google Patents
画像処理装置、画像処理方法、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP4859054B2 JP4859054B2 JP2007039787A JP2007039787A JP4859054B2 JP 4859054 B2 JP4859054 B2 JP 4859054B2 JP 2007039787 A JP2007039787 A JP 2007039787A JP 2007039787 A JP2007039787 A JP 2007039787A JP 4859054 B2 JP4859054 B2 JP 4859054B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- identifying
- component
- frequency conversion
- document type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Description
(1)OCRの精度に依存する
(2)検索キーワードが必要
(3)ヒット数が多い場合に絞り込みが困難
という問題点がある。
(1)カギ形のように領域の形状が複雑である場合や、領域が重なり合って込み入っている場合など、領域を精度よく抽出することが難しい。
(2)領域属性を誤って識別(分類、属性判定)した場合の回復手段がない。
本発明の目的は、処理時間を短縮すると共に、処理を簡単化しつつ、画像の文書タイプを高精度に識別し、自動的に分類する画像処理装置、画像処理方法、プログラムおよび記録媒体を提供することにある。
(2)局所領域毎に線画/文字を識別するように構成し、特徴量の次元を増やしているため、識別の精度が向上する。
(3)局所領域毎に線画/文字/写真を識別するように構成し、特徴量の次元を増やしているため、識別の精度が向上すると共に写真を含む文書タイプのカテゴリを識別できる。
(4)周波数変換を行うことによって、線画等の局所領域を識別する際に特定の周波数係数へ電力を集中させることが可能となり局所領域の識別精度が向上する。
(5)文書タイプ属性を識別する際に、複数の識別手段を並列に使用して識別結果に重複を許すことにより識別の精度が向上するとともに、ユーザの主観が異なるような画像を検索する場合にも文書タイプ識別を用いた分類表示によって検索が可能となる。
図1は、本発明の実施例1のシステム構成を示す。図1において、100はパーソナルコンピュータ(以下PC)、PDAや携帯電話などのモバイル端末などのクライアント装置である。101はモニタなどの表示デバイス、102はユーザ指示の解釈、サーバ装置110との通信、表示デバイス101の制御を行うアプリケーションプログラム、103はユーザからの指示入力手段であるキーボードやマウスなどの入力デバイス、104はLANやインターネットなどの外部通信路である。
・ファイル名、作成日
・画像データID
・サムネイル画像データID
・文書タイプ属性
なお、画像情報DB117は、一般的なRDB(リレーショナルデータベース)を使用することにより、情報の登録、管理、検索などの処理を簡易に実現できる。また、画像DB114、画像情報DB117は上述の機能を満たせば、同じDBに例えばXML(eXtensible Markup Langage)などの言語を使用し、階層的なデータ構造などを構築して蓄積しても良く、また、異なるサーバ毎にそれぞれDBとして蓄積してもよい。画像登録は、スキャナやデジタルカメラなどの画像入力装置から直接、画像データをサーバ装置110へ登録するようにしても良い。
(1)グレー画像変換処理は、カラー画像が入力された場合、画像データ量を1/3に低減する処理であり、処理コストが低減される。変換方法は種々の方法があるが、入力される登録画像112がR(ed)G(reen)B(lue)画像の場合は、輝度Yへ変換する。RGBから輝度Yへの変換式は、式2で表される。
Y=0.299R+0.587G+0.114B 式2
但し、Y:輝度
R:Red画素値
G:Green画素値
B:Blue画素値
なお、簡易的に式3を使用しても良い。
Y=(R+2G+B)/4 式3
(2)解像度変換処理は、周波数変換処理部302が行う周波数変換時に出力される周波数変換係数(DCT係数)の周波数を統一する目的で実施する。本実施例で示すように、8x8画素の領域固定で周波数変換を行う場合、登録画像112の解像度が異なる場合に、出力される空間周波数も異なるものになるため、予め前処理部301において周波数変換処理部302へ入力される画像解像度を統一することにより、全体として処理コストが低減される。なお、解像度変換を実施しなくても周波数変換処理部302で登録画像112の解像度に応じて周波数変換に使用する領域面積(画素数)を変更しても同様の効果が得られる。
・帳票は、No3、No6の次元の特徴量が多く、No10〜No25までの次元の特徴量も少ないながらもある。
・図面は、帳票の特徴量に比べて全体的に特徴量が多い(数値が高い)。
・論文は、帳票、図面の特徴量に比べて全体的に特徴量が少ない(数値が低い)。
実施例2では、局所領域識別処理部303において線画を識別すると共に、文字画像を識別し、文書タイプ属性の精度を向上させる実施例である。実施例2のシステム構成は実施例1と同様である。
実施例3は、局所領域識別処理部303において線画、文字画像を識別すると共に、写真画像を識別し、文書タイプ属性の精度を向上させる実施例である。実施例3のシステム構成も実施例1と同様である。
101 表示デバイス
102 アプリケーションプログラム
103 入力デバイス
104 外部通信路
110 サーバ装置
111 外部インターフェース
112 登録画像データ
113 サムネイル生成処理部
114 画像DB
115 文書タイプ識別処理部
117 画像情報DB
118 表示画面制御処理部
119 表示画面データ
120 画面制御データ
Claims (8)
- 画像の文書タイプを識別する画像処理装置であって、前記画像の所定領域の複数画素に対して周波数変換を行い、複数の周波数変換係数を出力し、前記複数の周波数変換係数の内、線成分と非線成分の差が所定値以上である場合に、前記所定領域を線画領域と識別する局所領域識別手段と、前記局所領域識別手段により識別された線画識別結果から特徴量を算出する特徴量算出手段と、前記特徴量に応じて前記画像の文書タイプを識別する文書タイプ識別手段を備えたことを特徴とする画像処理装置。
- 画像の文書タイプを識別する画像処理装置であって、前記画像の所定領域の複数画素に対して周波数変換を行い、複数の周波数変換係数を出力し、前記複数の周波数変換係数の内、交流成分の最大値が所定値以下ではなく、線成分と非線成分の差が所定値以上の場合に、前記所定領域を線画領域と識別し、前記線成分と非線成分の差が所定値以上ではない場合に、前記所定領域を文字領域と識別する局所領域識別手段と、前記局所領域識別手段により識別された線画識別結果および文字識別結果から特徴量を算出する特徴量算出手段と、前記特徴量に応じて前記画像の文書タイプを識別する文書タイプ識別手段を備えたことを特徴とする画像処理装置。
- 画像の文書タイプを識別する画像処理装置であって、前記画像の所定領域の複数画素に対して周波数変換を行い、複数の周波数変換係数を出力し、前記複数の周波数変換係数の内、交流成分の最大値が第1の閾値以下ではなく、第2の閾値以下の場合に、前記所定領域を写真領域と識別し、前記交流成分の最大値が第2の閾値以下ではなく、線成分と非線成分の差が所定値以上の場合に、前記所定領域を線画領域と識別し、前記線成分と非線成分の差が所定値以上ではない場合に、前記所定領域を文字領域と識別する局所領域識別手段と、前記局所領域識別手段により識別された線画識別結果、文字識別結果および写真識別結果から特徴量を算出する特徴量算出手段と、前記特徴量に応じて前記画像の文書タイプを識別する文書タイプ識別手段を備えたことを特徴とする画像処理装置。
- 画像の文書タイプを識別する画像処理方法であって、前記画像の所定領域の複数画素に対して周波数変換を行い、複数の周波数変換係数を出力し、前記複数の周波数変換係数の内、線成分と非線成分の差が所定値以上である場合に、前記所定領域を線画領域と識別する局所領域識別工程と、前記局所領域識別工程により識別された線画識別結果から特徴量を算出する特徴量算出工程と、前記特徴量に応じて前記画像の文書タイプを識別する文書タイプ識別工程を有することを特徴とする画像処理方法。
- 画像の文書タイプを識別する画像処理方法であって、前記画像の所定領域の複数画素に対して周波数変換を行い、複数の周波数変換係数を出力し、前記複数の周波数変換係数の内、交流成分の最大値が所定値以下ではなく、線成分と非線成分の差が所定値以上の場合に、前記所定領域を線画領域と識別し、前記線成分と非線成分の差が所定値以上ではない場合に、前記所定領域を文字領域と識別する局所領域識別工程と、前記局所領域識別工程により識別された線画識別結果および文字識別結果から特徴量を算出する特徴量算出工程と、前記特徴量に応じて前記画像の文書タイプを識別する文書タイプ識別工程を有することを特徴とする画像処理方法。
- 画像の文書タイプを識別する画像処理方法であって、前記画像の所定領域の複数画素に対して周波数変換を行い、複数の周波数変換係数を出力し、前記複数の周波数変換係数の内、交流成分の最大値が第1の閾値以下ではなく、第2の閾値以下の場合に、前記所定領域を写真領域と識別し、前記交流成分の最大値が第2の閾値以下ではなく、線成分と非線成分の差が所定値以上の場合に、前記所定領域を線画領域と識別し、前記線成分と非線成分の差が所定値以上ではない場合に、前記所定領域を文字領域と識別する局所領域識別工程と、前記局所領域識別工程により識別された線画識別結果、文字識別結果および写真識別結果から特徴量を算出する特徴量算出工程と、前記特徴量に応じて前記画像の文書タイプを識別する文書タイプ識別工程を有することを特徴とする画像処理方法。
- 請求項4乃至6のいずれか1項に記載の画像処理方法をコンピュータに実現させるためのプログラム。
- 請求項4乃至6のいずれか1項に記載の画像処理方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007039787A JP4859054B2 (ja) | 2007-02-20 | 2007-02-20 | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007039787A JP4859054B2 (ja) | 2007-02-20 | 2007-02-20 | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008204184A JP2008204184A (ja) | 2008-09-04 |
JP4859054B2 true JP4859054B2 (ja) | 2012-01-18 |
Family
ID=39781624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007039787A Expired - Fee Related JP4859054B2 (ja) | 2007-02-20 | 2007-02-20 | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4859054B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5743498B2 (ja) * | 2010-11-10 | 2015-07-01 | キヤノン株式会社 | 画像補正装置および画像補正方法 |
JP5742612B2 (ja) * | 2011-09-13 | 2015-07-01 | ブラザー工業株式会社 | 画像処理プログラム、画像処理装置および画像処理方法 |
CN107113395B (zh) * | 2014-11-13 | 2020-11-24 | 三星电子株式会社 | 用于生成包括图像的频率特性信息的元数据的方法和装置 |
JP6536217B2 (ja) * | 2015-06-26 | 2019-07-03 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN108369559B (zh) * | 2015-12-01 | 2019-10-22 | 艾梅崔克斯株式会社 | 应用了图像处理的文档结构分析装置 |
JP2017175524A (ja) * | 2016-03-25 | 2017-09-28 | 株式会社日立ドキュメントソリューションズ | 文書管理システムおよびイメージデータ管理方法 |
JP7230343B2 (ja) | 2018-05-28 | 2023-03-01 | 株式会社リコー | 画像検索装置、画像検索方法、画像検索プログラム及び販売システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0766981A (ja) * | 1993-08-27 | 1995-03-10 | Canon Inc | データ圧縮方法 |
JPH1049674A (ja) * | 1996-07-30 | 1998-02-20 | Toshiba Corp | カラー画像処理装置 |
JP2006303899A (ja) * | 2005-04-20 | 2006-11-02 | Fuji Photo Film Co Ltd | 画像処理装置、画像処理システム、および画像処理プログラム |
JP4811133B2 (ja) * | 2005-07-01 | 2011-11-09 | 富士ゼロックス株式会社 | 画像形成装置及び画像処理装置 |
-
2007
- 2007-02-20 JP JP2007039787A patent/JP4859054B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008204184A (ja) | 2008-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4859025B2 (ja) | 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 | |
JP7013182B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US8112706B2 (en) | Information processing apparatus and method | |
US9754164B2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
CN103975342B (zh) | 用于移动图像捕获和处理的系统和方法 | |
JP4181892B2 (ja) | 画像処理方法 | |
US8224095B2 (en) | Image processing apparatus, image forming apparatus, image processing system, and image processing method | |
US8488181B2 (en) | Preserving user applied markings made to a hardcopy original document | |
KR102149050B1 (ko) | 인공지능을 이용한 ocr 기반 문서 분석 시스템 및 방법 | |
US10432820B2 (en) | Image processing apparatus, image processing system, control method for image processing apparatus, and non-transitory computer readable medium | |
JP4859054B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US8693790B2 (en) | Form template definition method and form template definition apparatus | |
US9710524B2 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
US20060010115A1 (en) | Image processing system and image processing method | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP2007042106A (ja) | 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム | |
JPWO2007004519A1 (ja) | 検索システム及び検索方法 | |
JP2010262648A (ja) | 文書オブジェクトを自動位置合わせするための方法及び装置 | |
US20120265759A1 (en) | File processing of native file formats | |
US20080218812A1 (en) | Metadata image processing | |
KR102211516B1 (ko) | 가상 셀을 이용한 ocr 기반 문서 분석 시스템 및 방법 | |
JP2007004621A (ja) | 文書管理支援装置、文書管理支援方法およびプログラム | |
US20150169510A1 (en) | Method and system of extracting structured data from a document | |
JP4261988B2 (ja) | 画像処理装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091027 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110502 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110525 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111026 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111027 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4859054 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |