JP4282471B2 - 画像特徴抽出装置、画像特徴抽出方法、プログラムおよび記録媒体 - Google Patents
画像特徴抽出装置、画像特徴抽出方法、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP4282471B2 JP4282471B2 JP2003433445A JP2003433445A JP4282471B2 JP 4282471 B2 JP4282471 B2 JP 4282471B2 JP 2003433445 A JP2003433445 A JP 2003433445A JP 2003433445 A JP2003433445 A JP 2003433445A JP 4282471 B2 JP4282471 B2 JP 4282471B2
- Authority
- JP
- Japan
- Prior art keywords
- direction code
- image
- histogram
- edge
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000605 extraction Methods 0.000 title claims description 46
- 238000010606 normalization Methods 0.000 claims description 13
- 230000010354 integration Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 6
- 238000000034 method Methods 0.000 description 19
- 239000013598 vector Substances 0.000 description 13
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Description
また、同じ形状の画像でも大きさが違うと、得られる特徴量が大きく異なってしまい、マルチスケールでの特徴抽出に問題があった。
請求項8の発明は、請求項7に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
行切り出し部220は、原稿画像より文字行イメージを切り出す。
文字切り出し部230は、文字行イメージより個々の文字画像を切り出すとともに文字画像の幅と高さの情報も抽出し、その情報も文字画像とともに特徴量抽出部240へ渡す。
マッチング部250は、特徴量抽出部240によって原稿画像から抽出された特徴ベクトルと、その抽出方法と同じ方法で予め各文字種の標準文字パターンより抽出されて認識辞書260に登録されている特徴ベクトルとの相違度を算出し、相違度の最も小さい文字を認識結果とする。
結果出力部270は、この認識候補と原稿画像を表示装置300に表示させ、所望の結果をユーザに選択または修正させて、最終的な認識結果を記憶装置や他のアプリケーションソフトウェアへ引き渡して、処理を終了する。
画像正規化部241は、文字切り出し部230より切り出された文字画像と、その高さおよび幅の情報とからバイキュービック法により64画素×64画素の大きさの画像に正規化する。このバイキュービック法は、補間対象となる画素の周囲の画素の濃度値から、sin(πx)/πxをテイラー展開して得られる3次多項式の補間式を用いて補間する。これにより、変形後の画像はエッジが強調される傾向の画像を得ることができる。
(2)次に、境界の一方の側の画素の値と、左上、右上、左下、右下の4画素から図4(B)〜(E)のいずれかのパターンに該当するかを決定し、(B)〜(E)に対応した4つの方向コードテーブル(F)〜(I)のうちいずれかを選択する。各方向テーブルには、16エントリーあり、各エントリーに1〜16のいずれかの方向コード(図4(A))が格納されている。
t=1×(X1)+2×(X2)+4×(X4)+8×(X8)
(4)注目した境界に対して選択した方向コードテーブルの、決定したエントリー番号(t)より方向コードを読み出し、その方向コードを文字画像の当該境界に付与する。
即ち、左右隣接2画素の境界に付与された方向コードについては横方向に走査して層分けを行い(横方向からの層分け)、上下隣接2画素の境界に付与された方向コードについては縦方向に走査して層分けを行う(縦方向からの層分け)。
したがって、分割領域数が16、層数が2、方向コードが16方向であるから、全体として512(=16(分割領域数)×2(層数)×16(方向数))の大きさのヒストグラムとなる。つまり、各ヒストグラム値をそのまま特徴ベクトルの1成分とするならば、その次元数は512となる。
64画素×64画素の正規化画像の領域を縦横方向にそれぞれ4等分割して、例えば、図5に示したように分割すると、エッジの方向コードが縦横方向の場合には、領域分割線の方向とエッジの方向とが同じ方向となり特徴量が安定しないので、図6に示したように領域分割線を斜めにとって分割する。
また、逆に、図6のように領域分割線を斜めにとった場合には、エッジの方向コードが斜め方向の場合には、領域分割線の方向とエッジの方向とが同じ方向となり特徴量が安定しないので、図5に示したように領域分割線を斜めにとって分割する。
このように、方向コードの向きに対して領域分割線を適用することで、領域分割線の小さい変動に対して、方向コードヒストグラムの変動が大きくならないようにすることができる。
説明の都合上、図5および図6のように領域分割線で分割された領域にそれぞれR1〜R16のように名前をつけておく。この名前の順序は固定されたものではなく重複しなければよい。
また、方向コードヒストグラムの頻度計数領域を、(分割領域数×層数×方向数)で示される3次元配列Hと考える。
方向コード作成部242で作成した方向コードを付加したすべてのエッジについて処理を完了した場合には(ステップS11のYES)、方向コードヒストグラムの作成が終了したものとして処理を終了する。
この方向コードaが斜め方向の方向コードである場合(ステップS13のYES)、このエッジが図5に示した領域分割線によって分割された分割領域のいずれに属するかを求め(この分割領域の位置をcとする)(ステップS14)、ステップS16へ進む。
ここで、図4(A)の方向コード1〜16に対する方向コードヒストグラム値をD1〜D16で表し、図8の方向コード1〜8に対する方向コードヒストグラム値をd1〜d8で表すことにする。図4(A)と図8の方向を比較すると、16方向の1,3,5,7,9,11,13,15の方向と8方向の1,2,3,4,5,6,7,8に対応していることが分かる。このことから、各diは次の式で求められる。
d1=D16+2D1+D2
di=D2i−2+2D2i−1+D2i (i=2〜8)
さらに、特徴量のサイズと認識能力が許されるならば、16方向のままの特徴ベクトルで使用してもかまわない。
このように層分けしない場合、特徴ベクトルの次元数は、分割領域数×方向数=16×8=128と上記実施形態よりも次元数を減少させることができる。
この場合、記録媒体から読出されたプログラム自体が上述した実施形態を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
あるいは、インターネット等の通信ネットワークを介して記憶装置に格納されたプログラムをサーバコンピュータから直接供給を受けるようにしてもよい。この場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
Claims (8)
- 画像から抽出したエッジの方向を表す方向コードを各エッジに付与する方向コード作成部と、前記画像を複数の領域に分割して、該分割領域に存在するエッジの方向コードごとに存在頻度を計数して方向コードヒストグラムを作成する方向コードヒストグラム作成部とを有して、該方向コードヒストグラムを画像の特徴量として抽出する画像特徴抽出装置において、前記方向コードヒストグラム作成部は、前記画像から抽出した各エッジの方向コードに対する前記画像の領域分割を、該方向コードが縦横方向の方向コードに対しては斜め方向の領域分割線を用いて分割し、該方向コードが斜め方向の方向コードに対しては縦横方向の領域分割線を用いて分割し、前記エッジの存在する分割領域と該方向コードとに対応する頻度を計数して方向コードヒストグラムを作成することを特徴とする画像特徴抽出装置。
- 請求項1に記載の画像特徴抽出装置において、前記方向コードは、1点を中心とした16方向または8方向であることを特徴とする画像特徴抽出装置。
- 請求項1または2に記載の画像特徴抽出装置において、画像の高さと幅が同じになるように画像を正規化する画像正規化部を有し、前記方向コード作成部は、前記画像正規化部で正規化された画像からエッジを抽出し、該エッジの方向に基づいて方向コードを付与するようにしたことを特徴とする画像特徴抽出装置。
- 請求項1乃至3のいずれかに記載の画像特徴抽出装置において、前記方向コード作成部で作成された方向コードを縦方向または横方向から層分けする方向コード層分け部を有し、前記方向コードヒストグラム作成部は、前記方向コード層分け部で層分けされた方向コードに対してヒストグラムを作成するようにしたことを特徴とする画像特徴抽出装置。
- 請求項1乃至4のいずれかに記載の画像特徴抽出装置において、前記方向コードヒストグラム作成部で作成された方向コードヒストグラムを少ない方向成分の方向コードヒストグラムに統合する方向コードヒストグラム統合部を有することを特徴とする画像特徴抽出装置。
- 画像から抽出したエッジの方向を表す方向コードを各エッジに付与する方向コード作成ステップと、前記画像を複数の領域に分割して、該分割領域に存在するエッジの方向コードごとに存在頻度を計数して方向コードヒストグラムを作成する方向コードヒストグラム作成ステップとを有して、該方向コードヒストグラムを画像の特徴量として抽出する画像抽出方法において、前記方向コードヒストグラム作成ステップは、前記画像から抽出した各エッジの方向コードに対する前記画像の領域分割を、該方向コードが縦横方向の方向コードに対しては斜め方向の領域分割線を用いて分割し、該方向コードが斜め方向の方向コードに対しては縦横方向の領域分割線を用いて分割し、前記エッジの存在する分割領域と該方向コードとに対応する頻度を計数して方向コードヒストグラムを作成することを特徴とする画像特徴抽出方法。
- コンピュータを、請求項1乃至5のいずれかに記載の画像特徴抽出装置の各部として機能させるためのプログラム。
- 請求項7に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003433445A JP4282471B2 (ja) | 2003-12-26 | 2003-12-26 | 画像特徴抽出装置、画像特徴抽出方法、プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003433445A JP4282471B2 (ja) | 2003-12-26 | 2003-12-26 | 画像特徴抽出装置、画像特徴抽出方法、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005190355A JP2005190355A (ja) | 2005-07-14 |
JP4282471B2 true JP4282471B2 (ja) | 2009-06-24 |
Family
ID=34790827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003433445A Expired - Lifetime JP4282471B2 (ja) | 2003-12-26 | 2003-12-26 | 画像特徴抽出装置、画像特徴抽出方法、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4282471B2 (ja) |
-
2003
- 2003-12-26 JP JP2003433445A patent/JP4282471B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005190355A (ja) | 2005-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8041122B2 (en) | Image processing apparatus, method for controlling image processing apparatus, and storage medium storing related program | |
JP3883696B2 (ja) | 多数の写真をスキャンしかつ検出するとともに人工エッジを除去するための方法 | |
JP2930612B2 (ja) | 画像形成装置 | |
JP3345350B2 (ja) | 文書画像認識装置、その方法、及び記録媒体 | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US7269298B2 (en) | Image processing device, image processing method, and record medium on which the same is recorded | |
US20070237394A1 (en) | Image processor for character recognition | |
US8300946B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP4821869B2 (ja) | 文字認識装置、画像読取装置、およびプログラム | |
JP4535584B2 (ja) | ディジタル画像処理方法 | |
US8807442B2 (en) | System and method for embedding machine-readable codes in a document background | |
US20090316219A1 (en) | Image processing apparatus, image processing method and computer-readable storage medium | |
JP4282471B2 (ja) | 画像特徴抽出装置、画像特徴抽出方法、プログラムおよび記録媒体 | |
JP4390523B2 (ja) | 最小領域による合成画像の分割 | |
Bhaskar et al. | Implementing optical character recognition on the android operating system for business cards | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2006237858A (ja) | 画像処理装置、画像処理方法、その方法をコンピュータに実行させるプログラム、および記録媒体 | |
JP3661774B2 (ja) | 文字列認識方法、文字認識装置およびプログラム | |
JP3627998B2 (ja) | 特徴抽出方法、特徴抽出装置、文字認識方法及び文字認識装置 | |
JP4930288B2 (ja) | 画像処理装置及び画像処理プログラム | |
CN111681161B (zh) | 折叠二维码图像的还原方法、设备及计算机可读存储介质 | |
JP2982150B2 (ja) | 文字パターン処理方法及び装置 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 | |
JP2009193170A (ja) | 文字認識装置及び文字認識方法 | |
JP2005196563A (ja) | 傾き補正装置、傾き補正方法、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090317 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4282471 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120327 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120327 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130327 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140327 Year of fee payment: 5 |