JP2009259030A - 画像識別装置、画像識別方法、プログラム - Google Patents
画像識別装置、画像識別方法、プログラム Download PDFInfo
- Publication number
- JP2009259030A JP2009259030A JP2008107808A JP2008107808A JP2009259030A JP 2009259030 A JP2009259030 A JP 2009259030A JP 2008107808 A JP2008107808 A JP 2008107808A JP 2008107808 A JP2008107808 A JP 2008107808A JP 2009259030 A JP2009259030 A JP 2009259030A
- Authority
- JP
- Japan
- Prior art keywords
- category
- image
- input image
- identification
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000010606 normalization Methods 0.000 claims abstract description 88
- 230000003044 adaptive effect Effects 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims description 94
- 239000013598 vector Substances 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 abstract description 63
- 230000006870 function Effects 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】正規化された入力画像の識別結果から再正規化処理の要否を判定し(S4a,S4d)、それが必要であれば入力画像に対する再正規化処理を行い(S5)、この正規化された入力画像の識別結果を求める(S2,S3)。再正規化処理では、入力画像に適用する正規化枠(適応正規化枠)のサイズを、各カテゴリの外接矩形サイズを記録した外接矩形標準辞書から、識別結果の上位のカテゴリの外接矩形サイズを取得することで求める(S5a)。この識別結果に対しても再正規化処理の要否を判定する。このような処理が繰り返され、再正規化処理が不要となればその時点での識別結果を出力する(S4e)。
【選択図】図2
Description
図面を参照して、本発明の第1実施形態を説明する。
図5は、第1実施形態に係わる画像識別装置1のハードウェア構成を例示した構成ブロック図である。
図5に例示するように、画像識別装置1は、キーボードなどが接続可能な入力部11、液晶ディスプレイなどが接続可能な出力部12、画像識別装置1外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部13、CPU(Central Processing Unit)14〔キャッシュメモリやレジスタなどを備えていてもよい。〕、メモリであるRAM15やROM16、ハードディスクである外部記憶装置17並びにこれらの入力部11、出力部12、通信部13、CPU14、RAM15、ROM16、外部記憶装置17間のデータのやり取りが可能なように接続するバス18を有している。また必要に応じて、画像識別装置1に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
入力画像に対して所定の正規化処理を行うためのプログラム、
正規化された入力画像から特徴ベクトルを求めるためのプログラム、
特徴ベクトルと特徴標準辞書800を用いて正規化された入力画像のカテゴリ毎のスコアを求めて識別結果を出力するためのプログラム、
識別結果を用いて入力画像の再正規化処理の要否を判定し、それが不要の場合には入力画像の識別結果(カテゴリ)を出力し、それが必要の場合にはカテゴリ毎のスコアの内その上位に対応するカテゴリを指示する情報(カテゴリ指示情報)を出力するためのプログラム、
再正規化処理が必要と判断されて出力されたカテゴリ指示情報と外接矩形標準辞書900を用いて正規化枠のサイズを決定して、この正規化枠(以下、適応正規化枠という。)を用いて入力画像を正規化するためのプログラム、
適応正規化枠で正規化された入力画像に対して特徴抽出、識別結果出力、カテゴリ出力の上記各処理を実施する制御を行うためのプログラム
が記憶されている。
図3と図4を参照しながら、本発明の第2実施形態を説明する。
第2実施形態は、第1実施形態のステップS4の処理を、第1結果の信頼度が不良と判定された場合にのみ再正規化処理を実施するように制御する処理(ステップS4′)に変更した形態である(第2結果は不要である。)。つまり、カテゴリ出力部400が、第1実施形態と同様のステップS3の処理で得られた(ソーティング済みの)識別結果(第2実施形態では第1結果)を用いて入力画像の再正規化処理の要否を判定し、それが不要の場合には入力画像の識別結果(カテゴリ)を出力し、それが必要の場合には識別結果(第2実施形態では第1結果)の内その上位に対応するカテゴリを指示する情報(カテゴリ指示情報)を出力する(ステップS4′)。そこで、第1実施形態と異なるステップS4′の処理について説明を行う。
この実施例では、縦横比の変動がしばしば起きる映像中に挿入された文字画像を2値化して得られた合計9918サンプルに対し、文字パターンを粗い局所領域に分割し、各局所領域内の黒画素について4方向(0°、45°、90°、135°)に黒画素連結長を計測し、局所領域内の各方向成分別の分布状況を表す方向寄与度を特徴量として算出し、識別関数としてユークリッド距離を用い、特徴標準辞書には文字カテゴリ3,319カテゴリにおける各文字カテゴリの学習データ(種)から得られる特徴量の平均値を用い、上位1位、2位まで、5位まで、及び10位までの各累積分類率を求めた。
100 標準正規化処理部
200 特徴抽出部
300 識別部
400 カテゴリ出力部
500 適応正規化処理部
Claims (10)
- 入力画像をカテゴリ単位で識別する画像識別装置であって、
各カテゴリの特徴ベクトルを記録した特徴標準辞書と、各カテゴリの外接矩形サイズを記録した外接矩形標準辞書とを記憶する記憶手段と、
入力画像を予め定められたサイズの正規化枠で正規化する標準正規化処理手段と、
正規化された上記入力画像(以下、正規化画像という。)から特徴ベクトルを求める特徴抽出手段と、
上記特徴ベクトルと上記特徴標準辞書を用いて上記正規化画像のカテゴリ毎のスコアを求めて識別結果を出力する識別手段と、
上記識別結果を用いて上記入力画像の再正規化処理の要否を判定し、それが不要の場合には上記入力画像の識別結果を出力し、それが必要の場合にはカテゴリ毎の上記スコアの内その上位に対応するカテゴリを指示する情報(以下、カテゴリ指示情報という。)を出力するカテゴリ出力手段と、
上記カテゴリ指示情報と上記外接矩形標準辞書を用いて正規化枠(以下、適応正規化枠という。)のサイズを決定して、この適応正規化枠を用いて上記入力画像を正規化する適応正規化処理手段と
を備えた画像識別装置。 - 上記カテゴリ出力手段は、
現在の正規化画像の上記識別結果(以下、第1結果という。)の信頼度と、前回の正規化画像の上記識別結果(以下、第2結果という。)の信頼度とを求め、上記第1結果の信頼度が上記第2結果の信頼度よりも良好の場合に、再正規化処理を必要と判定する
ことを特徴とする請求項1に記載の画像識別装置。 - 上記カテゴリ出力手段は、
現在の正規化画像の上記識別結果の信頼度を求め、この信頼度が予め定められた基準値よりも良好ではない場合に、再正規化処理を必要と判定する
ことを特徴とする請求項1に記載の画像識別装置。 - 上記信頼度は、各カテゴリのスコア値の全部または一部に基づく上記識別結果の尤もらしさの指標である
ことを特徴とする請求項2または請求項3に記載の画像識別装置。 - 上記適応正規化処理手段は、
上記カテゴリ指示情報の指示するカテゴリの外接矩形サイズを上記外接矩形標準辞書から取得し、取得された外接矩形サイズの平均または重み付け平均を上記適応正規化枠のサイズとして決定する
ことを特徴とする請求項1から請求項4のいずれかに記載の画像識別装置。 - 入力画像をカテゴリ単位で識別する画像識別方法であって、
標準正規化処理手段が、入力画像を予め定められたサイズの正規化枠で正規化する標準正規化処理ステップと、
特徴抽出手段が、上記標準正規化処理ステップにおいて正規化された上記入力画像から特徴ベクトルを求める特徴抽出ステップと、
識別手段が、各カテゴリの特徴ベクトルを記録した特徴標準辞書と正規化された上記入力画像の特徴ベクトルとを用いて正規化された上記入力画像のカテゴリ毎のスコアを求めて識別結果を出力する識別ステップと、
カテゴリ出力手段が、上記識別結果を用いて上記入力画像の再正規化処理の要否を判定し、それが不要の場合には上記入力画像の識別結果を出力し、それが必要の場合にはカテゴリ毎の上記スコアの内その上位に対応するカテゴリを指示する情報(以下、カテゴリ指示情報という。)を出力するカテゴリ出力ステップと、
適応正規化処理手段が、各カテゴリの外接矩形サイズを記録した外接矩形標準辞書と上記カテゴリ指示情報とを用いて正規化枠(以下、適応正規化枠という。)のサイズを決定して、この適応正規化枠を用いて上記入力画像を正規化する適応正規化処理ステップと、
特徴抽出手段が、上記適応正規化処理ステップにおいて正規化された上記入力画像から特徴ベクトルを求める特徴抽出ステップと
を有する画像識別方法。 - 上記カテゴリ出力ステップでは、
現在の正規化された上記入力画像の上記識別結果(以下、第1結果という。)の信頼度と、前回の正規化された上記入力画像の上記識別結果(以下、第2結果という。)の信頼度とを求め、上記第1結果の信頼度が上記第2結果の信頼度よりも良好の場合に、再正規化処理を必要と判定する
ことを特徴とする請求項6に記載の画像識別方法。 - 上記カテゴリ出力ステップでは、
現在の正規化された上記入力画像の上記識別結果の信頼度を求め、この信頼度が予め定められた基準値よりも良好ではない場合に、再正規化処理を必要と判定する
ことを特徴とする請求項6に記載の画像識別方法。 - 上記適応正規化処理ステップでは、
上記カテゴリ指示情報の指示するカテゴリの外接矩形サイズを上記外接矩形標準辞書から取得し、取得された外接矩形サイズの平均または重み付け平均を上記適応正規化枠のサイズとして決定する
ことを特徴とする請求項6から請求項8のいずれかに記載の画像識別方法。 - 請求項1から請求項5のいずれかに記載された画像識別装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008107808A JP4796599B2 (ja) | 2008-04-17 | 2008-04-17 | 画像識別装置、画像識別方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008107808A JP4796599B2 (ja) | 2008-04-17 | 2008-04-17 | 画像識別装置、画像識別方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009259030A true JP2009259030A (ja) | 2009-11-05 |
JP4796599B2 JP4796599B2 (ja) | 2011-10-19 |
Family
ID=41386362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008107808A Expired - Fee Related JP4796599B2 (ja) | 2008-04-17 | 2008-04-17 | 画像識別装置、画像識別方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4796599B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012194705A (ja) * | 2011-03-15 | 2012-10-11 | Omron Corp | 画像処理装置、画像処理方法および画像処理プログラム |
US20210271929A1 (en) * | 2018-07-09 | 2021-09-02 | Hitachi High-Tech Corporation | Machine learning device, image diagnosis support device, machine learning method and image diagnosis support method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05120488A (ja) * | 1991-10-29 | 1993-05-18 | Ricoh Co Ltd | 線図形認識方法 |
JPH06274682A (ja) * | 1993-03-22 | 1994-09-30 | N T T Data Tsushin Kk | 文字認識方式 |
-
2008
- 2008-04-17 JP JP2008107808A patent/JP4796599B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05120488A (ja) * | 1991-10-29 | 1993-05-18 | Ricoh Co Ltd | 線図形認識方法 |
JPH06274682A (ja) * | 1993-03-22 | 1994-09-30 | N T T Data Tsushin Kk | 文字認識方式 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012194705A (ja) * | 2011-03-15 | 2012-10-11 | Omron Corp | 画像処理装置、画像処理方法および画像処理プログラム |
US20210271929A1 (en) * | 2018-07-09 | 2021-09-02 | Hitachi High-Tech Corporation | Machine learning device, image diagnosis support device, machine learning method and image diagnosis support method |
US11972560B2 (en) * | 2018-07-09 | 2024-04-30 | Hitachi High-Tech Corporation | Machine learning device, image diagnosis support device, machine learning method and image diagnosis support method |
Also Published As
Publication number | Publication date |
---|---|
JP4796599B2 (ja) | 2011-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11055571B2 (en) | Information processing device, recording medium recording information processing program, and information processing method | |
US7653244B2 (en) | Intelligent importation of information from foreign applications user interface | |
US8108324B2 (en) | Forward feature selection for support vector machines | |
US20020164070A1 (en) | Automatic algorithm generation | |
TWI254891B (en) | Face image detection method, face image detection system, and face image detection program | |
JP2015087903A (ja) | 情報処理装置及び情報処理方法 | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
CN102982305A (zh) | 信息处理设备和处理信息的方法、存储介质以及程序 | |
JP2012073684A (ja) | 画像認識方法及び装置並びにプログラム | |
CN111523537A (zh) | 一种文字识别方法、存储介质及系统 | |
US20230044794A1 (en) | Neural network training device, system and method | |
CN114120349A (zh) | 基于深度学习的试卷识别方法及系统 | |
JP3099771B2 (ja) | 文字認識方法、装置及び文字認識プログラムを記録した記録媒体 | |
CN114581928A (zh) | 一种表格识别方法及系统 | |
JP4796599B2 (ja) | 画像識別装置、画像識別方法、プログラム | |
JP4983539B2 (ja) | 情報処理装置および方法、並びにプログラム | |
Boillet et al. | Confidence estimation for object detection in document images | |
CN112215266A (zh) | 一种基于小样本学习的x光图像违禁物品检测方法 | |
CN113870280B (zh) | 预测以细胞为基质的抗体核型类别的方法、设备和介质 | |
CN115937095A (zh) | 融合图像处理算法和深度学习的印刷缺陷检测方法及系统 | |
Moser | Machine learning with the sparse grid density estimation using the combination technique | |
JP5083162B2 (ja) | 画像データ判定装置、画像データ判定システム、及びプログラム | |
CN117854120B (zh) | 一种指纹识别方法及系统 | |
WO2023127085A1 (ja) | 物体認識装置、物体認識方法、及び、記憶媒体 | |
CN113627231B (zh) | 一种基于机器视觉的视网膜oct图像中液体区域自动分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110719 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4796599 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |