JP4796599B2 - 画像識別装置、画像識別方法、プログラム - Google Patents
画像識別装置、画像識別方法、プログラム Download PDFInfo
- Publication number
- JP4796599B2 JP4796599B2 JP2008107808A JP2008107808A JP4796599B2 JP 4796599 B2 JP4796599 B2 JP 4796599B2 JP 2008107808 A JP2008107808 A JP 2008107808A JP 2008107808 A JP2008107808 A JP 2008107808A JP 4796599 B2 JP4796599 B2 JP 4796599B2
- Authority
- JP
- Japan
- Prior art keywords
- result
- category
- identification
- image
- reliability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 94
- 238000012545 processing Methods 0.000 claims description 88
- 238000010606 normalization Methods 0.000 claims description 83
- 230000008569 process Effects 0.000 claims description 66
- 230000003044 adaptive effect Effects 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
図面を参照して、本発明の第1実施形態を説明する。
図5は、第1実施形態に係わる画像識別装置1のハードウェア構成を例示した構成ブロック図である。
図5に例示するように、画像識別装置1は、キーボードなどが接続可能な入力部11、液晶ディスプレイなどが接続可能な出力部12、画像識別装置1外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部13、CPU(Central Processing Unit)14〔キャッシュメモリやレジスタなどを備えていてもよい。〕、メモリであるRAM15やROM16、ハードディスクである外部記憶装置17並びにこれらの入力部11、出力部12、通信部13、CPU14、RAM15、ROM16、外部記憶装置17間のデータのやり取りが可能なように接続するバス18を有している。また必要に応じて、画像識別装置1に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
入力画像に対して所定の正規化処理を行うためのプログラム、
正規化された入力画像から特徴ベクトルを求めるためのプログラム、
特徴ベクトルと特徴標準辞書800を用いて正規化された入力画像のカテゴリ毎のスコアを求めて識別結果を出力するためのプログラム、
識別結果を用いて入力画像の再正規化処理の要否を判定し、それが不要の場合には入力画像の識別結果(カテゴリ)を出力し、それが必要の場合にはカテゴリ毎のスコアの内その上位に対応するカテゴリを指示する情報(カテゴリ指示情報)を出力するためのプログラム、
再正規化処理が必要と判断されて出力されたカテゴリ指示情報と外接矩形標準辞書900を用いて正規化枠のサイズを決定して、この正規化枠(以下、適応正規化枠という。)を用いて入力画像を正規化するためのプログラム、
適応正規化枠で正規化された入力画像に対して特徴抽出、識別結果出力、カテゴリ出力の上記各処理を実施する制御を行うためのプログラム
が記憶されている。
図3と図4を参照しながら、本発明の第2実施形態を説明する。
第2実施形態は、第1実施形態のステップS4の処理を、第1結果の信頼度が不良と判定された場合にのみ再正規化処理を実施するように制御する処理(ステップS4′)に変更した形態である(第2結果は不要である。)。つまり、カテゴリ出力部400が、第1実施形態と同様のステップS3の処理で得られた(ソーティング済みの)識別結果(第2実施形態では第1結果)を用いて入力画像の再正規化処理の要否を判定し、それが不要の場合には入力画像の識別結果(カテゴリ)を出力し、それが必要の場合には識別結果(第2実施形態では第1結果)の内その上位に対応するカテゴリを指示する情報(カテゴリ指示情報)を出力する(ステップS4′)。そこで、第1実施形態と異なるステップS4′の処理について説明を行う。
この実施例では、縦横比の変動がしばしば起きる映像中に挿入された文字画像を2値化して得られた合計9918サンプルに対し、文字パターンを粗い局所領域に分割し、各局所領域内の黒画素について4方向(0°、45°、90°、135°)に黒画素連結長を計測し、局所領域内の各方向成分別の分布状況を表す方向寄与度を特徴量として算出し、識別関数としてユークリッド距離を用い、特徴標準辞書には文字カテゴリ3,319カテゴリにおける各文字カテゴリの学習データ(種)から得られる特徴量の平均値を用い、上位1位、2位まで、5位まで、及び10位までの各累積分類率を求めた。
100 標準正規化処理部
200 特徴抽出部
300 識別部
400 カテゴリ出力部
500 適応正規化処理部
Claims (9)
- 入力画像をカテゴリ単位で識別する画像識別装置であって、
各カテゴリの特徴ベクトルを記録した特徴標準辞書と、各カテゴリの外接矩形サイズを記録した外接矩形標準辞書とを記憶する記憶手段と、
入力画像を予め定められたサイズの正規化枠で正規化する標準正規化処理手段と、
正規化された上記入力画像(以下、正規化画像という。)から特徴ベクトルを求める特徴抽出手段と、
上記特徴ベクトルと上記特徴標準辞書を用いて上記正規化画像のカテゴリ毎のスコアを求めて識別結果を出力する識別手段と、
上記識別結果を用いて上記入力画像の再正規化処理の要否を判定し、それが不要の場合には上記入力画像の識別結果を出力し、それが必要の場合にはカテゴリ毎の上記スコアの内その上位に対応するカテゴリを指示する情報(以下、カテゴリ指示情報という。)を出力するカテゴリ出力手段と、
上記カテゴリ指示情報の指示するカテゴリの外接矩形サイズを上記外接矩形標準辞書から取得し、取得された外接矩形サイズの平均または重み付け平均を正規化枠(以下、適応正規化枠という。)のサイズとして決定して、この適応正規化枠を用いて上記入力画像を正規化する適応正規化処理手段と
を備えた画像識別装置。 - 上記カテゴリ出力手段は、
最近に実行された上記識別手段によって得られた上記識別結果(以下、第1結果という。)の信頼度と、その直前に実行された上記識別手段によって得られた上記識別結果(以下、第2結果という。)の信頼度とを求め、当該第1結果の信頼度が当該第2結果の信頼度よりも良好ではない場合には上記入力画像の識別結果として当該第2結果を出力し、当該第1結果の信頼度が当該第2結果の信頼度よりも良好の場合には再正規化処理を必要と判定する
ことを特徴とする請求項1に記載の画像識別装置。 - 上記カテゴリ出力手段は、
最近に実行された上記識別手段によって得られた上記識別結果(以下、最新識別結果という。)の信頼度を求め、この信頼度が予め定められた基準値よりも良好である場合には上記入力画像の識別結果として当該最新識別結果を出力し、この信頼度が予め定められた基準値よりも良好ではない場合には再正規化処理を必要と判定する
ことを特徴とする請求項1に記載の画像識別装置。 - 上記信頼度は、各カテゴリのスコア値の全部または一部に基づく上記識別結果の尤もらしさの指標である
ことを特徴とする請求項2または請求項3に記載の画像識別装置。 - 入力画像をカテゴリ単位で識別する画像識別方法であって、
標準正規化処理手段が、入力画像を予め定められたサイズの正規化枠で正規化する標準正規化処理ステップと、
特徴抽出手段が、上記標準正規化処理ステップにおいて正規化された上記入力画像から特徴ベクトルを求める特徴抽出ステップと、
識別手段が、各カテゴリの特徴ベクトルを記録した特徴標準辞書と正規化された上記入力画像の特徴ベクトルとを用いて正規化された上記入力画像のカテゴリ毎のスコアを求めて識別結果を出力する識別ステップと、
カテゴリ出力手段が、上記識別結果を用いて上記入力画像の再正規化処理の要否を判定し、それが不要の場合には上記入力画像の識別結果を出力し、それが必要の場合にはカテゴリ毎の上記スコアの内その上位に対応するカテゴリを指示する情報(以下、カテゴリ指示情報という。)を出力するカテゴリ出力ステップと、
適応正規化処理手段が、各カテゴリの外接矩形サイズを記録した外接矩形標準辞書から上記カテゴリ指示情報の指示するカテゴリの外接矩形サイズを取得し、取得された外接矩形サイズの平均または重み付け平均を正規化枠(以下、適応正規化枠という。)のサイズとして決定して、この適応正規化枠を用いて上記入力画像を正規化する適応正規化処理ステップと、
特徴抽出手段が、上記適応正規化処理ステップにおいて正規化された上記入力画像から特徴ベクトルを求める特徴抽出ステップと
を有する画像識別方法。 - 上記カテゴリ出力ステップでは、
最近に実行された上記識別ステップにおいて得られた上記識別結果(以下、第1結果という。)の信頼度と、その直前に実行された上記識別ステップにおいて得られた上記識別結果(以下、第2結果という。)の信頼度とを求め、当該第1結果の信頼度が当該第2結果の信頼度よりも良好ではない場合には上記入力画像の識別結果として当該第2結果を出力し、当該第1結果の信頼度が当該第2結果の信頼度よりも良好の場合には再正規化処理を必要と判定する
ことを特徴とする請求項5に記載の画像識別方法。 - 上記カテゴリ出力ステップでは、
最近に実行された上記識別ステップにおいて得られた上記識別結果(以下、最新識別結果という。)の信頼度を求め、この信頼度が予め定められた基準値よりも良好である場合には上記入力画像の識別結果として当該最新識別結果を出力し、この信頼度が予め定められた基準値よりも良好ではない場合には再正規化処理を必要と判定する
ことを特徴とする請求項5に記載の画像識別方法。 - 上記信頼度は、各カテゴリのスコア値の全部または一部に基づく上記識別結果の尤もらしさの指標である
ことを特徴とする請求項6または請求項7に記載の画像識別方法。 - 請求項1から請求項4のいずれかに記載された画像識別装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008107808A JP4796599B2 (ja) | 2008-04-17 | 2008-04-17 | 画像識別装置、画像識別方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008107808A JP4796599B2 (ja) | 2008-04-17 | 2008-04-17 | 画像識別装置、画像識別方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009259030A JP2009259030A (ja) | 2009-11-05 |
JP4796599B2 true JP4796599B2 (ja) | 2011-10-19 |
Family
ID=41386362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008107808A Expired - Fee Related JP4796599B2 (ja) | 2008-04-17 | 2008-04-17 | 画像識別装置、画像識別方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4796599B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012194705A (ja) * | 2011-03-15 | 2012-10-11 | Omron Corp | 画像処理装置、画像処理方法および画像処理プログラム |
JP7046745B2 (ja) * | 2018-07-09 | 2022-04-04 | 株式会社日立ハイテク | 機械学習装置、画像診断支援装置、機械学習方法及び画像診断支援方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05120488A (ja) * | 1991-10-29 | 1993-05-18 | Ricoh Co Ltd | 線図形認識方法 |
JPH06274682A (ja) * | 1993-03-22 | 1994-09-30 | N T T Data Tsushin Kk | 文字認識方式 |
-
2008
- 2008-04-17 JP JP2008107808A patent/JP4796599B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009259030A (ja) | 2009-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8756174B2 (en) | Forward feature selection for support vector machines | |
US7653244B2 (en) | Intelligent importation of information from foreign applications user interface | |
US10095957B2 (en) | Method and system for unsupervised word image clustering | |
US20020164070A1 (en) | Automatic algorithm generation | |
JP2015087903A (ja) | 情報処理装置及び情報処理方法 | |
CN110942074A (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
CN102982305A (zh) | 信息处理设备和处理信息的方法、存储介质以及程序 | |
TW200529093A (en) | Face image detection method, face image detection system, and face image detection program | |
JP2012073684A (ja) | 画像認識方法及び装置並びにプログラム | |
CN111523537A (zh) | 一种文字识别方法、存储介质及系统 | |
US20230044794A1 (en) | Neural network training device, system and method | |
WO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および記録媒体 | |
EP0877335B1 (en) | Character recognition method, character recognition apparatus | |
JP4796599B2 (ja) | 画像識別装置、画像識別方法、プログラム | |
CN114581928A (zh) | 一种表格识别方法及系统 | |
JP4983539B2 (ja) | 情報処理装置および方法、並びにプログラム | |
CN115294417A (zh) | 用于图像处理的方法、设备和存储介质 | |
CN112215266A (zh) | 一种基于小样本学习的x光图像违禁物品检测方法 | |
CN110751623A (zh) | 基于联合特征的缺陷检测方法、装置、设备及存储介质 | |
CN113870280A (zh) | 预测以细胞为基质的抗体核型类别的方法、设备和介质 | |
CN117854120B (zh) | 一种指纹识别方法及系统 | |
CN117671704B (zh) | 一种手写体数字识别方法、装置及计算机存储介质 | |
CN118094431A (zh) | 一种基于图文对比学习的表面异常检测方法 | |
WO2023127085A1 (ja) | 物体認識装置、物体認識方法、及び、記憶媒体 | |
CN117746335A (zh) | 机器人工作场景下的未知目标识别及增量学习方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110719 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4796599 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |