JP6102156B2 - 画像処理システムおよび画像処理方法 - Google Patents
画像処理システムおよび画像処理方法 Download PDFInfo
- Publication number
- JP6102156B2 JP6102156B2 JP2012217681A JP2012217681A JP6102156B2 JP 6102156 B2 JP6102156 B2 JP 6102156B2 JP 2012217681 A JP2012217681 A JP 2012217681A JP 2012217681 A JP2012217681 A JP 2012217681A JP 6102156 B2 JP6102156 B2 JP 6102156B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- format
- image processing
- character recognition
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Description
好ましくは、第1指定手段は、参照画像を表示するとともに、表示された参照画像に対するユーザ操作に応答して計測領域を決定する。
まず、本実施の形態に係る画像処理システムの装置構成について説明する。図1は、本実施の形態に係る画像処理システム1の全体構成を示す外観図である。図2は、本実施の形態に係る画像処理システム1の機能的構成を示す模式図である。
次に、画像処理システム1で扱う文字フォーマットについて説明する。本実施の形態に係る画像処理システム1では、文字フォーマットの一例として、「数字文字」、「英字文字」、「英数字」、「記号文字」といった文字種別を指定できる。これらの文字種別は、認識対象の文字別に指定可能になっている。
次に、上述の文字フォーマットを用いた文字認識処理について説明する。図3は、本実施の形態に係る画像処理システム1における文字認識の処理内容を示す模式図である。
次に、図3に示す文字認識処理において参照される計測パラメータの詳細について説明する。本実施の形態に係る画像処理システム1においては、以下のような計測パラメータを用いる。
(1)文字色:検出対象の文字の色を指定するパラメータ
・設定値:「黒」または「白」
(2)印字種類:検出対象の文字の表現形式を指定するパラメータ
・設定値:「捺印」または「ドット」(「捺印」は、アウトラインフォントなどの外形が連続したフォントを意味し、「ドット」は、ドットマトリックスなどのフォントを意味する)
(3)ドット間隔(縦):(2)の印字種類が「ドット」の場合のみ有効となるパラメータであり、検出対象の文字を構成する縦のドット間隔を示すパラメータ
・入力範囲:0ピクセル〜入力画像の縦幅(ピクセル)
(4)ドット間隔(横):(2)の印字種類が「ドット」の場合のみ有効となるパラメータであり、検出対象の文字を構成する横のドット間隔を示すパラメータ
・入力範囲:0ピクセル〜入力画像の横幅(ピクセル)
(5)フィルタサイズ:ノイズ除去用のフィルタサイズを指定するパラメータ
・入力範囲:−60〜440(値が大きいほど広い領域でノイズ除去を行い、値が小さいほど狭い範囲でノイズ除去を行う)
(6)文字太さしきい値:検出対象の文字の太さを指定するパラメータ
・入力範囲:−255〜255(負の数を設定すると文字が細くなる方向に変化し、正の値を設定すると文字が太くなる方向に変化する)
(7)回転バラツキ補正:機能をONにすることで所定範囲にわたる文字の回転バラツキに対応できる
・設定値:「ON」または「OFF」
(8)斜体バラツキ補正:機能をONにすることで所定範囲にわたる文字の斜体バラツキに対応できる
・設定値:「ON」または「OFF」
(9)ふち消し補正:機能をONにすることで計測領域に接している黒い部分をノイズとして読み取り候補から除外する
・設定値:「ON」または「OFF」
(10)細長文字しきい値:検出矩形の高さの幅に対する倍率がいくら以上のときに細長文字(I,J,1,:,/)と判定するかを指定する
・入力範囲:1〜10
(11)ハイフン高さ上限:ハイフンと見なす領域の高さ上限値を指定する
入力範囲:0〜100
(12)ハイフン高さ下限:ハイフンと見なす領域の高さ下限値を指定する
入力範囲:0〜100
[E.処理手順]
次に、本実施の形態に係る画像処理システム1において入力画像から文字情報を取得する画像処理方法に係る処理手順について説明する。
次に、上述の図4に示す処理手順の各局面において提供されるユーザインターフェイス画面の一例について説明する。
図6は、本実施の形態に係る画像処理システム1が提供する文字認識処理の初期メニューを示すユーザインターフェイス画面400Aの一例を示す図である。図6に示すユーザインターフェイス画面400Aは、表示操作部201において提供される。以下の各ユーザインターフェイス画面についても同様に、表示操作部201において提供される。
図7は、本実施の形態に係る画像処理システム1が提供する文字認識処理における計測領域を設定するためのユーザインターフェイス画面400Bの一例を示す図である。図7を参照して、ユーザインターフェイス画面400Bでは、目的の対象物(基準サンプル)を撮像することで取得された参照画像404が表示されている。ユーザは、この表示されている参照画像404の上から目的の計測領域を設定する。具体的には、ユーザは、タッチ操作あるいはマウス操作などによって、カーソル406を操作して計測領域に対応する領域を設定する。図7においては、4つのカーソル406で囲まれる範囲が計測領域408となる。
図8は、本実施の形態に係る画像処理システム1が提供する文字認識処理における文字フォーマットを設定するためのユーザインターフェイス画面400Cの一例を示す図である。画像処理システム1では、同一の入力画像に対して複数の計測領域を設定することが可能であり、図8に示すユーザインターフェイス画面400Cでは、4つの計測領域に対して、それぞれ文字フォーマットを設定できるようになっている。すなわち、ユーザインターフェイス画面400Cは、4つの文字フォーマット入力領域410,412,414,416を含む。
図11は、本実施の形態に係る画像処理システム1が提供する文字認識処理におけるオートティーチ機能に係るユーザインターフェイス画面400Fの一例を示す図である。図11を参照して、ユーザインターフェイス画面400Fでは、参照画像404および参照画像404の上に設定されている計測領域408が表示されており、ユーザがTEACHのオブジェクト436を選択すると、オートティーチ機能が開始される。具体的には、視覚センサ200は、設定された文字フォーマットに従って、計測領域に含まれる部分画像に対して文字認識を実行するとともに、計測パラメータを最適化する。すなわち、このオートティーチ機能の実行中、設定された文字フォーマットに基づく文字認識の結果が最適化されるように、計測パラメータが調整される。
図12に示すユーザインターフェイス画面400Gにおいて、設定されている文字フォーマットを変更するためのオブジェクト442(文字フォーマット)が選択されると、設定されている文字フォーマットを変更(調整)するためのユーザインターフェイス画面が提供される。
図12に示すユーザインターフェイス画面400Gにおいて、計測パラメータを変更するためのオブジェクト446(計測パラメータ)が選択されると、設定されている計測パラメータを確認および変更(調整)するためのユーザインターフェイス画面が提供される。
図14に示すユーザインターフェイス画面400Iにおいて、文字色を示すフィールド450が選択されると、設定されている文字色についての設定値を確認および変更(調整)するためのユーザインターフェイス画面が提供される。
図14に示すユーザインターフェイス画面400Iにおいて、ドット間隔(縦)を示すフィールド454が選択されると、設定されているドット間隔(縦)についての設定値を確認および変更(調整)するためのユーザインターフェイス画面が提供される。
図14に示すユーザインターフェイス画面400Iにおいて、文字太さしきい値を示すフィールド458が選択されると、設定されている文字太さしきい値についての設定値を確認および変更(調整)するためのユーザインターフェイス画面が提供される。
本実施の形態によれば、文字種別や特定文字などからなる文字フォーマットを入力し、オートティーチ機能を実行することで、文字認識処理に必要な計測パラメータが自動調整される。これにより、文字認識などの画像処理の知識が少ないユーザであっても、文字認識を実行するために必要な計測パラメータを容易に設定できる。
Claims (9)
- 入力画像から文字情報を取得する画像処理システムであって、
基準の対象物を撮像することで得られた参照画像に対する計測領域の設定を受付ける第1指定手段と、
認識対象の文字別の制約条件を示す文字フォーマットを受付ける第2指定手段と、
前記文字フォーマットに従って、前記計測領域に含まれる部分画像に対して文字認識を実行する認識手段と、
文字認識に係るパラメータを設定する設定手段とを備え、
前記設定手段は、
前記参照画像の前記計測領域に含まれる部分画像に対する現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致するか否かを判断する判断手段と、
前記現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致すれば、当該現在のパラメータを前記文字認識に係るパラメータの初期値として決定する決定手段と、
前記現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致しなければ、当該現在のパラメータに対して変更を加えた上で、変更後のパラメータに従う文字認識を再度実行させる変更手段とを含む、画像処理システム。 - 前記パラメータは、複数の要素を含み、
前記変更手段は、直前に実行された文字認識の実行前に変更された要素とは異なる要素を変更する、請求項1に記載の画像処理システム。 - 前記文字フォーマットは、文字別に文字種別または特定文字の指定を含む、請求項1または2に記載の画像処理システム。
- 前記第1指定手段は、前記参照画像を表示するとともに、表示された参照画像に対するユーザ操作に応答して前記計測領域を決定する、請求項1〜3のいずれか1項に記載の画像処理システム。
- 前記第2指定手段は、設定されている文字フォーマットを表示するとともに、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクトを表示し、いずれかのオブジェクトの選択に応答して、選択されたオブジェクトに関連付けられた文字種別を文字フォーマットに追加する、請求項1〜4のいずれか1項に記載の画像処理システム。
- 前記設定手段は、前記文字認識に係るパラメータの初期値に対する外部からの変更を受付ける、請求項1〜5のいずれか1項に記載の画像処理システム。
- 前記認識手段は、前記設定手段によって設定されたパラメータに従って、前記基準の対象物と同種類の対象物を撮像することで得られた対象画像に対して、当該対象画像の前記計測領域に含まれる部分画像に対する文字認識を実行する、請求項1〜6のいずれか1項に記載の画像処理システム。
- 処理対象の入力画像を取得する取得手段をさらに備え、
前記認識手段は、前記文字フォーマットの下での一致度が相対的に高い領域を特定する、請求項1〜7のいずれか1項に記載の画像処理システム。 - 入力画像から文字情報を取得する画像処理方法であって、
基準の対象物を撮像することで得られた参照画像に対する計測領域の設定を受付けるステップと、
認識対象の文字別の制約条件を示す文字フォーマットを受付けるステップと、
前記文字フォーマットに従って、前記計測領域に含まれる部分画像に対して文字認識を実行するステップと、
文字認識に係るパラメータを設定するステップとを含み、
前記設定するステップは、
前記参照画像の前記計測領域に含まれる部分画像に対する現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致するか否かを判断するステップと、
前記現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致すれば、当該現在のパラメータを前記文字認識に係るパラメータの初期値として決定するステップと、
前記現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致しなければ、当該現在のパラメータに対して変更を加えた上で、変更後のパラメータに従う文字認識を再度実行させるステップとを含む、画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012217681A JP6102156B2 (ja) | 2012-09-28 | 2012-09-28 | 画像処理システムおよび画像処理方法 |
EP13177090.1A EP2713313B1 (en) | 2012-09-28 | 2013-07-18 | Image processing system and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012217681A JP6102156B2 (ja) | 2012-09-28 | 2012-09-28 | 画像処理システムおよび画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014071696A JP2014071696A (ja) | 2014-04-21 |
JP6102156B2 true JP6102156B2 (ja) | 2017-03-29 |
Family
ID=48874802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012217681A Active JP6102156B2 (ja) | 2012-09-28 | 2012-09-28 | 画像処理システムおよび画像処理方法 |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP2713313B1 (ja) |
JP (1) | JP6102156B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6300663B2 (ja) * | 2014-06-23 | 2018-03-28 | 株式会社日立情報通信エンジニアリング | 光学文字認識装置及び光学文字認識方法 |
CN105303189B (zh) | 2014-07-29 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种用于检测预定区域中特定标识图像的方法及装置 |
JP6448696B2 (ja) * | 2017-03-22 | 2019-01-09 | 株式会社東芝 | 情報処理装置、方法及びプログラム |
CN112668566A (zh) * | 2020-12-23 | 2021-04-16 | 深圳壹账通智能科技有限公司 | 表格处理方法、装置、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6401067B2 (en) * | 1999-01-28 | 2002-06-04 | International Business Machines Corporation | System and method for providing user-directed constraints for handwriting recognition |
JP4655335B2 (ja) * | 2000-06-20 | 2011-03-23 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
US6944340B1 (en) * | 2000-08-07 | 2005-09-13 | Canon Kabushiki Kaisha | Method and apparatus for efficient determination of recognition parameters |
JP4791641B2 (ja) * | 2001-03-15 | 2011-10-12 | 株式会社リコー | 候補文字出力装置、候補文字出力方法、プログラムおよびコンピュータ読み取り可能な記録媒体 |
JP2007304864A (ja) * | 2006-05-11 | 2007-11-22 | Fuji Xerox Co Ltd | 文字認識処理システムおよび文字認識処理プログラム |
JP5521497B2 (ja) * | 2009-11-05 | 2014-06-11 | 富士通株式会社 | パターン認識装置、パターン認識プログラム、パターン認識方法 |
-
2012
- 2012-09-28 JP JP2012217681A patent/JP6102156B2/ja active Active
-
2013
- 2013-07-18 EP EP13177090.1A patent/EP2713313B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2713313B1 (en) | 2020-12-02 |
JP2014071696A (ja) | 2014-04-21 |
EP2713313A3 (en) | 2015-08-26 |
EP2713313A2 (en) | 2014-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5831420B2 (ja) | 画像処理装置および画像処理方法 | |
JP6264965B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラム | |
JP7176966B2 (ja) | 画像検査装置 | |
JP2020125919A (ja) | 画像検査装置 | |
JP7287791B2 (ja) | 画像検査装置 | |
CN102457649B (zh) | 图像形成装置以及图像形成方法 | |
JP3113827B2 (ja) | 矩形オブジェクトの認識方法及び認識装置 | |
US20080150908A1 (en) | Image Printing Apparatus and Method for Setting a Printing Parameter Therein | |
JP6102156B2 (ja) | 画像処理システムおよび画像処理方法 | |
EP2626813B1 (en) | Apparatus and method for guiding handwriting input for handwriting recognition | |
US11244192B2 (en) | Image judging system, image judging apparatus, and image judging method | |
JP2018025885A (ja) | 画像処理装置 | |
CN113378839A (zh) | 信息处理装置、信息处理方法及计算机可读介质 | |
US9961217B2 (en) | Electronic apparatus with instruction reception unit receiving instruction indicated by user and computer-readable medium with program | |
US6327393B1 (en) | Method and apparatus to transform a region within a digital image using a deformable window | |
JP5885569B2 (ja) | 画像処理装置および画像処理プログラム | |
JP7241506B2 (ja) | 光学式文字認識結果の修正支援装置および修正支援用プログラム | |
JP6156740B2 (ja) | 情報表示装置及び入力情報補正プログラム並びに入力情報補正方法 | |
JP6011214B2 (ja) | 画像処理システムおよび画像処理方法 | |
US10178245B2 (en) | Terminal device, diagnosis system and non-transitory computer readable medium | |
US11616891B2 (en) | Information processing apparatus and non-transitory computer readable medium for analyzing an image capture in a time series with respect to content of parameter and making an assumption how user performed operation in an apparatus | |
EP2296081A1 (en) | Image processing apparatus and method of controlling the same | |
JP4543741B2 (ja) | グラフ作成装置、プログラムおよび記録媒体 | |
WO2022022757A1 (en) | A method for testing an embedded system of a device, a method for identifying a state of the device and a system for these methods | |
JP6477558B2 (ja) | 文字学習システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150807 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170131 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6102156 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |