JP5769029B2 - 文字認識装置、認識辞書生成装置及び正規化方法 - Google Patents
文字認識装置、認識辞書生成装置及び正規化方法 Download PDFInfo
- Publication number
- JP5769029B2 JP5769029B2 JP2012055638A JP2012055638A JP5769029B2 JP 5769029 B2 JP5769029 B2 JP 5769029B2 JP 2012055638 A JP2012055638 A JP 2012055638A JP 2012055638 A JP2012055638 A JP 2012055638A JP 5769029 B2 JP5769029 B2 JP 5769029B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- procedure
- character
- contour
- grid point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Description
101 入力装置
102 演算装置
103、214 認識辞書
104 表示装置
105 パターンDB
201 文字画像入力部
202 前処理部
203、301 正規化部
204、302 文字輪郭抽出部
206、304 モーメント値算出部
207 正規化写像生成部
208 正規化画像生成部
209 特徴抽出部
210 識別部
211 出力部
212 文字画像DB
213 認識辞書学習部
303 合成画像生成部
Claims (15)
- プロセッサ及び記憶装置を含む演算装置と、前記演算装置に接続される入力装置と、前記演算装置に接続される出力装置と、を有する文字認識装置であって、
前記演算装置は、
前記入力装置を介して入力された入力画像又は前記記憶装置に格納された入力画像から、文字認識の妨げとなる外乱要因を低減するための前処理を実行する第1手順と、
前記前処理が実行された画像を正規化する第2手順と、
前記正規化された画像をベクトル空間上のベクトル値に変換する第3手順と、
前記記憶装置に格納された認識辞書に基づいて前記ベクトル値をいずれかの文字であると判定する第4手順と、
前記出力装置を介して前記判定の結果を出力する第5手順と、を実行し、
前記第2手順は、
前記前処理が実行された画像の輪郭を抽出する第6手順と、
前記前処理が実行された画像と前記抽出された輪郭の画像とを合成する第7手順と、
前記合成された画像から所定のサイズの正規化された画像への写像を、前記合成された画像の重心の像が前記所定のサイズの範囲の中心に近づき、かつ、前記合成された画像の画素が広がる範囲の像が前記所定のサイズの範囲に近づくように生成する第8手順と、
前記生成された写像に従って、前記前処理が実行された画像を正規化する第9手順と、を含むことを特徴とする文字認識装置。 - 前記第7手順は、各格子点における前記前処理が実行された画像の画素値に第1の係数を乗算した値と、各格子点における前記輪郭の画像の画素値に第2の係数を乗算した値と、を加算することによって、各格子点における前記合成された画像の画素値を算出する手順を含むことを特徴とする請求項1に記載の文字認識装置。
- 前記第2手順は、さらに、前記合成された画像の画素が広がる範囲を示すパラメータとして、前記合成された画像のモーメント値を算出する手順を含み、
前記第8手順は、前記モーメント値に応じて前記合成された画像を拡大又は縮小する写像を生成する手順を含むことを特徴とする請求項1に記載の文字認識装置。 - 前記第6手順は、前記前処理が実行された画像の各格子点の周囲の格子点の画素値が所定の条件を満たす場合に前記各格子点における輪郭の画像の画素値を増加させる手順を含むことを特徴とする請求項1に記載の文字認識装置。
- 前記第6手順は、前記前処理が実行された画像の各格子点の周囲の格子点の画素値に所定の係数を乗じた値を集計することによって前記各格子点における輪郭の画像の画素値を算出する手順を含むことを特徴とする請求項1に記載の文字認識装置。
- プロセッサ、及び、前記プロセッサに接続され、文字画像が格納された記憶装置を含む演算装置を有する認識辞書生成装置であって、
前記演算装置は、
前記記憶装置に格納された文字画像から、文字認識の妨げとなる外乱要因を低減するための前処理を実行する第1手順と、
前記前処理が実行された画像を正規化する第2手順と、
前記正規化された画像をベクトル空間上のベクトル値に変換する第3手順と、
前記ベクトル値に基づいて、文字認識に使用される認識辞書を学習する第4手順と、
前記学習の結果を前記記憶装置に格納する第5手順と、を実行し、
前記第2手順は、
前記前処理が実行された画像の輪郭を抽出する第6手順と、
前記前処理が実行された画像と前記抽出された輪郭の画像とを合成する第7手順と、
前記合成された画像から所定のサイズの正規化された画像への写像を、前記合成された画像の重心の像が前記所定のサイズの範囲の中心に近づき、かつ、前記合成された画像の画素が広がる範囲の像が前記所定のサイズの範囲に近づくように生成する第8手順と、
前記生成された写像に従って、前記前処理が実行された画像を正規化する第9手順と、を含むことを特徴とする認識辞書生成装置。 - 前記第7手順は、各格子点における前記前処理が実行された画像の画素値に第1の係数を乗算した値と、各格子点における前記輪郭の画像の画素値に第2の係数を乗算した値と、を加算することによって、各格子点における前記合成された画像の画素値を算出する手順を含むことを特徴とする請求項6に記載の認識辞書生成装置。
- 前記第2手順は、さらに、前記合成された画像の画素が広がる範囲を示すパラメータとして、前記合成された画像のモーメント値を算出する手順を含み、
前記第8手順は、前記モーメント値に応じて前記合成された画像を拡大又は縮小する写像を生成する手順を含むことを特徴とする請求項6に記載の認識辞書生成装置。 - 前記第6手順は、前記前処理が実行された画像の各格子点の周囲の格子点の画素値が所定の条件を満たす場合に前記各格子点における輪郭の画像の画素値を増加させる手順を含むことを特徴とする請求項6に記載の認識辞書生成装置。
- 前記第6手順は、前記前処理が実行された画像の各格子点の周囲の格子点の画素値に所定の係数を乗じた値を集計することによって前記各格子点における輪郭の画像の画素値を算出する手順を含むことを特徴とする請求項6に記載の認識辞書生成装置。
- プロセッサ及び前記プロセッサに接続される記憶装置を含む演算装置が実行する画像の正規化方法であって、
前記演算装置が、前記記憶装置に格納された原画像の輪郭を抽出する第6手順と、
前記演算装置が、前記原画像と前記抽出された輪郭の画像とを合成する第7手順と、
前記演算装置が、前記合成された画像から所定のサイズの正規化された画像への写像を、前記合成された画像の重心の像が前記所定のサイズの範囲の中心に近づき、かつ、前記合成された画像の画素が広がる範囲の像が前記所定のサイズの範囲に近づくように生成する第8手順と、
前記演算装置が、前記生成された写像に従って、前記原画像を正規化し、その結果を前記記憶装置に格納する第9手順と、を含むことを特徴とする正規化方法。 - 前記第7手順は、各格子点における前記前処理が実行された画像の画素値に第1の係数を乗算した値と、各格子点における前記輪郭の画像の画素値に第2の係数を乗算した値と、を加算することによって、各格子点における前記合成された画像の画素値を算出する手順を含むことを特徴とする請求項11に記載の正規化方法。
- 前記正規化方法は、さらに、前記合成された画像の画素が広がる範囲を示すパラメータとして、前記合成された画像のモーメント値を算出する手順を含み、
前記第8手順は、前記モーメント値に応じて前記合成された画像を拡大又は縮小する写像を生成する手順を含むことを特徴とする請求項11に記載の正規化方法。 - 前記第6手順は、前記前処理が実行された画像の各格子点の周囲の格子点の画素値が所定の条件を満たす場合に前記各格子点における輪郭の画像の画素値を増加させる手順を含むことを特徴とする請求項11に記載の正規化方法。
- 前記第6手順は、前記前処理が実行された画像の各格子点の周囲の格子点の画素値に所定の係数を乗じた値を集計することによって前記各格子点における輪郭の画像の画素値を算出する手順を含むことを特徴とする請求項11に記載の正規化方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012055638A JP5769029B2 (ja) | 2012-03-13 | 2012-03-13 | 文字認識装置、認識辞書生成装置及び正規化方法 |
CN201310027353.6A CN103310210B (zh) | 2012-03-13 | 2013-01-24 | 文字识别装置、识别字典生成装置以及归一化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012055638A JP5769029B2 (ja) | 2012-03-13 | 2012-03-13 | 文字認識装置、認識辞書生成装置及び正規化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013190911A JP2013190911A (ja) | 2013-09-26 |
JP5769029B2 true JP5769029B2 (ja) | 2015-08-26 |
Family
ID=49135406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012055638A Active JP5769029B2 (ja) | 2012-03-13 | 2012-03-13 | 文字認識装置、認識辞書生成装置及び正規化方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5769029B2 (ja) |
CN (1) | CN103310210B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6170860B2 (ja) * | 2014-03-25 | 2017-07-26 | 株式会社日立情報通信エンジニアリング | 文字認識装置及び識別関数生成方法 |
CN107274345A (zh) * | 2017-06-07 | 2017-10-20 | 众安信息技术服务有限公司 | 一种中文打印字符图像合成方法及装置 |
CN107194378B (zh) * | 2017-06-28 | 2020-11-17 | 深圳大学 | 一种基于混合字典学习的人脸识别方法及装置 |
CN113569859B (zh) * | 2021-07-27 | 2023-07-04 | 北京奇艺世纪科技有限公司 | 一种图像处理方法、装置、电子设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3052464B2 (ja) * | 1991-07-31 | 2000-06-12 | 日本ビクター株式会社 | 多値化データを用いた輪郭点抽出法 |
JP3301467B2 (ja) * | 1993-12-02 | 2002-07-15 | 日本電信電話株式会社 | 画像パターン同定・認識方法 |
DE69427677T2 (de) * | 1993-12-02 | 2002-05-16 | Nippon Telegraph & Telephone | Bildmusteridentifikations/Erkennungsverfahren |
JPH07160815A (ja) * | 1993-12-02 | 1995-06-23 | Hitachi Eng Co Ltd | 輪郭強調による画像二値化処理方法及び装置 |
JP2002150306A (ja) * | 2000-09-04 | 2002-05-24 | Minolta Co Ltd | 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体 |
JP2002230481A (ja) * | 2001-01-30 | 2002-08-16 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
CN100589119C (zh) * | 2008-05-23 | 2010-02-10 | 中南民族大学 | 多字体多字号的基于彝文字符集的印刷体字符识别方法 |
JP5268563B2 (ja) * | 2008-10-29 | 2013-08-21 | 日立コンピュータ機器株式会社 | 文字認識装置、及び、認識辞書生成装置 |
CN102169542B (zh) * | 2010-02-25 | 2012-11-28 | 汉王科技股份有限公司 | 文字识别中粘连字符的切分方法和装置 |
-
2012
- 2012-03-13 JP JP2012055638A patent/JP5769029B2/ja active Active
-
2013
- 2013-01-24 CN CN201310027353.6A patent/CN103310210B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103310210A (zh) | 2013-09-18 |
CN103310210B (zh) | 2016-06-29 |
JP2013190911A (ja) | 2013-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5406705B2 (ja) | データ補正装置及び方法 | |
US8155398B2 (en) | Image processing apparatus, image processing method and computer program | |
US20180039853A1 (en) | Object Detection System and Object Detection Method | |
WO2017219391A1 (zh) | 一种基于三维数据的人脸识别系统 | |
US8509536B2 (en) | Character recognition device and method and computer-readable medium controlling the same | |
US8391613B2 (en) | Statistical online character recognition | |
JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
JP5082637B2 (ja) | 画像処理プログラム、画像処理方法及び画像処理装置 | |
US20220012612A1 (en) | System, method, and program for predicting information | |
US8351700B2 (en) | Variable glyph system and method | |
CN110674744A (zh) | 一种年龄识别方法、装置及电子设备 | |
WO2006088222A1 (ja) | 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記憶媒体 | |
JP5769029B2 (ja) | 文字認識装置、認識辞書生成装置及び正規化方法 | |
US20150186753A1 (en) | Image Processing Apparatus, Image Processing Method, and Image Processing Program | |
JP5912570B2 (ja) | 筆跡鑑定方法,筆跡鑑定装置及び筆跡鑑定プログラム | |
JP5268563B2 (ja) | 文字認識装置、及び、認識辞書生成装置 | |
CN113724271A (zh) | 一种用于复杂环境移动机器人场景理解的语义分割模型训练方法 | |
JP2010182167A (ja) | 画像処理装置および画像処理方法 | |
JP6147003B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN113077390B (zh) | 一种基于深度学习的图像摆正方法 | |
JP4011859B2 (ja) | 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム | |
JP3855467B2 (ja) | 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 | |
JP5915275B2 (ja) | 画像処理プログラム、画像処理方法及び画像処理装置 | |
CN116403269A (zh) | 一种遮挡人脸解析方法、系统、设备及计算机存储介质 | |
CN112163589A (zh) | 一种图像处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20130809 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140516 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5769029 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |