JP2006195991A - 多値文字辞書生成装置 - Google Patents
多値文字辞書生成装置 Download PDFInfo
- Publication number
- JP2006195991A JP2006195991A JP2006003557A JP2006003557A JP2006195991A JP 2006195991 A JP2006195991 A JP 2006195991A JP 2006003557 A JP2006003557 A JP 2006003557A JP 2006003557 A JP2006003557 A JP 2006003557A JP 2006195991 A JP2006195991 A JP 2006195991A
- Authority
- JP
- Japan
- Prior art keywords
- character
- value
- composite
- character image
- deteriorated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1914—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Image Processing (AREA)
Abstract
【解決手段】入力二値文字画像を用いて第1の合成多値劣化文字画像を生成する第1の合成多値劣化文字画像生成部108と、第1の合成多値劣化文字画像生成部により生成された第1の合成多値劣化文字画像の各カテゴリーを複数のクラスタに分割するクラスタ化部103と、合成多値劣化文字画像の各カテゴリーの複数のクラスタにおいて、前記各クラスタにつきテンプレートを生成するテンプレート計算部104と、前記各テンプレートに関し変換行列を生成する変換行列生成部105と、変換行列を用いてクラスタのそれぞれの多値劣化文字毎の文字の特徴を得、かつ合成多値劣化文字の各カテゴリーの固有空間を構築する第2の合成多値劣化文字辞書生成部106を備える。固有空間は第2の合成多値文字辞書110である。
【選択図】 図1
Description
1.Nc≧Tchar(Tcharは所定の値である)ならば、j番目のカテゴリーのi番目のクラスタの文字画像を出力し、過程を終了する。そうでない場合は、下記の工程を実行する。
2.サンプルの数がTcharよりも小さいクラスタにおける全てのサンプルについて生成されたパターンの数Npを、下記の式
Np=(Tchar + Nc−1)
に従って計算する。
3.クラスタの各文字に対応するNp個の合成多値劣化文字画像を生成する。
Fij=AT (Xij−μ)
により得られる。ここに、
1.文字特徴抽出工程:j番目のカテゴリーのi番目の文字画像が
fji=AT(Gji−μj )
によって得られる。ここに、μj はj番目のカテゴリーの平均文字画像である。
2.固有空間構築工程:第1の合成多値文字画像生成部および第2の合成多値文字画像生成部において生成された全てのサンプルを含む、j番目のカテゴリーの全ての文字画像の特徴fjiを用いて文字カテゴリーの固有空間を構築する。PCAを用いて(第1の合成多値文字画像生成部および第2の合成多値文字画像生成部により生成された多値劣化文字画像の特徴を含む)同じ文字カテゴリーに属する全ての文字画像の特徴を分析してこれらの特徴のより高次元空間における分布を取得し、そして線形変換行列を用いてこの分布を表す。各カテゴリーに対応する線形変換行列は第2の多値文字辞書である。
102 第1の合成多値文字画像生成部
103 クラスタ化部
104 テンプレート計算部
105 変換行列生成部
106 第2の合成多値劣化文字画像生成部
107 第2の多値文字辞書生成部
108 第1の多値文字辞書生成部
109 第1の多値文字辞書
110 第2の多値文字辞書
409 テンプレート
410 出力
Claims (10)
- 入力された二値文字画像を用いて第1の合成多値劣化文字画像を生成する第1の合成多値劣化文字画像生成部と、
前記第1の合成多値劣化文字画像生成部により生成された前記第1の合成多値劣化文字画像の各カテゴリーを複数のクラスタに分割するクラスタ化部と、
前記合成多値劣化文字画像の各カテゴリーの前記複数のクラスタにおいて、前記クラスタのそれぞれについてテンプレートを生成するテンプレート計算部と、
前記テンプレートのそれぞれに関して変換行列を生成する変換行列生成部と、
前記変換行列を用いて前記クラスタのそれぞれの多値劣化文字毎の文字の特徴を得、かつ前記合成多値劣化文字の各カテゴリーの固有空間を構築する第2の合成多値劣化文字辞書生成部を備え、
前記固有空間は前記第2の合成多値文字辞書である
ことを特徴とする多値文字辞書生成装置。 - さらに、
前記クラスタ化部により生成された前記複数のクラスタの内の1つ以上のクラスタ中の前記合成多値劣化文字画像の数が所定の値よりも少ないときに、前記1つ以上のクラスタにおける前記第1の合成多値劣化文字画像を用いて複数の第2の合成多値劣化文字画像を生成し、前記1つ以上のクラスタ中の前記合成多値劣化文字画像の数が所定の値に等しいか、または大きいようにする、第2の合成多値劣化文字画像生成部
を備えたことを特徴とする請求項1に記載の多値文字辞書生成装置。 - 前記クラスタ化部は階層化クラスタ化方法を用いて各カテゴリーを前記複数のクラスタに分割することを特徴とする請求項1に記載の多値文字辞書生成装置。
- さらに、
前記変換行列を用いて前記クラスタのそれぞれの前記テンプレートの線形変換をして第1の合成多値文字辞書を生成する第1の合成多値劣化文字辞書生成部
を備えたことを特徴とする請求項1、2または3に記載の多値文字辞書生成装置。 - さらに、二値文字画像を前記第1の合成多値劣化文字画像生成部に入力する入力部を備えたことを特徴とする請求項1、2または3に記載の多値文字辞書生成装置。
- 前記第1の合成多値劣化文字画像生成部は、
生成することが必要とされる前記合成文字の劣化レベルであって、異なる劣化レベルが異なる劣化程度に対応するものを推定する劣化レベル推定部と、
前記入力された二値文字画像のそれぞれについて前記劣化レベルのそれぞれに対応する合成多値劣化文字画像を生成する劣化多値文字生成部
を備えたことを特徴とする請求項1、2または3に記載の多値文字辞書生成装置。 - 前記劣化レベルの数は3または4であることを特徴とする請求項6に記載の多値文字辞書生成装置。
- 前記変換行列生成部は主成分分析方法を用いて前記変換行列を生成することを特徴とする請求項1、2または3に記載の多値文字辞書生成装置。
- 前記第2の合成多値劣化文字辞書生成部は主成分分析方法を用いて前記合成多値劣化文字の各カテゴリーの固有空間を構築することを特徴とする請求項1、2または3に記載の多値文字辞書生成装置。
- 前記第1の合成多値劣化文字画像生成部は、
生成することが必要とされる前記合成文字の劣化レベルであって、異なる劣化レベルが異なる劣化程度に対応するものを推定する劣化レベル推定部と、
前記入力された二値文字画像のそれぞれについて前記劣化レベルのそれぞれに対応する合成多値劣化文字画像を生成する劣化多値文字生成部を備え、
前記変換行列生成部は主成分分析方法を用いて前記変換行列を生成し、かつ
前記第2の合成多値劣化文字辞書生成部は主成分分析方法を用いて前記合成多値劣化文字の各カテゴリーの固有空間を構築する
ことを特徴とする請求項4に記載の多値文字辞書生成装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100004395A CN100369051C (zh) | 2005-01-11 | 2005-01-11 | 灰度字符词典的生成装置 |
CN200510000439.5 | 2005-01-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006195991A true JP2006195991A (ja) | 2006-07-27 |
JP4801998B2 JP4801998B2 (ja) | 2011-10-26 |
Family
ID=36756601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006003557A Expired - Fee Related JP4801998B2 (ja) | 2005-01-11 | 2006-01-11 | 多値文字辞書生成装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7532756B2 (ja) |
JP (1) | JP4801998B2 (ja) |
CN (1) | CN100369051C (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100369051C (zh) * | 2005-01-11 | 2008-02-13 | 富士通株式会社 | 灰度字符词典的生成装置 |
JP5161845B2 (ja) * | 2009-07-31 | 2013-03-13 | 富士フイルム株式会社 | 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム |
US8854375B2 (en) * | 2010-10-19 | 2014-10-07 | Dynacomware Taiwan Inc. | Method and system for generating gray dot-matrix font from binary dot-matrix font |
CN108805148B (zh) * | 2017-04-28 | 2022-01-11 | 富士通株式会社 | 处理图像的方法和用于处理图像的装置 |
CN115311375B (zh) * | 2022-10-10 | 2023-04-07 | 南通安昇纺织品有限公司 | 用于格纹织物数据的压缩存储、传输方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09161012A (ja) * | 1995-12-06 | 1997-06-20 | Hitachi Ltd | 認識辞書自動生成方法 |
JPH1063785A (ja) * | 1996-08-14 | 1998-03-06 | Fujitsu Ltd | 文字認識装置 |
JPH11175662A (ja) * | 1997-12-12 | 1999-07-02 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 |
JP2001184509A (ja) * | 1999-12-24 | 2001-07-06 | Nec Corp | パターン認識装置及び方法並びに記録媒体 |
JP2001338264A (ja) * | 2000-05-25 | 2001-12-07 | Ricoh Co Ltd | 文字認識パターン辞書作成装置、文字認識パターン辞書作成方法および記録媒体 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4945351A (en) * | 1988-05-23 | 1990-07-31 | Hewlett-Packard Company | Technique for optimizing grayscale character displays |
JP3118725B2 (ja) * | 1991-09-11 | 2000-12-18 | 株式会社日立製作所 | 自動分類方法 |
US5579407A (en) * | 1992-04-21 | 1996-11-26 | Murez; James D. | Optical character classification |
JPH0676117A (ja) | 1992-08-25 | 1994-03-18 | Canon Inc | 情報処理方法及び装置 |
US6052481A (en) * | 1994-09-02 | 2000-04-18 | Apple Computers, Inc. | Automatic method for scoring and clustering prototypes of handwritten stroke-based data |
JPH08241378A (ja) * | 1995-03-03 | 1996-09-17 | Fuji Electric Co Ltd | 低品質文字の認識方法 |
US6266445B1 (en) * | 1998-03-13 | 2001-07-24 | Canon Kabushiki Kaisha | Classification-driven thresholding of a normalized grayscale image |
US6678414B1 (en) * | 2000-02-17 | 2004-01-13 | Xerox Corporation | Loose-gray-scale template matching |
US7034963B2 (en) * | 2001-07-11 | 2006-04-25 | Applied Materials, Inc. | Method for adjusting edges of grayscale pixel-map images |
US7373008B2 (en) * | 2002-03-28 | 2008-05-13 | Hewlett-Packard Development Company, L.P. | Grayscale and binary image data compression |
CN1200387C (zh) * | 2003-04-11 | 2005-05-04 | 清华大学 | 基于单个字符的统计笔迹鉴别和验证方法 |
CN100369051C (zh) * | 2005-01-11 | 2008-02-13 | 富士通株式会社 | 灰度字符词典的生成装置 |
-
2005
- 2005-01-11 CN CNB2005100004395A patent/CN100369051C/zh not_active Expired - Fee Related
-
2006
- 2006-01-11 JP JP2006003557A patent/JP4801998B2/ja not_active Expired - Fee Related
- 2006-01-11 US US11/329,407 patent/US7532756B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09161012A (ja) * | 1995-12-06 | 1997-06-20 | Hitachi Ltd | 認識辞書自動生成方法 |
JPH1063785A (ja) * | 1996-08-14 | 1998-03-06 | Fujitsu Ltd | 文字認識装置 |
JPH11175662A (ja) * | 1997-12-12 | 1999-07-02 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 |
JP2001184509A (ja) * | 1999-12-24 | 2001-07-06 | Nec Corp | パターン認識装置及び方法並びに記録媒体 |
JP2001338264A (ja) * | 2000-05-25 | 2001-12-07 | Ricoh Co Ltd | 文字認識パターン辞書作成装置、文字認識パターン辞書作成方法および記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
CN100369051C (zh) | 2008-02-13 |
JP4801998B2 (ja) | 2011-10-26 |
CN1804869A (zh) | 2006-07-19 |
US20060171589A1 (en) | 2006-08-03 |
US7532756B2 (en) | 2009-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mowlaei et al. | Feature extraction with wavelet transform for recognition of isolated handwritten Farsi/Arabic characters and numerals | |
CN110322495A (zh) | 一种基于弱监督深度学习的场景文本分割方法 | |
US20020076088A1 (en) | Method of multi-level facial image recognition and system using the same | |
Dai et al. | Adaptive image sampling using deep learning and its application on X-ray fluorescence image reconstruction | |
CN111401372A (zh) | 一种扫描文档图文信息提取与鉴别的方法 | |
CN110766020A (zh) | 一种面向多语种自然场景文本检测与识别的系统及方法 | |
CN110363068B (zh) | 一种基于多尺度循环生成式对抗网络的高分辨行人图像生成方法 | |
JP4801998B2 (ja) | 多値文字辞書生成装置 | |
CN114663685B (zh) | 一种行人重识别模型训练的方法、装置和设备 | |
CN105956610B (zh) | 一种基于多层编码结构的遥感图像地形分类方法 | |
Dineshkumar et al. | Sanskrit character recognition system using neural network | |
An et al. | RBDN: Residual bottleneck dense network for image super-resolution | |
Herwanto et al. | Zoning feature extraction for handwritten Javanese character recognition | |
CN111209886B (zh) | 一种基于深度神经网络的快速行人再识别方法 | |
Sharma et al. | A deep cnn model for student learning pedagogy detection data collection using ocr | |
JPH06508463A (ja) | 画素に対して電荷モデルを適用したビットマップ画像セグメンテーション | |
Jewsbury et al. | A quadtree image representation for computational pathology | |
Bui et al. | Automatic synthetic document image generation using generative adversarial networks: application in mobile-captured document analysis | |
CN111553202B (zh) | 进行活体检测的神经网络的训练方法、检测方法及装置 | |
Narasimhaiah et al. | Recognition of compound characters in Kannada language | |
Hoque et al. | Autonomous Deblurring Images and Information Extraction from Documents Using CycleGAN and Mask RCNN | |
Vaidya et al. | Marathi Numeral Identification System in Devanagari Script Using 1D Discrete Cosine Transform. | |
Goel et al. | Image denoising by hybridizing preprocessed discrete wavelet transformation and recurrent neural networks | |
Du et al. | Handwriting Image Recognition Based on a GAN Model | |
CN115861663B (zh) | 一种基于自监督学习模型的文档图像内容比对方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110802 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110808 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |