JP2007213520A - 文字パターン生成方法および文字認識方法 - Google Patents
文字パターン生成方法および文字認識方法 Download PDFInfo
- Publication number
- JP2007213520A JP2007213520A JP2006035700A JP2006035700A JP2007213520A JP 2007213520 A JP2007213520 A JP 2007213520A JP 2006035700 A JP2006035700 A JP 2006035700A JP 2006035700 A JP2006035700 A JP 2006035700A JP 2007213520 A JP2007213520 A JP 2007213520A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- character
- additional information
- area ratio
- character pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000009466 transformation Effects 0.000 claims description 50
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 8
- 238000000844 transformation Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】文字形状の好ましくは全部または一部の特徴部分を構成する第1パターンと第2パターンからなる文字パターンに当該文字パターンに係る情報を付与する方法が、第1パターンの面積に対する第2パターンの面積比を、付与する情報に固有の割合にすることを特徴とする付加情報付き文字パターンの生成方法。
【選択図】図1
Description
付加情報は、様々な幾何学的変換を受けても確実に抽出できることが要求される。幾何学的変換は、回転変換、ユークリッド変換、相似変換、アフィン変換、射影変換等に分類でき、後のものほど変換の自由度が高く変形が激しいと言える。
黄瀬浩一,大町真一郎,内田誠一,岩村雅一, "カメラを用いた文字認識・文書画像解析の現状と課題," 信学技報,PRMU2004-246,March 2005. D. Doermann, J. Liang and H. Li, "Progress in camera-based document image analysis," Proceedings of the Seventh International Conference on Document Analysis and Recognition (ICDAR 2003), pp.606-616, August 2003. 内田誠一, 岩村雅一, 大町真一郎, 黄瀬浩一, "カメラによる文字認識のための付加情報の埋め込みに関する検討," 画像の認識理解シンポジウム2005(MIRU2005)論文集,pp.235-242,July 2005. 岩村雅一, 内田誠一, 大町真一郎, 黄瀬浩一, "情報付加による認識率100%の実現 −人にも機械にも理解可能な情報伝達のために−," 画像の認識理解シンポジウム2005(MIRU2005)論文集,pp.901-908,July 2005. 佐藤 淳,"コンピュータビジョン −視覚の幾何学−," コロナ社,1999.
また、前記修飾パターンが、影のパターンであってもよい。さらに、付与する情報に応じて影の長さが設定されてもよい。あるいは、前記修飾パターンが、輪郭線であってもよい。さらに、付与する情報に応じて輪郭線の太さが設定されてもよい。文字に影を付加したり輪郭線を別の色とすることは文字パターンのデザインとしてすでに行われており、違和感を与えない。このようにすれば、文字パターンへの情報の付加は、影の長さや輪郭線の太さ、即ち、修飾部分の線幅を変えるにすぎない。したがって、自然な付加情報の埋め込みが可能となる。
あるいは、前記付加情報が、字種を識別するための値であって、各文字パターンに同じ太さの輪郭線を付加したときの前記面積比に基づいてその値が決定されてもよい。
ただし、前記付加情報の内容は字種に限定されるものではない。例えば、前記付加情報は、字種を表す代わりにフォントの種類を表す情報であってもよい。
また、この発明の文字認識方法は、抽出された第1パターンと第2パターンとの面積比を求め、求めた面積比から得られる付加情報を用いて文字を認識するので、読み取られた文字が幾何学的変換を受けていても正確に認識することができる。
1.1.埋め込み形態
この実施の形態では、文字パターンを単色ではなく2色を用いて印字し、それぞれの色の領域の面積比を特定の値とするようにパターンをデザインすることで情報を埋め込む。
文字パターンの生成方法を説明する前に、アフィン変換について簡単に説明する。アフィン変換は、一般に点(x,y)tを以下の式により点(x’,y’)tに写像するものである。なお、便宜上、この明細書にける座標の表記は、数式中においては縦ベクトルの表記とし、文中では横ベクトルに転置を表す「t」を付した表記とするが、両者は同じものを示している。
面積比を付加情報として埋め込んだ文字パターンを生成する方法の一例を述べる。まず、面積比を情報として埋め込むための基礎データを得るためのシミュレーション実験とその結果について述べる。そして、字種固有の面積比について述べ、実際に情報を埋め込んだ文字パターンを作成する。
発明者は、面積比を用いて付加情報を埋め込むことの有効性を確認するために以下の基礎的な検討を行った。以下に、得られた知見を説明する。まず、アフィン変換を施した場合に、量子化誤差により埋め込んだ値がどのように変化するかを調べるために、情報を埋め込んだ文字パターンにアフィン変換を施した結果得られる画像について面積比を計算した。
図3(b)〜(e)の変換はそれぞれ以下の行列で表せる。
結果を図4に示す。26字種すべての結果を表示するのは現実的ではないので、図4では、26字種の平均値、最大値、最小値を示してある。また、平均値よりも大きい値のみを母集団とした場合の標準偏差を平均値に加えた値を点線で、平均値よりも小さい値のみを母集団とした場合の標準偏差を平均値から引いた値を一点鎖線で示してある。
式(4)を用い、αを様々に変えた場合の誤差を図4(a)に示す。横軸がαを表す。図より、αが1から離れるに従って誤差が急激に増大していることが分かる。また、字種により誤差の値に大きく差があった。「S」や「O」など曲線から構成される字種は誤差が小さく、最大でも0.005程度であった。一方「I」「J」「L」のような直線部分を含む字種は誤差が大きかった。全字種の誤差を例えば0.02程度に収めるためには、0.5≦α≦2.0程度にする必要がある。
角度ψで画像を剪断変換した場合の結果を図4(b)に示す。横軸がψを表す。図から、僅かでも傾斜させると値が急激に増加するが、ψ=5°程度で頭打ちになることが分かる。この場合も、誤差が大きいのは「I」や「L」のような直線部分を含む字種であった。しかし、誤差は最大でも0.005程度であり、アスペクト比の変換と比較して影響が小さいことが分かる。
画像をθだけ回転させた場合の結果を図4(c)に示す。横軸がθを表す。僅かでも回転させると値が急激に増加するが、θ=5°程度で一旦頭打ちになる。そして、θ=45°付近で再び急激に増加する。しかし、最大でも0.01程度であり、やはりアスペクト比の変換と比較して回転変換の影響は小さいことが分かる。
画像をγ倍(γ≦1.0)に縮小させた場合の結果を図4(d)に示す。横軸がγを表す。γが小さくなると誤差が非常に大きくなる。これは、文字パターンの大きさの変化による量子化誤差の影響が非常に大きいことを表している。
前述したように、字種ごとにある程度固有の「自然な」面積比が存在すると考えられる。そこで、Arial,Arial Black,Helvetica,Times の4つのフォントについて、アルファベット大文字26字種について図1(a)の形態の埋め込みを行った場合の面積比について調べた。
以上の検討から、面積比を用いて付加情報を埋め込むことの有効性が確認された。
実際に様々なフォントを用い、アルファベット26文字のそれぞれに対して情報を埋め込んだ例を示す。自然な埋め込みを行うために、図5から、字種ごとに各フォントにおける面積比を平均し、平均値が小さい順にソートする。そして、その値が小さい順に、小さい値を情報として埋め込む。
また、項目2.1で求めた誤差の範囲を考慮する。すなわち、ソートされたi番目の文字に埋め込む値をνiとし、表2中の値(誤差の最大値を切り上げたもの)をeiとしたとき、
また、連続している2文字もしくは2つの連結成分(黒画素の塊)が埋め込んだ付加情報で区別可能であれば、高い精度で文字を分離することが可能である。したがって、「見た目は似ているが、区別できる量」を調整することが肝心である。
3.1. 文字認識アルゴリズム
この発明の有効性を確認するために、付加情報を埋め込んだ文字パターンを認識する実験を行った。認識させた文字パターンは図9のように、文字部分と影の部分からなる。ここでは図7に示す単純な文字認識アルゴリズムを用いた。まず、認識対象の文字パターンを正規化した後、全クラスの標準パターンとの類似度を計算した。それと同時に文字部分と影の部分との面積比を求めた。そして、求めた面積比から、文字パターンに埋め込まれた付加情報(埋め込み情報)を抽出した。最後に、計算した類似度と抽出された付加情報を組み合わせて字種の判別を行う。それぞれの処理については以下で述べる。
アフィン変換を受けた画像を扱うので、まず、画像を正規化する。正規化の手順は図8に示す。まず、文字パターンを表す画素を探す(図8(a)参照)。連結成分毎に重心を計算し、重心に最小二乗法を適用して、図8(b)中の直線を決定する。直線の回転角度θを求めて、画像を回転させることで画像の回転を補正する(図8(b)参照)。次に、連結成分の列毎に重心を決定する。そして、最小二乗法を全ての連結成分の重心に適用して、直線を検出する。誤差を最小化して求めた直線の傾き角度ψを用いて剪断変換を補正する(図8(c)参照)。
類似度基準としては正規化相互相関(Normalized cross correlation; NCC)を用いる。標準パターンは、事前に各クラスの文字パターンを平均して生成しておく。入力パターンと各クラスの標準パターンのNCCを計算する。認識による候補字種は、NCCを降順にソートして決める。
埋め込まれた付加情報は、文字パターンの領域と影の領域の面積比を計算することで抽出する。表2に示す付加情報と抽出した面積比との差をクラス毎に計算する。付加情報による候補字種は、前述の差を昇順にソートして決める。
認識結果と付加情報から最終結果を決定する。もし、補正処理によって回転角度θと傾き角度ψが正しく補正されており、かつ、パターンの変形をアフィン変換とみなすことができるのであれば、既存の文字認識手法で文字画像を認識することはそれほど難しくない。パターンが正しく認識されるとき、NCCは大きな値になると考えられるので、NCCがあらかじめ定めた閾値tより大きいときは類似度計算で得られた候補を最終結果とする。一方、NCCが閾値t以下ならば、類似度計算と付加情報から得られた2種類の候補順位を足し合わせたものを各クラスのスコアとする。すなわち、クラス“A”が類似度計算で3位、付加情報で2位だった場合、クラス“A”のスコアは5になる。スコアが最小のクラスを最終結果とする。実験ではt=0.6とした。
Arial、Arial Black、Helvetica、Timesの4つのフォントの大文字を実験に用いた。上記項目2.3で述べた方法で付加情報をパターンに埋め込んだ。文字パターンを赤色、影を黄色とした。
この発明に係る文字パターンを生成する文字パターン生成装置について説明する。図10は、この発明による文字パターン生成装置の構成例を示すブロック図である。図10に示すように、文字パターン生成装置は、文字入力部11、付加情報格納部13、付加情報取得部15および文字パターン生成部17から構成される。
この発明に係る文字認識装置について説明する。図11は、この発明による文字認識装置の構成例を示すブロック図である。図11に示すように、文字認識装置は、画像入力部31、形状抽出部33、付加情報算出部35、文字認識部37、認識結果出力部39から構成される。
2 正規化処理
3 類似度計算処理
4 付加情報(埋め込み情報)抽出処理
5 出力処理
Claims (16)
- 文字形状の好ましくは全部または一部の特徴部分を構成する第1パターンと第2パターンからなる文字パターンに当該文字パターンに係る情報を付与する方法が、
第1パターンの面積に対する第2パターンの面積比を、付与する情報に固有の割合にすることを特徴とする付加情報付き文字パターンの生成方法。 - 第1パターンが、文字の基本形状のパターンであり、第2パターンが、文字の修飾パターンである請求項1記載の文字パターン生成方法。
- 前記修飾パターンが、影のパターンである請求項2記載の文字パターン生成方法。
- 付与する情報に応じて影の長さが設定される請求項3記載の文字パターン生成方法。
- 前記修飾パターンが、輪郭線である請求項2記載の文字パターン生成方法。
- 付与する情報に応じて輪郭線の太さが設定される請求項5記載の文字パターン生成方法。
- 第1パターンと第2パターンとが、文字の基本形状を分割して得られる各部分のパターンである請求項1記載の文字パターン生成方法。
- 第1パターンと第2パターンとが、互いに異なる色のパターンである請求項1記載の文字パターン生成方法。
- 第1パターンと第2パターンとが、互いに異なる濃度のパターンである請求項1記載の文字パターン生成方法。
- 前記付加情報が、字種を識別するための値であって、各文字パターンに同じ長さの影を付加したときの前記面積比に基づいてその値が決定される請求項1記載の文字パターン生成方法。
- 前記付加情報が、字種を識別するための値であって、各文字パターンに同じ太さの輪郭線を付加したときの前記面積比に基づいてその値が決定される請求項1記載の文字パターン生成方法。
- 前記付加情報が、字種を識別するための値であって、各文字パターンがアフィン変換を受けたときの前記面積比の誤差を考慮してその値が決定される請求項1記載の文字パターン生成方法。
- 請求項1の方法により生成された文字パターンを読み取り、
読み取ったパターンから第1パターンと第2パターンとを抽出し、
抽出された第1パターンと第2パターンとの面積比を求め、
求めた面積比から付加情報を得、
得られた付加情報を用いて文字を認識する文字認識方法。 - 前記パターンの読み取りが、カメラによる撮影である請求項13記載の文字認識方法。
- 文字を入力する文字入力部と、
各文字に対する付加情報を格納する付加情報格納部と、
入力された文字に応じた付加情報を付加情報格納部から取得する付加情報取得部と、
付加情報に応じた面積比の第1パターンと第2パターンとを含む文字パターンを生成する文字パターン生成部とを備えることを特徴とする文字パターン生成装置。 - 請求項15記載の文字パターン生成装置により生成された文字パターンの画像を入力する画像入力部と、
入力された画像から第1パターンと第2パターンとを抽出する形状抽出部と、
抽出された第1パターンと第2パターンの面積比から付加情報を算出する付加情報算出部と、
算出された付加情報を用いて文字を認識する文字認識部と、
認識結果を出力する認識結果出力部とを備える文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006035700A JP4859027B2 (ja) | 2006-02-13 | 2006-02-13 | 文字パターン生成方法および文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006035700A JP4859027B2 (ja) | 2006-02-13 | 2006-02-13 | 文字パターン生成方法および文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007213520A true JP2007213520A (ja) | 2007-08-23 |
JP4859027B2 JP4859027B2 (ja) | 2012-01-18 |
Family
ID=38491864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006035700A Expired - Fee Related JP4859027B2 (ja) | 2006-02-13 | 2006-02-13 | 文字パターン生成方法および文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4859027B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH087043A (ja) * | 1994-06-20 | 1996-01-12 | Ricoh Co Ltd | オンライン手書き文字認識方法 |
-
2006
- 2006-02-13 JP JP2006035700A patent/JP4859027B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH087043A (ja) * | 1994-06-20 | 1996-01-12 | Ricoh Co Ltd | オンライン手書き文字認識方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4859027B2 (ja) | 2012-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
JP4777393B2 (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
EP1703444A2 (en) | Detecting an orientation of characters in a document image | |
JP4758461B2 (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
Supriana et al. | Arabic character recognition system development | |
JP6000992B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
Naz et al. | Challenges in baseline detection of Arabic script based languages | |
Suresh et al. | Telugu Optical Character Recognition Using Deep Learning | |
JP2011090578A (ja) | 画像処理装置、画像処理方法及びプログラム | |
Gunawan et al. | Russian character recognition using self-organizing map | |
Naz et al. | Arabic script based character segmentation: a review | |
JP6432179B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
JP4859027B2 (ja) | 文字パターン生成方法および文字認識方法 | |
Robertson | Optical character recognition for classical philology | |
JP6310155B2 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
CN113537216B (zh) | 一种点阵字体文本行倾斜校正方法及装置 | |
JP7382544B2 (ja) | 文字列認識装置及び文字列認識プログラム | |
CN109522892A (zh) | 神经网络辅助的文字图像信息标注方法 | |
KR20160053544A (ko) | 후보 문자의 추출 방법 | |
JP7065065B2 (ja) | 文字認識装置 | |
JP5224156B2 (ja) | 文字認識システムの学習文字サンプルの不足を補う方法 | |
JP5913763B1 (ja) | 基準線設定装置、基準線設定方法及び基準線設定プログラム | |
JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
Juan et al. | Font recognition by invariant moments of global textures | |
JP2803892B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110908 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111011 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111027 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |