JP4004189B2 - 文字切り出し方法 - Google Patents

文字切り出し方法 Download PDF

Info

Publication number
JP4004189B2
JP4004189B2 JP21737499A JP21737499A JP4004189B2 JP 4004189 B2 JP4004189 B2 JP 4004189B2 JP 21737499 A JP21737499 A JP 21737499A JP 21737499 A JP21737499 A JP 21737499A JP 4004189 B2 JP4004189 B2 JP 4004189B2
Authority
JP
Japan
Prior art keywords
character
width
standard
circumscribed rectangle
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21737499A
Other languages
English (en)
Other versions
JP2001043314A (ja
Inventor
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP21737499A priority Critical patent/JP4004189B2/ja
Publication of JP2001043314A publication Critical patent/JP2001043314A/ja
Application granted granted Critical
Publication of JP4004189B2 publication Critical patent/JP4004189B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、光学的文字読取装置などのように、文字や図形などの画像を読み取る画像読取装置の文字切り出し方法に関する。
【0002】
【従来の技術】
従来技術において、光学的文字読取装置などにより、日本語の文字を認識するための文字切り出し方法として、例えば、特開平9−297817号公報に開示された方法がある。この公報のものは、変倍文字識別部が、矩形の縦横比を基に変倍文字を識別し、全矩形数に対して変倍文字の割合が半数を超えたとき、変倍文字からなる行であると判断してメモリに格納し、文字塊生成部がそのメモリを参照し、変倍文字行に対しては、変倍率に応じた補正を行って矩形から文字魂を生成して文字塊メモリに格納し、文字パターン生成部は、文字塊から1文字と見なせるものを組み合わせて文字パターンを生成して文字認識部で認識するようにしたもので、変倍文字や平体文字が含まれる文書においても、適切に文字の切り出しを行うことができるようにするというものである。
【0003】
また、図6は、従来技術による文字切り出し方法の一例を説明するための図で、まず、「同一文字サイズ行の抽出」を行ない(S11)、次に、同一文字サイズ行内の文字矩形(文字塊)の幅のヒストグラムを作成し(S12)、ヒストグラムの度数に所定の係数を掛けるなどの「ヒストグラムの補正」を行い(S13)、補正後のヒストグラムを対象にその度数の最大値を求め(S14)、その値が所定の閾値を超えた場合(S15のYES)、標準文字サイズの変更を行ない(S16)、越えない場合は(S15のNO)、例えば、上記特開平9−297817号公報などの従来通りの標準文字サイズの算出方法を使用する(S17)という方法である。
【0004】
【発明が解決しようとする課題】
しかしながら、上記特開平9−297817号公報に開示されている方法では、変倍率が、新聞などの文字を対象に、それらの文字を若干変倍した文字に固定されているため、この変倍率をもとに算出された標準文字幅を基準に文字切り出し処理を行っても、半角文字には対応できなかった。
【0005】
また、図6に示した方法では、行内矩形幅のヒストグラムを求める際に用いる「同一文字サイズ行」の決定方法が明記されておらず、さらに、標準文字サイズは、作成したヒストグラムの度数が最大となる値を用いて決定するため、1行内に平仮名,カタカナなどの漢字より若干小さめの文字が多い場合などには、正しく設定されないという問題があった。
【0006】
本発明は、上述のような実情を考慮してなされたもので、新聞などの文字のように縦横比が1ではなく若干扁平した文字や、半角カタカナのように縦横比が1ではない文字の文字切り出しを行うために、同一の文字サイズ行を決定し、同一文字サイズ行内の黒画素の連結成分を包含する外接矩形(行内矩形)の矩形幅のヒストグラムをもとに、標準文字サイズを決定して文字切り出し処理を行うことにより、縦横比が1ではない文字でも正しく切り出すことを可能とし、また、ヒストグラムの補正を行うことにより、より精度の高い文字切り出し方法を提供することを目的としてなされたものである。
【0007】
【課題を解決するための手段】
請求項1の発明は、対象原稿の行画像から黒画素の連結成分を包含する外接矩形を抽出し、同一文字サイズ行内の外接矩形の幅のヒストグラム情報から標準文字幅を決定し、該決定した標準文字幅を用いて外接矩形を組み合わせて文字塊を生成し、該各文字塊から生成した文字パターンの候補を切り出す文字切り出し方式において、前記外接矩形の幅と該外接矩形の隣りの外接矩形との間の距離の和に対するヒストグラムを作成し、該ヒストグラムの度数が最大となる値を標準文字幅とし、現在処理している次の外接矩形のサイズと位置が行内の上部付近に比較的小さな矩形サイズで存在する場合は、濁点あるいは半濁点である可能性があるとして、標準文字幅を一時的に広げ、該標準文字幅を用いて外接矩形を組み合わせて文字塊を生成し、該各文字塊から生成した文字パターンの候補を切り出すことを特徴とするものである。
【0015】
【発明の実施の形態】
図1は、本発明による文字切り出し方法において適用される標準文字サイズの設定方法を説明するためのフローチャートである。
まず、対象原稿が半角原稿か全角原稿かを判断し(S1)、対象原稿が半角原稿であれば、行内に含まれる文字塊の高さの中で最大のものを用いてフォントサイズを判定し、このフォントサイズを用いて同一のサイズ行を抽出する(S2)。抽出した行内の各文字の外接矩形幅及び外接矩形間の距離に対するヒストグラムを作成し(S3)、そのヒストグラムに対して所定の補正を行なった(S4)後、ヒストグラムの最大値を求める(S5)。
【0016】
その最大値に対する上記距離の直前直後にある上記距離に対する度数の和が所定の閾値を超えない場合(S6のNO)は、従来の方法による標準文字サイズを使用(S10)し、所定の閾値を超える場合(S6のYES)は、標準文字サイズを変更する(S7)。その変更した標準文字サイズが所定の値より大きい場合(S8のNO)は、新しい標準文字サイズを使用し(S9)、小さい場合(S8のYES)は、従来の方法による標準文字サイズを使用する(S10)。ステップS1において、対象原稿が全角原稿の場合は、従来の方法による標準文字サイズを使用する(S10)。
【0017】
2は、本発明による文字切り出し方法の一実施例を説明するための図で、図中、1は対象原稿、2は対象フィールドである。図2(A)に示したように、対象原稿1は、タイトルや見出し部分は大きめのフォントで印刷され、本文は小さめのフォントで印刷されていることが多い。
【0019】
3は、文字切り出し方法を説明するための図で、図3(A)は切り出す矩形を説明するための図、図3(B)はヒストグラムの補正を説明するための図で、図中、3は切り出された行、4は矩形サイズが小さいためにヒストグラムに登録されない矩形、5はヒストグラムに登録される矩形である。
【0020】
同一行高さの行内矩形幅のヒストグラムは、行内に“漢字”や“ひらがな”などが混在していた場合、一般的に、“漢字”よりフォントサイズが若干小さい“ひらがな”などと、“漢字”との2つのピークが出現することになる。行内に“ひらがな”などが多い場合は、“ひらがな”のピークが最高となってしまい、これが標準文字幅として選ばれることになる。この“ひらがな”が標準文字幅として選ばれると、“ひらがな”よりも若干フォントサイズが大きい“漢字”は、正しく切り出せなくなってしまう。
【0021】
そこで、行内矩形の最大文字高さを中心として、そこに近いものが標準文字幅として選ばれやすくなるように、図3(B)に示したように、ヒストグラムの度数の補正を行うために、オリジナルのヒストグラムに所定の係数を掛けるようにる。
【0022】
内の外接矩形の大きさは、文字の種類(漢字,カナ,記号)などによってばらつきが多いが、外接矩形の幅は、定ピッチで印刷されている行の場合、比較的安定していることが多い。そこで、外接矩形の幅と矩形間のピッチ(距離)との和のヒストグラムを作成し、そのヒストグラムから標準文字幅を決めることにより、より安定して標準文字幅の算出が可能となるようにる。
【0023】
4は、文字切り出し方法を説明するための図で、図4(A)は本発明によるパス選択処理を説明するための図、図4(B),図4(C)は従来のパス選択処理を説明するための図で、図中、6aは半角カタカナ、6bは濁点や半濁点、Hは最大文字高さ、Weは本発明による検索範囲が拡大されたパス、Wsは標準文字幅である。
【0024】
従来は、図4(B)に示したように、行内矩形の最も大きな文字高さHを基準に標準文字サイズを決め、この標準文字サイズをもとに、1文字となる可能性のパス(組み合わせ)を発生させ、パス選択処理でどの組み合わせが最適かを選択していた。すなわち、行内矩形の最大文字高さHを基準に、標準文字幅Wsを設定し、標準文字幅Wsより小さい矩形はパス選択処理で判断していた。しかし、従来方式で求めた標準文字幅Wsでは、図4(C)に示したように、半角カタカナ6aの濁点や半濁点6bが1文字とならずに分離してしまう(問題1)、あるいは、不要なパスが発生する(問題2)などの悪影響があった。
【0025】
これは、全角文字の場合、一般的に濁点や半濁点のみが単独の文字として、扱われる(例えば、「ば」が「は」「゛」となる)ことは少なく、1文字のサイズ内で収まる一方、半角カタカナ6aの場合、一般的に濁点や半濁点6bは1文字として扱われることが多いためで、パターン辞書には、濁点や半濁点6bを1文字として取り扱っていないので、これが誤認識の原因となっていた。
【0026】
これを解決するために、図4(A)に示したように、濁点や半濁点6bを含む文字であると判断された場合は、パスを発生させるための探索範囲を拡大するために、標準文字幅Wsを広げる必要がある。
【0027】
そこで、発明は、現在処理している次の矩形(右側の矩形)サイズと位置が、濁点や半濁点6bのように、行内の上部付近に比較的小さな矩形サイズで存在する場合は、濁点や半濁点6bである可能性があるとして、標準文字幅Wsを一時的に変更してパスを発生させる(We)ようにる。すなわち、標準文字幅Wsを、行内矩形幅や矩形ピッチから統計的に算出することにより、不要なパスの発生(上記問題2)を防ぐとともに、濁点や半濁点6bと思われる矩形の場合のみ、標準文字幅Wsを越えてパスを発生させることによって濁点や半濁点6bが分離すること(上記問題1)を防ぐようにる。
【0031】
5は、文字切り出し方法を説明するための図で、図5(A)は本発明による文字切り出し方法をソフトウェアによって実現する場合の構成図、図5(B)は本発明による文字切り出し方法をネットワークを介して実現する場合の構成図で、図中、11はCPU、12はメモリ、13は通信装置、14は表示装置、15はハードディスク、16はキーボード、17はCD−ROMドライブ、18はFDドライブ、21はインターネットなどの通信回線、22は装置である。
【0032】
発明は、図5に示したように、本発明による文字切り出し方法を、ソフトウエアによって実現するか(図5(A))、機能の一部をネットワーク上に持って、通信回線などを通して実現する(図5(B))ようにしたものである。
【0033】
【発明の効果】
以上に説明したように、発明によれば、同一文字サイズ行の矩形幅の出現度数を示すヒストグラムを作成してそのピーク値から標準文字幅を決定し、決定した標準文字幅を用いて文字塊を生成するため、任意の縦横比で作成された文字を正確に切り出すことが可能となる。また、矩形幅の出現頻度を示すヒストグラムを補正して、漢字を示す矩形幅のピーク値を算出することにより、文字の認識率を高めることができる。
【図面の簡単な説明】
【図1】 本発明による文字切り出し方法において適用される標準文字サイズの設定方法を説明するためのフローチャートである。
【図2】字切り出し方法を説明するための図である。
【図3】字切り出し方法を説明するための図である。
【図4】字切り出し方法を説明するための図である。
【図5】字切り出し方法を説明するための図である。
【図6】 従来技術による文字切り出し方法の一例を説明するためのフローチャートである。
【符号の説明】
1…対象原稿、2…対象フィールド、3…切り出された行、4…登録されない矩形、5…登録される矩形、6a…半角カタカナ、6b…濁点や半濁点、H…最大文字高さ、We…検索範囲が拡大されたパス、Ws…標準文字幅、11…CPU、12メモリ、13…通信装置、14…表示装置、15…ハードディスク、16…キーボード、17…CD−ROMドライブ、18…FDドライブ、21…通信回線、22…装置。

Claims (1)

  1. 対象原稿の行画像から黒画素の連結成分を包含する外接矩形を抽出し、同一文字サイズ行内の外接矩形の幅のヒストグラム情報から標準文字幅を決定し、該決定した標準文字幅を用いて外接矩形を組み合わせて文字塊を生成し、該各文字塊から生成した文字パターンの候補を切り出す文字切り出し方式において、前記外接矩形の幅と該外接矩形の隣りの外接矩形との間の距離の和に対するヒストグラムを作成し、該ヒストグラムの度数が最大となる値を標準文字幅とし、現在処理している次の外接矩形のサイズと位置が行内の上部付近に比較的小さな矩形サイズで存在する場合は、濁点あるいは半濁点である可能性があるとして、標準文字幅を一時的に広げ、該標準文字幅を用いて外接矩形を組み合わせて文字塊を生成し、該各文字塊から生成した文字パターンの候補を切り出すことを特徴とする文字切り出し方法。
JP21737499A 1999-07-30 1999-07-30 文字切り出し方法 Expired - Fee Related JP4004189B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21737499A JP4004189B2 (ja) 1999-07-30 1999-07-30 文字切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21737499A JP4004189B2 (ja) 1999-07-30 1999-07-30 文字切り出し方法

Publications (2)

Publication Number Publication Date
JP2001043314A JP2001043314A (ja) 2001-02-16
JP4004189B2 true JP4004189B2 (ja) 2007-11-07

Family

ID=16703180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21737499A Expired - Fee Related JP4004189B2 (ja) 1999-07-30 1999-07-30 文字切り出し方法

Country Status (1)

Country Link
JP (1) JP4004189B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4600491B2 (ja) 2008-02-26 2010-12-15 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP6046982B2 (ja) * 2011-11-08 2016-12-21 キヤノン株式会社 文字幅を判定する方法及び装置、文字集合を分割する装置、及びコンピュータプログラム

Also Published As

Publication number Publication date
JP2001043314A (ja) 2001-02-16

Similar Documents

Publication Publication Date Title
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
Kise et al. Segmentation of page images using the area Voronoi diagram
JP5508359B2 (ja) 文字認識装置、文字認識方法及びプログラム
US7796817B2 (en) Character recognition method, character recognition device, and computer product
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
JP4004189B2 (ja) 文字切り出し方法
US7130085B2 (en) Half-tone dot elimination method and system thereof
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2000040122A (ja) 文字切り出し方法
JPH05282493A (ja) 英文字認識装置
JPH09274645A (ja) 文字認識方法および装置
JP3565310B2 (ja) 一般の文書画像から罫線を抽出する罫線抽出装置および方法
JP3420853B2 (ja) 文字切り出し方法
JP2612383B2 (ja) 文字認識処理方式
JP2985243B2 (ja) 文字認識方法
JP2000082113A (ja) 文字認識装置および辞書作成方法および記録媒体
JPH0417086A (ja) 文字切り出し方法
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体
JP3595081B2 (ja) 文字認識方法
JP3116452B2 (ja) 英文字認識装置
JP3243389B2 (ja) 文書識別方法
JP3116453B2 (ja) 英文字認識装置
JP2922949B2 (ja) 文字認識の後処理方法
JP2000187704A (ja) 文字認識装置及びその方法及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040616

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070821

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070821

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120831

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120831

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130831

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees