JP2569151B2 - 文字サイズ抽出方法 - Google Patents

文字サイズ抽出方法

Info

Publication number
JP2569151B2
JP2569151B2 JP63252030A JP25203088A JP2569151B2 JP 2569151 B2 JP2569151 B2 JP 2569151B2 JP 63252030 A JP63252030 A JP 63252030A JP 25203088 A JP25203088 A JP 25203088A JP 2569151 B2 JP2569151 B2 JP 2569151B2
Authority
JP
Japan
Prior art keywords
character string
line
character
provisional
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63252030A
Other languages
English (en)
Other versions
JPH02100190A (ja
Inventor
一郎 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP63252030A priority Critical patent/JP2569151B2/ja
Publication of JPH02100190A publication Critical patent/JPH02100190A/ja
Application granted granted Critical
Publication of JP2569151B2 publication Critical patent/JP2569151B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、文字読取装置(OCR)等において文書画
像から自動的に基準文字サイズを抽出するための方法に
関する。
〔従来の技術〕
従来は文字サイズをマニユアルにて予め設定してお
き、これにより文書画像から文字を切り出すようにして
いるのが一般的である。
〔発明が解決しようとする課題〕
しかしながら、上述の如き方法では、文字サイズの異
なる文が混在する場合はそれぞれ領域を指定し、各領域
毎に文字サイズを指定してやらなければならず、そのた
めの作業が煩雑になると云う問題がある。また、文書ま
たは文字行(文書等)が傾いている場合のマニユアルに
よる文字サイズの指定は可成り困難である。
したがつて、この発明は文書等が傾いている場合、ま
たは文書中に見出し,本文,注釈などの文字サイズの互
いに異なる行が混在する場合でも、基準文字サイズを自
動的かつ正確に抽出できるようにすることを目的とす
る。
〔課題を解決するための手段〕
文書画像を短冊状に分割して得られる各領域内の投影
データから各文字列ブロツク(仮文字列)の幅,中心位
置情報をそれぞれ抽出し、これらの情報から仮文字列の
幅の平均値を各行毎に求め、さらに1行毎に両端の仮文
字列の中心位置座標の差に応じて行内文字列の傾きに応
じて幅平均値の補正を行ない、文字切出しのための基準
文字サイズを抽出する。
〔作用〕
仮文字列の情報から1行毎に基準文字サイズを自動的
に抽出するこ応とにより、文書等が傾いている場合また
は見出し,本文,注釈など互いに文字サイズの異なる行
が存在する場合でも、マニユアルにて文字サイズを指定
しなくても済むようにする。
〔実施例〕
第1図はこの発明の実施例を示すフローチヤート、第
2図は横書き文字画像の例を説明するための説明図であ
る。
まず、第2図の如き文書画像1をイメージスキヤナな
どの入力装置を介してメモリに取込む(参照)。しか
る後、文書画像を短冊状に等間隔に分割し、各領域内で
公知の投影演算をして仮文字列の幅,中心位置等を求め
る(,参照)。第2図の例では、2Aないし2Jが仮文
字列として取出される。この仮文字列の情報のうち、そ
の幅の平均値を行毎に求める(参照)。第2図の例で
は仮文字列2A,2B,2Cと2D,2E,2F,2Gと2H,2I,2Jの各行毎
に幅平均値が求められる。このとき、短冊領域が文字全
部で占められない仮文字列(例えば、第2図の2A,2C,2D
……等)は、文書が傾いている場合は他の仮文字列より
も幅が狭くなるため、仮文字列の幅のうち最小のもの
は、平均値をとる対象データからは除外することゝとす
る。
ところで、仮文字列の幅は文書等が傾いている場合は
実際の文字サイズよりも大きくなるので、単純に平均値
を求めるだけでは誤差が生じてしまう。そこで、この実
施例では1行毎に両端の仮文字列の中心座標の差D(ズ
レ:C1−C2)を求め(参照)、これを仮文字列に対す
る差D′に換算し(参照)、幅平均値MからこのD′
を引いたものを文字切出しのための基準文字サイズM′
とする(参照)。
すなわち、数式にて表現すると次式のようになる。
D′=D×l/L M′=M−D′ (但し、 D:行内両端の仮文字列の中心位置座標の差分, D′:Dを一つの仮文字列あたりに変換した差分, L:行の長さ, M:行内各仮文字列の幅の平均値, l:行内各仮文字列の長さの平均値) 第3図に仮文字列の各種情報を示す。なお、同図
(ロ)は(イ)における行内の平均的文字列の例示であ
る。同図の3A〜3Dは短冊領域を示し、C1は行の始めの仮
文字列の中心座標,C2は行の終りの仮文字列の中心座標
を示す。DはC1とC2の差であり、これは文書等の傾によ
り生じる。Lは行の長さ、Mは仮文字列の副平均値、
D′は仮文字列あたりに換算した差分、M′は傾きによ
る補正を施して得られる基準文字サイズ、lは仮文字列
の長さの平均値をそれぞれ示す。また、斜線部4は平均
的文字列の頭文字の部分を例示しており、この斜線部4
が文字切出しのための基準文字サイズM′となる。
〔発明の効果〕
本発明によれば、文書画像を短冊状に分割して仮文字
列情報を抽出し、これらの情報により1行毎に文字サイ
ズを抽出するようにしたので、文字サイズをマニユアル
にて指定する必要がなくなり、文字切出し操作が著しく
簡単となる利点がもたらされる。
【図面の簡単な説明】
第1図はこの発明の実施例を示すフローチヤート、第2
図は横書き文字画像の例を説明するための説明図、第2
図は仮文字列の各種情報を説明するための説明図であ
る。 符号説明 1……文書画像、2A〜2J……仮文字列、3A〜3D……短冊
領域、4……基準文字エリア。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文書画像を短冊状に分割して得られる各領
    域内の投影データから各文字列ブロック(仮文字列)の
    高さ(幅),中心位置情報をそれぞれ抽出した後、これ
    らの情報から1行毎に各仮文字列の幅および長さの平均
    値M,lをそれぞれ求め、行内文字列の傾きに応じて幅平
    均値Mの補正を次式により行い、 D′=D×l/L M′=M−D′ (但し、 D:行内両端の仮文字列の中心位置座標の差分, D′:Dを一つの仮文字列あたりに変換した差分, L:行の長さ, M:行内各仮文字列の幅の平均値, l:行内各仮文字列の長さの平均値) 文字切出しのための平均的文字列の基準文字サイズM′
    を1行毎に抽出することを特徴とする文字サイズ抽出方
    法。
JP63252030A 1988-10-07 1988-10-07 文字サイズ抽出方法 Expired - Lifetime JP2569151B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63252030A JP2569151B2 (ja) 1988-10-07 1988-10-07 文字サイズ抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63252030A JP2569151B2 (ja) 1988-10-07 1988-10-07 文字サイズ抽出方法

Publications (2)

Publication Number Publication Date
JPH02100190A JPH02100190A (ja) 1990-04-12
JP2569151B2 true JP2569151B2 (ja) 1997-01-08

Family

ID=17231607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63252030A Expired - Lifetime JP2569151B2 (ja) 1988-10-07 1988-10-07 文字サイズ抽出方法

Country Status (1)

Country Link
JP (1) JP2569151B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58146973A (ja) * 1982-02-25 1983-09-01 Ricoh Co Ltd 文字行および文字の切出し方法
JPS62169287A (ja) * 1986-01-22 1987-07-25 Toshiba Corp 記載文字形態判別方式
JPS62243082A (ja) * 1986-04-16 1987-10-23 Sharp Corp 読取り方式

Also Published As

Publication number Publication date
JPH02100190A (ja) 1990-04-12

Similar Documents

Publication Publication Date Title
WO2020192391A1 (zh) 基于ocr的图像转档方法、装置、设备及可读存储介质
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
JPH01112388A (ja) 文字認識処理方法
JP4869841B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP2000251082A (ja) 文書画像傾き検出装置
JP2569151B2 (ja) 文字サイズ抽出方法
JPH07160812A (ja) 画像処理装置及び方法
JP3604909B2 (ja) 画像間位置合わせ方法
JP2569134B2 (ja) 文字列抽出方法
JPS62121589A (ja) 文字切出し方法
JP2933947B2 (ja) 画像処理方法及び装置
JPS6054082A (ja) 光学文字読取装置
JP3122476B2 (ja) 自動文書清書装置
JPS63101983A (ja) 文字列抽出方式
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP2902694B2 (ja) 光学式文字読取装置
JP2931041B2 (ja) 表内文字認識方法
JPH04130979A (ja) 文字画像切出し方法
JPH0581477A (ja) 文字切出し方法
JP2619465B2 (ja) 文字認識における認識対象候補ブロックの作成方法
JP2844728B2 (ja) 文書読取装置
JPH08321942A (ja) 画像処理装置及び分割図面の画像接合方法
JPS59205679A (ja) 文字切出し装置
JPH11242716A (ja) 画像処理方法および記録媒体
JP3157534B2 (ja) 表認識方法