JPH0388085A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH0388085A
JPH0388085A JP1225416A JP22541689A JPH0388085A JP H0388085 A JPH0388085 A JP H0388085A JP 1225416 A JP1225416 A JP 1225416A JP 22541689 A JP22541689 A JP 22541689A JP H0388085 A JPH0388085 A JP H0388085A
Authority
JP
Japan
Prior art keywords
character
pattern
attribute
character pattern
font
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1225416A
Other languages
English (en)
Inventor
Hiroyuki Harashima
原島 裕之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1225416A priority Critical patent/JPH0388085A/ja
Publication of JPH0388085A publication Critical patent/JPH0388085A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、帳票に記録された文字の文字パターンヲ検出
し、この文字パターンについての文字認識結果を表示す
る光学的文字読取装置に関する。
(従来の技術) 一般に、光学的文字読取装置においては、帳票を光学的
に走査することによって帳票イメージを検出し、この帳
票イメージから1文字毎に文字パターンを検出して文字
認識処理を行っている。
文字認識処理は、予め処理対象とする入力帳票の文字領
域の位置や認識する文字のサイズ、フォント等の属性を
示すフォーマット情報が与えられ、このフォーマット情
報に基づいて行われる。光学的文字読取装置は、フォー
マット情報に基づいて文字パターンの認識処理を行なう
ことによって帳票に記録された文字を認識し、この文字
を示すASCIIコードやJISコード等の文字コード
を出力する。そして、この文字コードに対応する文字を
、装置に固有なフォントによって表示する。
ところで、一般文書においては、文中の強調部分や見出
し等の用いられる部分によって、文字の文字サイズやフ
ォントが変えられたりしたものがある。従って、このよ
うな一般文書を扱うデスクトップパブリッシング(DT
P)等においては、文字データをもとに文書を編集、印
刷するために、文字のサイズ、フォント等の属性情報や
文字が位置する領域についての情報が不可欠となってい
る。
このような、DTPを行なうための文書入力に、光学的
文字読取装置を利用する場合がある。しかしながら、光
学的文字読取装置からは文字コードを得ることができる
が、文字に関する文字サイズ。
フォント等の属性情報を得ることができない。このため
、文字コードの入力とは別に、DTPの操作によって入
力帳票を参照しながら文字の属性情報を入力しなければ
ならない。
(課題を解決するための手段) このように、光学的文字読取装置によっては、文字の属
性を得ることができないために、DTPに用いる場合の
ように、属性情報のみを別に入力する必要があり、この
ための作業負担が大きいという問題があった。
本発明は前記のような点に鑑みてなされたもので、属性
情報のみを別に入力することなく、処理対象とする帳票
に記録された文字の位置5サイズ。
フォントを含む属性情報に応じて文字の表示を行なうこ
とが可能な光学的文字読取装置を提供することを目的と
する。
[発明の構成] (課題を解決するための手段) 本発明は、処理対象とする帳票を光学的に走査すること
によって帳票イメージを検出し、前記帳票イメージから
前記帳票に記録された文字の文字パターンを検出し、前
記文字パターンについての文字認識処理の結果を表示す
る光学的文字読取装置であって、文字パターンをもとに
帳票に記録された文字の位置、サイズ、フォントを含む
属性を識別し、この識別によって得られた属性を付加し
て文字パターンについての認識結果を表示するように構
成するものである。
(作 用) このような構成によれば、文字の属性を識別し、この属
性を付加して認識結果を表示するので、属性情報だけを
別に入力する必要なしに、DTP等によって編集、印刷
等を実行することができる。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる光学的文字読取装置の構成を示
すブロック図である。同図において、lOは走査部であ
り、文字読取り処理の対象とする入力帳票を光学的に走
査、光電変換を行なって帳票イメージを検出する。走査
部10には、光電変換されて得られた帳票イメージを格
納するための帳票イメージ格納部が接続されている。帳
票イメージ格納部20には、同格納部20に格納された
帳票イメージをもとに文字が記入された領域(文字領域
)のみを検出して、文字領域の座標位置を示す位置情報
を出力する文字領域検出部30が接続されている。文字
領域検出部30には、文字領域内の文字パターンを1文
字毎に検出して切出す文字切出し部40が接続されてい
る。文字切出し部40には、切出された文字パターンの
サイズ、フォント等の属性情報を識別するための属性識
別部50と、文字パターンをもとに文字認識処理を行な
う文字認識部60が接続されている。70は画像表示部
であり、文字領域検出部30、属性識別部50、及び文
字認識部60からの情報をもとに、文字読取り結果につ
いて表示を行なうものである。
次に、同実施例の動作を説明する。
まず、文字読取り処理の対象とする入力帳票は、走査部
10において光学的に走査され、帳票イメージが検出さ
れる。帳票イメージ格納部20は、走査部10によって
検出された例えば1帳票分の帳票イメージを格納する。
文字領域検出部30は、帳票イメージ格納部20を走査
して、図形やイラスト等の処理対象としない画像領域を
除いて、帳票イメージ中の文字が記入された部分(文字
領域)のみを検出する。文字領域検出部30は、検出し
た文字領域の位−置を示す座標情報を文字切出し部40
に出力する。文字切出し部40は、文字領域検出部30
によって検出された文字領域内のイメージから、文字パ
ターンを検出し、1文字毎に切出しを行なう。
また、文字切出し部40は、検出した文字パターンを属
性識別部50、及び文字認識部60に転送する。
さらに、属性識別部50には、文字パターンの他に、同
文字パターンの帳票イメージにおける位置(文字座標)
を転送する。属性識別部50は、切出された文字パター
ンをもとに、第2図に示すフローチャートに示す手順に
従って文字の属性を検出する。
ここでは、文字の属性として、文字のサイズ、フォント
(イタリック体、ボールド体)を検出するものとする。
まず、属性識別部50は、文字パターンから縦方向(H
)、横方向(W)のサイズを測定する(ステップSl)
。次に、1111定の結果得られた文字サイズをもとに
、文字パターンを上下に二分割し、上半分の文字パター
ンについての水平方向の重心(P XU)を測定して求
める(ステップS2)。同様にして、下半分の文字パタ
ーンの水平方向の重心(P XL)を測定して求める(
ステップS3)。ここで、文字パターンが、イタリック
体であるか否かの判別を行なう(ステップ84)。
ここでは、前記ステップによって得られた文字パターン
の上半分の重心(P XU)と下半分の重心(P XL
)を用イテ、”PXU>PXLXa’ ノ式により判別
を行なう。すなわち、文字パターンの上半分の重心(P
 XU)が、下半分の重心(P XL)より右側へしき
い値(α)より位置しているときにイタリック体と判別
するものである。
文字パターンがイタリック体と判別されなかった場合は
、文字パターンから水平方向の射影をとり、この射影か
ら水平線幅を測定して水平方向の平均線幅(LX )を
求める(ステップS5)。同様にして、垂直方向の射影
をとり、この射影から垂直線幅を測定して垂直方向の平
均線幅(LY )を求める(ステップS6)。ここで、
文字パターンが、ボールド体であるか否かの判別を行な
う。
ここでは、前記ステップによって得られた水平。
垂直方向の平均線幅(LX、LY)が、しきい値(β)
より大きいか否かによって判別を行なう。
すなわち、水平方向の平均線幅(LX )としきい値(
β)が“LX>β″の関係にあり(ステップS7)、か
つ垂直方向の平均線幅(LY )としきい値(β)が“
LY>β″の関係がある場合(ステップS8)に、文字
パターンは、ボールド体であると判別する。なお、ステ
ップS7またはステップS8において、条件を満たさな
い場合は、文字パターンを標準字体であると判別する。
このように、属性識別部50では、文字のフォントの特
徴に基づいて、字体(フォント)の判別を行なう。ここ
では、イタリック体とボールド体を検出するものとして
いるため、イタリック体については斜体であることから
文字パターンの上半分と下半分の重心の位置がずれてい
ることを利用して判別を行ない、ボールド体については
線幅が太いことを利用して判別を行なっている。なお、
ボールド体については、線幅が一定であることを利用し
て、両方向の平均線幅(LX、LY)を比較して判別す
るステップを加えても良い。
こうして、文字切出し部40によって切出された文字パ
ターンについての属性が検出されると、属性識別部50
は、文字パターンに関する文字座標。
縦横サイズ(H,W)、及び字体を示す属性情報を画像
表示部70に転送する。
一方、文字認識部60は、文字切出し部40によって切
出された文字パターンについて、正規化を行なった後、
文字認識処理を行なう。文字認識部60は、文字認識処
理の結果(文字コード)を、画像表示部70に出力する
画像表示部70は、文字領域検出部30、属性識別部5
0.及び文字認識部60からの情報をもとに文字読取り
結果について、第3図のフローチャートに示す処理に従
って表示を行なう。すなわち、入力帳票に記録された文
字の形態と同様にして表示を行なうためには、その形態
による文字パターンが必要となるが、通常、文字フォン
トに関するデータ量は膨大であることから標準文字パタ
ーンのみが例えばキャラクタジェネレータに格納され保
持されている。そこで、帳票に記入された文字が標準の
文字でない場合、画像表示部70は、文字認識部60か
らの認識結果によって指定されるキャラクタジェネレー
タに格納されている標準文字パターンについて、属性情
報に応じた処理を行なうことによって、表示に供される
文字パターンを生成するものである。
まず、属性識別部50から転送された属性情報中の縦横
サイズ(H,W)を示す情報をもとに、文字サイズの変
更が必要であるか否かを判別する(ステップAI)。こ
こで、縦横サイズ(H,W)が標準サイズを示すもので
ない場合は、縦横サイズ(H,W)に応じて標準文字パ
ターンの文字サイズを変更する(ステップA2)。次に
、字体(フォント)に関する情報によって指定される文
字パターンを生成する。ここで、文字パターンのフォン
トに関する属性情報がイタリック体を示す場合は(ステ
ップA3)、文字パターンについて傾き処理を行なう(
ステップA4)。傾き処理は、例えば第4図に示すよう
にして行なう。傾き処理前の文字パターンが(a)のよ
うな場合に(図は数字「1」のパターンを示している)
、(b)のように文字パターンの右側に白ドツトを付加
(パディング)する。そして、付加した白ドツトを左に
シフトして、(C)のように文字パターンに含まれるよ
うにする。こうして、傾き処理を行なうことによって、
イタリック体の文字パターンが生成される。
一方、文字パターンのフォントに関する属性情報がボー
ルド体を示す場合は(ステップA5)、文字パターンに
ついて太め処理を行なう(ステップA6)。太め処理は
、例えば3×3のマスクを用いて、文字パターンの文字
縁がマスクに設定された条件に合う場合に、所定のドツ
ト(マスクの中央)を白ドツトから黒ドツトにする。こ
れを、文字パターンの各方向から逐次繰り返して、線幅
が文字サイズに応じた所定の太さになるまで行なう。こ
うして、太め処理を行なうことによって、ボールド体の
文字パターンが生成される。
画像表示部70は、属性情報に応じて生成された文字パ
ターンを、文字領域検出部30から転送された文字の位
置を示す座標情報に対応する表示画面中の所定位置に表
示する。
なお、前記実施例においては、フォントの検出をイタリ
ック体、ボールド体の2種に限って行なうものとしたが
、フォント種はこれに限るものではなく、他のフォント
の検出を行なうようにしても良い。
[発明の効果] 以上のように本発明によれば、文字認識処理を行なうた
めに検出された文字パターンから、同文字パターンに関
する位置、サイズ、フォントを含む属性情報を検出する
ので、処理対象とする帳票に記録された文字に応じた表
示を行なうことが可能となる。このため、文字認識処理
とは別に、文字に関する属性情報のみを人力する必要が
なくなるので、作業負担を軽減し、DTP等における処
理効率を向上させることが可能となるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例における文
字の属性(フォント)を検出するための処理手順を示す
フローチャート、第3図は同実施例における文字パター
ンを表示するための処理の手順を示すフローチャート、
第4図は同実施例における傾き処理の一例を説明するた
めの図である。 IO・・・走査部、20・・・帳票イメージ格納部、3
0・・・文字領域検出部、40・・・文字切出し部、5
0・・・属性識別部、60・・・文字認識部、70・・
・画像表示部出願人代理人 弁理士 鈴江武彦 第 図 停 2図

Claims (1)

  1. 【特許請求の範囲】 処理対象とする帳票を光学的に走査することによって帳
    票イメージを検出し、前記帳票イメージから前記帳票に
    記録された文字の文字パターンを検出し、前記文字パタ
    ーンについての文字認識処理の結果を表示する光学的文
    字読取装置において、 前記文字パターンをもとに帳票に記録された文字の位置
    、サイズ、フォントを含む属性を識別する属性識別手段
    と、 前記文字パターンについての文字認識処理の結果を、前
    記属性識別手段によって識別された属性を付加して表示
    する表示手段と、 を具備したことを特徴とする光学的文字読取装置。
JP1225416A 1989-08-31 1989-08-31 光学的文字読取装置 Pending JPH0388085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1225416A JPH0388085A (ja) 1989-08-31 1989-08-31 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1225416A JPH0388085A (ja) 1989-08-31 1989-08-31 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH0388085A true JPH0388085A (ja) 1991-04-12

Family

ID=16829029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1225416A Pending JPH0388085A (ja) 1989-08-31 1989-08-31 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH0388085A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176188A (ja) * 1992-12-03 1994-06-24 Ibm Japan Ltd 認識文字の情報作成方法及び装置
JP2010003320A (ja) * 2009-10-06 2010-01-07 Seiko Epson Corp 文字列の読み易さの判定方法、判定装置、判定プログラム
JP2014039176A (ja) * 2012-08-16 2014-02-27 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体
EP2927843A1 (en) * 2014-03-31 2015-10-07 Kyocera Document Solutions Inc. An image forming apparatus and system, and an image forming method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176188A (ja) * 1992-12-03 1994-06-24 Ibm Japan Ltd 認識文字の情報作成方法及び装置
JP2010003320A (ja) * 2009-10-06 2010-01-07 Seiko Epson Corp 文字列の読み易さの判定方法、判定装置、判定プログラム
JP2014039176A (ja) * 2012-08-16 2014-02-27 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体
EP2927843A1 (en) * 2014-03-31 2015-10-07 Kyocera Document Solutions Inc. An image forming apparatus and system, and an image forming method

Similar Documents

Publication Publication Date Title
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US5974199A (en) Method for scanning and detecting multiple photographs and removing edge artifacts
US7035463B1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
US6411733B1 (en) Method and apparatus for separating document image object types
JP4443576B2 (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
CN111126266B (zh) 文本处理方法、文本处理系统、设备及介质
US7149352B2 (en) Image processing device, program product and system
US5271067A (en) Optical character recognition apparatus
JPH0388085A (ja) 光学的文字読取装置
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
JPH0916582A (ja) 文書作成装置及び同装置に用いられる認識結果出力方法
JP3019897B2 (ja) 行切出し方法
JPH03103996A (ja) 光学的文字読取装置
JPH0252329A (ja) 画像情報記録・読取方法
JP2978801B2 (ja) 手書き文字認識の文字入力方式
JP2001126025A (ja) Ocr用フォーマットパラメータ作成方法
JP2925270B2 (ja) 文字読取装置
JPH05174179A (ja) 文書画像処理装置
JPH0728934A (ja) 文書画像処理装置
JPS62231389A (ja) 文字認識装置
JP2001109826A (ja) 帳票処理装置及び帳票処理方法及びコンピュータ読み取り可能な記憶媒体