JPS5838063A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPS5838063A
JPS5838063A JP56136481A JP13648181A JPS5838063A JP S5838063 A JPS5838063 A JP S5838063A JP 56136481 A JP56136481 A JP 56136481A JP 13648181 A JP13648181 A JP 13648181A JP S5838063 A JPS5838063 A JP S5838063A
Authority
JP
Japan
Prior art keywords
character
type
scanning density
document
scanning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56136481A
Other languages
English (en)
Inventor
Akira Sakurai
彰 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP56136481A priority Critical patent/JPS5838063A/ja
Publication of JPS5838063A publication Critical patent/JPS5838063A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、文書画像を処理する装置に関し、更に詳細に
は文書画像を伝送したり、あるいは蓄積する操作を伴な
う文書画像処理装置に関する。
文書画像を処理する装置として、例えばファクシミリ装
置では、送信データ量を可能な限シ圧縮して送信するの
が、経済性の面でも送信時間の面でも有利である。そこ
で、文書画像中の文字のサイズに応じて走査密度を切り
替える技術が提案されている。しかしこの技術では、文
字サイズの小さい文書画像を扱う場合における走査密度
の最適化が容易でなかった。帽囁5字文字と1手ll走
文字の混在した文書画像の場合、活字文字を基準にして
走査密度を決めると伝送効率が悪くなり、逆に手書き文
字を基準に走査密度を決めると活字文字の再現性が不十
分に々る等の問題があった。
本発輿の目的は、上記のような欠点を解消した文書画像
処理装置を提供することにある。
この目的を達成するために、本発明にあっては、特定の
走査密度で文書を走査して得られた文書画像信号から、
行単位または文字単位で字種および活字と手書きの別を
識別する。そして、文書画像信号を上記の識別結果に応
じた走査密度に変換して出力する。
なお本発明にあっても、文字サイズの変動幅が大きい場
合には、上記の識別結果のほかに、文字サイズも走査密
度を決定するファクターの1つとして加えるのが望まし
いことは当然でちる。
つぎに、本発明の一実施例について図面に沿って詳細に
説明する。
第1図は本発明にかかる文書画像処理装置の概略ブロッ
ク図である◎ 図示しないスキャナによシ一定の走査密度で走査して得
た文書画像信号は、行切出装置10に入力される。行切
出装置10は文書画像信号から文字1行を切シ出し、文
字行画像信号を文字切出装置11および走査密度変換装
置16へ送出する。打切出回路10からはまた、文字行
と文字行との間(行間゛)をスキップするだめのスキッ
プ情報信号が走査密度変換装置16へ供給される。
上記の文字行の切出しは公知の技術で容易に行なうこと
ができる。例えば、文書画像の主走査ライン毎の黒画素
を計数し、所定数以上の黒画素のある主走査ラインを文
字行のラインと判定し、このようなラインの連続を1つ
の文字行として切シ出す。したがって、行切出装置10
についてはこれ以上説明しない。
文字切出装置11¥i、切夛出された各文字行画像信号
から個々の文字画像を切シ出す。この文字切出しは、副
走査方向の黒画素の分布を観測する等の全知の方法で容
易に行なうことができる。したがって、文字切出装置1
1についてはこれ以上説明しない。
文字サイズ検出装置14は、文字切出装置11’によっ
て切り出された各文字の高さく縦方向サイズ)を検出し
、文字サイズ情報として走査密度決定装置15へ供給す
る。
字種識別装置12は切シ出された個々の文字の字種を識
別する。ここでは、仮名、英字、数字のような単純な字
種(字種A)と、漢字のような複雑な字種(字種B)の
2字種に識別するものとする。一方、活字/手書き識別
装置13は、文字切出装置13で切シ出された各文字が
活字文字であるか手書き文字であるか識別する。両装置
の識別結果はそれぞれ走査密度決定装置15へ送られる
走査密度決定回路16は、字種、活字/手書きの別、文
字の高さによって、走査密度変換装置16から出力され
る文書画像信号の走査密度を決定する。文書画像を読み
取るスキャナの走査密度をM本/−とすると、走査密度
は例えば次のような値に決める。
字種Aの活字の場合:Mx40/H(本/m)字種Aの
手書きの場合: Mx3Q/M (本/W1)字種Bの
活字の場合fMxzo/H(本/m)字種Bの手書きの
場合: Mx157H(本/1m)ここでHは文字の高
さくドツト数)である。したがって、M=8.、H−6
0の字種Bの活字文字の場合の走査密度は、8X40/
60=5本/−に決定される。
なお、文字の高さ、字種が異なる文字や、活字文字と手
書き文字が混在する場合、走査密度の切シ替え単位内で
上記のようにして算定した最大の走査密度に決定する。
例えば行単位で走査密度を切シ替えるのであれば、1行
中の各文字について算定した走査密度の中で最大の走査
密度に決定する。
走査密度変換装置16は、行切出装置10よシ送られる
文字行画像信号を走査密度決定装置15で決定された走
査密度に変換し、伝送装置17へ送る。また、スキ、f
情報信号にしたがって、伝送袋fi17のスキップ制御
を行なう。走査密度変換装置16および伝送装置17は
それぞれ公知の技術で実現できるので、詳細は省略する
つぎに為字種識別装置12と活字/手書き識別装置13
の具体例を第2図によって説明する。
字種識別装置12は、ストローク抽出回路121と判定
回路122から成る。ストローク抽出回路121は、切
シ出された各文字のストロークを抽出してその本数を求
めるものである。ストローク抽出に関しては公知技術が
種々存在し、いずれの技術によってもよい。本例では、
文字を側線化してから端点と交点を検出し、端点間、交
点間、端点と交点の間をそれぞれストロークとして抽出
す。
る構成である。ただし、これに限定されるものではない
。このような回路は、ハードウェアまたはハードウェア
とマイクログログ2ミングによって容易に実現できる。
判定回路122は1ストロ一ク抽出回路121で求めら
れた各文字のス)cy−り数nを閾−値t0と比較し、
nくtoなら字種Aと判定し、n≧1゜なら字種Bと判
定する。閾値t。は例えば14に選ばれる。
活字/手書き識別回路13は、ノクラメータ計算回路1
31と判定回路132から成る。/母うメータ計算回路
131は、活字文字と手書き文字の差を反映するパラメ
ータを各文字について計算する回路である。本例では、
上記のパラメータとして文字の縦横比P1、白画素率P
4、直画素率P5の3つが求められる。これらのパラメ
ータについては後述する。
判定回路132は、ノぐラメータP1yP4*Piの値
および判定回路122の判定結果(字種)に基づいて、
以下のような手順で活字/手書きの判定を行なう。
まず、字種Aど判定された文字については、白画素率P
4を閾値t1 と比較し、P4≧t1なら手書き文字と
判定し、そうでなければ活字文字と判定する。
字種Bと判定された文字については、まず白画素率P4
を閾値t2と比較する。P4≧1.ならば手書き文字と
判定し、判定を終了する。そうでなければ縦横比P、を
閾値Z 3  + 14と比較する。
P、≦t3またはp、≧t4ならば手書き文字と判定し
、判定を終了する。そうでなければ、直画素率P5を閾
値L5と比較する。P、≦L5ならば手書きと判定し、
P s > As ならば活字と判定し、判定を終了す
る。閾値t、〜t5は、例えばA、=45.12 =3
5.13 =90.14−1201ts=、45に選ば
れる。
ここで、ノぐラメータpt  #P4  #P5は次の
ように定義される。
縦横比P1 :文字に外接する方形の縦方向サイズと横
方向サイズの比である。
白画素率P4:注目する境界画素を中心とする3×3画
素領域を観察し、注目境界画素Xに第3図(イ)のよう
に境界画素が隣接するか、あるいはこれを45°ずつ回
転した第3図(ロ)〜(イ)のように境界画素が隣接す
るとき、注目境界画素Xを曲り画素と判定する。なお、
第3図(イ)〜(ト)において、斜線の画素は境界画素
を示し、白地の画素は非境界画素(白画素も含む)を示
す。また境界画素とは、文字を構成する黒画素のうちで
、上、下、左〜右のいずれかに白画素が隣接する黒画素
のことである。しかして、1つの文字中の全境界画素に
占める曲シ画素の割合が白画素率である。換言すれば、
境界画素の間近曲率cl第4図のように定義したとき、
C−3の境界画素の割合を示す指標が白画素率である。
直画素率P5 :局折曲率Cが4(第4図)のノやター
ンで配列する境界画素を直画素と判定する。
そして、1文字中の全境界画素に占める直画素の割合が
直画素率である。なお、C=4のIJ?ターンとしては
、第4図に示すものを45°ずつ回転した計8個の・そ
ター/を含む◎ ただし、前記の判定回路132では、パラメータPI 
 v p、l p5として上記の定義にしたがって算出
される値の100倍した値を用いている。
以上一実施例について説明したが、本発明はこれに限定
されるものではなく、本発明の要旨を逸脱しない範囲で
種々の変形態様が許される。
例えば、活字/手書き識別装置は、文字行上の文字の配
列ピッチや高さのバラツキから、行単位で活字/手書き
識別を行なう様な構成とすることもできる。また字種識
別装置は、電子通信学会研究資料「漢字・母ターンの大
分類」の2乃至9頁に述べられている雑音指数(文字の
縦方向と横方向の線の密度で定義される)等から字種を
識別するように構成することもできる。
本発明は以上に詳述した如く、字種、活字/手書きの別
、さらには文字サイズにしたがって文書画像の走査密度
を制御するため、前述した従来技術におけるような問題
のない文書画像処理装置を提供できる効果がある。
【図面の簡単な説明】
第1図は本発明による文書画像処理装置の一例を示す概
略プロ、り図、第2図は第1図中の字種識別装置と活字
/手書き識別装置の構成例を説明するためのブロック図
、第3図および第4図は活字/手書き識別に用いられる
・ぐラメータを説明するための図である。 10・・・行切出装置、11・・・文字切出装置、12
・・・字種識別装置、13・・・活字/手書き識別装置
、14・・・文字サイズ検出装置、15・・・走査密度
決定装置、16・・・走査密度変換装置、17・・・伝
送装置121・・・ストローク抽出回路、122,13
2・・・判定回路、131・・・パラメータ計算回路。 第1図 第2図 2 第S α 第4 C−I       C= リ       (へ)        ())(冷)
C−=4

Claims (1)

    【特許請求の範囲】
  1. 1、特定の走査密度で文書を走査して得られた文書画像
    信号から、行単位または文字単位で字種お〜よび活m熔
    走%t!文字の別を識別する第1の手段と、該文書画像
    信号を該第1の手段による識別結果にしたがって決まる
    走査密度の文書画像信号に変換して出力する第2の手段
    とを具備することを特徴とする文書画像処理装置。
JP56136481A 1981-08-31 1981-08-31 文書画像処理装置 Pending JPS5838063A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56136481A JPS5838063A (ja) 1981-08-31 1981-08-31 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56136481A JPS5838063A (ja) 1981-08-31 1981-08-31 文書画像処理装置

Publications (1)

Publication Number Publication Date
JPS5838063A true JPS5838063A (ja) 1983-03-05

Family

ID=15176141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56136481A Pending JPS5838063A (ja) 1981-08-31 1981-08-31 文書画像処理装置

Country Status (1)

Country Link
JP (1) JPS5838063A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62251887A (ja) * 1986-04-24 1987-11-02 Hitachi Ltd 文字認識・図形処理装置
US6795210B1 (en) * 2000-03-30 2004-09-21 Kabushiki Kaisha Toshiba Image reading apparatus

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62251887A (ja) * 1986-04-24 1987-11-02 Hitachi Ltd 文字認識・図形処理装置
US6795210B1 (en) * 2000-03-30 2004-09-21 Kabushiki Kaisha Toshiba Image reading apparatus
US6967732B2 (en) 2000-03-30 2005-11-22 Kabushiki Kaisha Toshiba Image reading apparatus

Similar Documents

Publication Publication Date Title
EP0081767B1 (en) Character and image processing apparatus
EP0564201B1 (en) Image processing apparatus and method
US5016118A (en) Image determining method and apparatus
EP0472313B1 (en) Image processing method and apparatus therefor
US6839151B1 (en) System and method for color copy image processing
EP0349234A2 (en) Image processing system
US10477063B2 (en) Character detection and binarization
US7133559B2 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
JP2000175051A (ja) デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法
JPH02502419A (ja) イメージ識別
US6289122B1 (en) Intelligent detection of text on a page
US5553162A (en) Method for detecting ink jet or dot matrix printing
JPS5838063A (ja) 文書画像処理装置
JP2020067959A (ja) 画像処理装置、その制御方法及びプログラム
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
US7039558B2 (en) Charge process upon effecting predetermined process by using plural data processing apparatus, and data processing apparatus used therefor
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
KR910007327A (ko) 화소 정보 처리 방법, 장치, 시스템 및 팩시밀리 시스템, 데이터 처리 시스템
JPH08305835A (ja) 画像処理装置およびその方法
JPH02253383A (ja) 画像処理装置
JP3382254B2 (ja) 画像処理装置
JP3210378B2 (ja) 画像入力装置
JPH03125569A (ja) 画像2値化装置
JPH03153167A (ja) 文字領域分離方式