JPH04241074A - 自動文書清書装置 - Google Patents

自動文書清書装置

Info

Publication number
JPH04241074A
JPH04241074A JP9123691A JP2369191A JPH04241074A JP H04241074 A JPH04241074 A JP H04241074A JP 9123691 A JP9123691 A JP 9123691A JP 2369191 A JP2369191 A JP 2369191A JP H04241074 A JPH04241074 A JP H04241074A
Authority
JP
Japan
Prior art keywords
character
line
handwritten
characters
scaling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9123691A
Other languages
English (en)
Other versions
JP3122476B2 (ja
Inventor
Yoshiyuki Namitsuka
義幸 波塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP03023691A priority Critical patent/JP3122476B2/ja
Publication of JPH04241074A publication Critical patent/JPH04241074A/ja
Application granted granted Critical
Publication of JP3122476B2 publication Critical patent/JP3122476B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書を自動的に清書す
る自動文書清書装置に関する。
【0003】
【従来の技術】従来、この種の文書清書装置は、特開平
2−127775号公報や特開平2−127776号公
報に示すように、文書上の画像データ表示領域の縦サイ
ズや横サイズと画像データの縦サイズや横サイズにより
、表示領域に欠ける部分が発生しないように、かつ画像
データの縦横比が1対1になるように演算するように構
成されている。したがって、この文書清書装置は、操作
者が画像データ表示領域の縦サイズや横サイズ等の清書
用データを入力すると、表示領域に欠ける部分が発生し
ないように、かつ画像データの縦横比が1対1になるよ
うに演算して文字列を清書することができる。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の文書清書装置では、画像データ表示領域の縦サイズ
や横サイズにより演算するので、これらの清書用データ
を操作者が入力しなければならず、また、手書き文字の
文書を自動的に清書することができないという問題点が
ある。
【0005】本発明は上記従来の問題点に鑑み、操作者
がなんら清書用データを入力することなく手書き文字の
文書を自動的に清書することができる自動文書清書装置
を提供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、第1の手段は、手書き文字列を光学的に読み取る読
み取り手段と、前記読み取り手段により読み取られた手
書き文字列を検索して1行毎に検索する抽出手段と、前
記検索手段により抽出された各行の手書き文字列を文字
毎に切り出す切り出し手段と、前記切り出し手段により
切り出された各手書き文字の大きさを判別する判別手段
と、前記判別手段により判別された各文字が適正な大き
さになるように縦横の長さを変倍する変倍手段と、前記
検索手段により抽出された各行の手書き文字列の間隔が
適正になるように、前記変倍手段により変倍された各文
字を配列する配列手段と、前記配列手段により配列され
た各行の文字列を出力する出力手段とを備えたことを特
徴とする。
【0007】第2の手段は、第1の発明の変倍手段が前
記判別手段により判別された各文字の線分要素を判別し
てベクトル化し、このベクトル化された線分要素を変倍
することを特徴とする。
【0008】第3の手段は、第2の発明の判別手段が前
記切り出し手段により切り出された各手書き文字を辞書
パターンとのマッチングにより認識し、辞書パターンの
文字フォントを参照してフォントデータの輪郭線をベク
トル化することを特徴とする。
【0009】
【作用】第1の手段は上記構成により、手書き文字列が
1行毎に抽出され、各行の手書き文字列が文字毎に分離
され、各文字の大きさが判別されて適正な大きさになる
ように縦横の長さが変倍され、各行の手書き文字列の間
隔が適正になるように配置される。したがって、操作者
がなんら清書用データを入力することなく手書き文字の
文書を自動的に清書することができる。
【0010】第2の手段は、各文字の線分要素がベクト
ル化され、このベクトル化された線分要素が変倍される
ので、筆記者が意図した筆跡で清書される。
【0011】第3の手段は、手書き文字が辞書パターン
とのマッチングにより認識され、辞書パターンのフォン
トデータがベクトル化される。したがって、このベクト
ル化された線分要素が変倍されるので、手書き文字を辞
書パターンの文字フォントに清書することができる。
【0012】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1は本発明に係る自動文書清書装置の一実施例
を示すブロック図、図2は図1の自動文書清書装置によ
り読み取られる手書き原稿とそのヒストグラムを示す説
明図、図3は図1の文字行検索部により抽出された行イ
メージを示す説明図、図4は図1の文字領域切り出し部
により切り出された文字を示す説明図、図5は図4の文
字の構成要素を示す説明図、図6は図1の文字構成要素
検出部の動作を説明するためのフローチャート、図7は
図1の文字領域サイズ変更部及び位置補正部の動作を説
明するためのフローチャート、図8は図1の文字領域サ
イズ変更部の変倍動作を示す説明図、図9は図1の文字
領域サイズ変更部により変倍される前後のベクトルデー
タを示す説明図、図10は図1の文書画像整形、再構成
部の動作を示す説明図である。
【0013】図1において、手書き原稿等の画像は読み
取り部1により光学的に読み取られて電気信号に変換さ
れ、この電気信号はA/D変換部2によりディジタル信
号に変換され、メモリ3に記憶される。図2の左方は手
書き原稿Pの一例を示し、この手書き原稿Pは、横書き
された手書き文字13と写真等の矩形画像14を有する
。図2の右方は、手書き原稿Pの手書き文字13と矩形
画像14が横方向に累積されたヒストグラム15を示し
、矩形の写真画像14におけるヒストグラム15は、一
様に加算されるものとみなされるので、手書き文字13
との切れ目が保存される。
【0014】図1に示す文字行検索部4は、メモリ3に
格納された画像データによりヒストグラム15の累積度
数が縦方向に極端に変化する点を判別して文字行の切り
出し点とみなし、行イメージを抽出する。図3上段は文
字行検索部4により抽出された行イメージ17を示し、
この行イメージ17は、横書きされた各文字領域16を
有する。図3下段は各文字領域16の黒画素が縦方向に
累積されたヒストグラム18を示す。
【0015】図1に示す文字領域切り出し部5は、この
ヒストグラム18の累積度数が横方向に極端に変化する
点を判別して各文字領域16を判別し、次いで、各文字
領域16から上下方向の余白を除去することにより文字
部の位置と縦横の長さを算出する。図4は文字領域切り
出し部5により切り出された文字「あ」を示し、この文
字は、文字領域16の左下隅のx座標Xsと、右上隅の
y座標Ysと、横の長さx lengthと、縦の長さ
y length等を有する。図5はこの文字「あ」の
文字構成要素を示し、各文字構成要素は複数の画素25
から成り、また、ストロークの端点23とベクトル24
により表現される。
【0016】図1に示す文字構成要素検出部6は図6に
示すように、この複数の画素25から成る現在の処理対
象の文字画像を細線化し(ステップ19)、次いで、そ
の文字画像線幅をサンプリングし、平均線幅を算出する
(ステップ20)。次いで、文字構成要素検出部6は、
文字のストロークの端点23を検出し(ステップ21)
、この端点23とストロークの交点によりベクトル24
を算出することにより文字画像をベクトル化し(ステッ
プ22)、文字領域16の位置、サイズ、ベクトルデー
タをデータ格納部7に格納する。
【0017】図1に示す文字領域のサイズ変更部8は図
7に示すように、先ず、切り出した文字の高さを複数の
カテゴリに分類する(ステップ26)。すなわち、例え
ば見出しのように比較的大きい文字と、文章の普通の大
きさの文字と、文章の文字であって促音「っ」のように
比較的小さい文字等のカテゴリに分類する。次いで、各
カテゴリを代表する文字の平均の高さを算出し、この平
均の高さと各文字の高さを比較することにより各文字が
そのカテゴリに属するかを判定し、各文字をそのカテゴ
リの平均の高さに変倍する(ステップ27)。すなわち
、例えば図8に示すように、切り出した文字32の高さ
y lengthとそのカテゴリの平均の高さy av
e により高さy ave の文字34に変倍する。次
いで、サイズ変更部8は図7及び図8に示すように、そ
の文字の縦横の比を比較し(ステップ28)、縦方向の
変倍率と同一の比率で横方向の長さx lengthを
長さx reformに変倍する(ステップ29)。尚
、この横方向の長さx reformは式(1)により
求めることができる。     x reform=(x length/y 
length)*y ave ・・・(1)
【0018
】尚、図9に示すように文字「あ」のベクトルデータの
始点と終点は、変倍前の画像領域39、変倍後の画像領
域40内のアドレスにより示される。したがって、変倍
前の切り出し文字領域39の縦方向と横方向の各変倍率
によりベクトルの縦横の各方向の変位量を算出し、また
、この切り出し領域39の位置補正に応じてベクトルの
位置アドレスを同様に補正し、文字の各ストロークを変
倍することにより変倍後の文字領域40の各ストローク
を求めることができる。
【0019】次いで、図1に示す文字領域の位置補正部
9は、図7に示すように各文字間の横方向のブランクの
平均の長さを算出し(ステップ30)、切り出し領域内
の各文字が適切な位置になるように、かつ変倍前と変倍
後において一行の文字数が同一になるようにブランクを
利用して補正する(ステップ31)。尚、この補正は、
変倍後の各領域の横の平均の長さx reformを集
計し、切り出した行イメージ17の長さからこの合計値
を減算することより、行イメージ17内で存在可能なブ
ランク長を算出し、このブランク長を文字数により割り
算することにより各文字領域間の平均ブランク長を算出
することにより行う。
【0020】次いで、図1に示す文書画像整形、再構成
部10は、図10に示すように縦方向が一致しない文字
列の下が所定の間隔のライン35に一致するような文字
列36に再構成する。尚、横方向の文字間の距離37は
、位置補正部9により算出された平均ブランク長である
。このように補正された画像データはメモリ11に一旦
格納され、出力部12によりプリント等されて出力され
る。
【0021】したがって、上記実施例によれば、文字行
検索部4により手書き文字列を行毎に切り出し、文字領
域切り出し部5により各行の手書き文字列の各文字を切
り出し、文字構成要素検出部6により各文字の線分要素
を検出し、サイズ変更部8により各文字の大きさを判別
して適正な大きさになるように縦横の長さ38を変倍し
、位置補正部9により文字列の横方向の間隔が一定にな
るように各文字の横方向の位置を補正し、再構成部10
により各行の文字列の間隔が一定になるように補正する
ので、操作者がなんら清書用データを入力することなく
手書き文字の文書を自動的に清書することができる。
【0022】この場合、一行に含まれる文字数は同数で
あり、また、意識的な大きさで手書きされた文字がその
大きさに応じた比率で変倍されるので、筆記者が意図す
るレイアウトで出力される。また、手書き文字の線分を
ベクトル化するので、文字のかすれ、切れ、ノイズの付
加などを防止することができ、更に、筆記者の筆跡を保
持することができる。
【0023】図11は、本発明に係る自動文書清書装置
の第2の実施例における文字構成要素検出部61の動作
を説明するためのフローチャート、図12はその変倍動
作を示す説明図である。図11において、文字構成要素
検出部61は、第1の実施例における文字領域切り出し
部5により切り出された各文字を辞書パターンとのマッ
チングと、文字構成要素による構造解析や文章内の文字
の意味解析等により認識する(ステップ41)。次いで
、辞書パターンの文字フォントを参照してフォントデー
タの輪郭線をベクトル化する(ステップ42)。したが
って、図12に示すようにサイズ変更部9が辞書パター
ンのフォントデータ43を拡大すると、活字体のような
文字44が出力されるので、手書き文字列を完全に清書
することができる。
【0024】
【発明の効果】以上説明したように、請求項1記載の発
明は、手書き文字列を光学的に読み取る読み取り手段と
、前記読み取り手段により読み取られた手書き文字列を
検索して1行毎に検索する抽出手段と、前記検索手段に
より抽出された各行の手書き文字列を文字毎に切り出す
切り出し手段と、前記切り出し手段により切り出された
各手書き文字の大きさを判別する判別手段と、前記判別
手段により判別された各文字が適正な大きさになるよう
に縦横の長さを変倍する変倍手段と、前記検索手段によ
り抽出された各行の手書き文字列の間隔が適正になるよ
うに、前記変倍手段により変倍された各文字を配列する
配列手段と、前記配列手段により配列された各行の文字
列を出力する出力手段とを備えたので、操作者がなんら
清書用データを入力することなく手書き文字の文書を自
動的に清書することができる。
【0025】請求項2記載の発明は、各手書き文字の線
分要素を判別してベクトル化し、このベクトル化された
線分要素を変倍するので、筆記者が意図した筆跡で清書
することができる。
【0026】請求項3の発明は、各手書き文字を辞書パ
ターンとのマッチングにより認識  し、辞書パターン
の文字フォントを参照してフォントデータの輪郭線をベ
クトル化するので、手書き文字を辞書パターンの文字フ
ォントに清書することができる。
【図面の簡単な説明】
【図1】本発明に係る自動文書清書装置の一実施例を示
すブロック図である。
【図2】図1の自動文書清書装置により読み取られる手
書き原稿とそのヒストグラムを示す説明図である。
【図3】図1の文字行検索部により抽出された行イメー
ジを示す説明図である。
【図4】図1の文字領域切り出し部により切り出された
文字を示す説明図である。
【図5】図4の文字の構成要素を示す説明図である。
【図6】図1の文字構成要素検出部の動作を説明するた
めのフローチャートである。
【図7】図1の文字領域サイズ変更部及び位置補正部の
動作を説明するためのフロー  チャートである。
【図8】図1の文字領域サイズ変更部の変倍動作を示す
説明図である。
【図9】図1の文字領域サイズ変更部により変倍される
前後のベクトルデータを示す説明図である。
【図10】図1の文書画像整形、再構成部の動作を示す
説明図である。
【図11】本発明に係る自動文書清書装置の第2の実施
例における文字構成要素検出部の動作を説明するための
フローチャートである。
【図12】その変倍動作を示す説明図である。
【符号の説明】
1  読み取り部 4  文字行検索部 5  文字領域切り出し部 6  文字構成要素検出部 8  サイズ変更部 9  位置補正部 10  文書画像整形、再構成部 12  出力部 61  文字構成要素検出部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】  手書き文字列を光学的に読み取る読み
    取り手段と、前記読み取り手段により読み取られた手書
    き文字列を検索して1行毎に検索する抽出手段と、前記
    検索手段により抽出された各行の手書き文字列を文字毎
    に切り出す切り出し手段と、前記切り出し手段により切
    り出された各手書き文字の大きさを判別する判別手段と
    、前記判別手段により判別された各文字が適正な大きさ
    になるように縦横の長さを変倍する変倍手段と、前記検
    索手段により抽出された各行の手書き文字列の間隔が適
    正になるように、前記変倍手段により変倍された各文字
    を配列する配列手段と、前記配列手段により配列された
    各行の文字列を出力する出力手段と、を備えた自動文書
    清書装置。
  2. 【請求項2】  前記変倍手段は、前記判別手段により
    判別された各文字の線分要素を判別してベクトル化し、
    このベクトル化された線分要素を変倍することを特徴と
    する請求項1記載の自動文書清書装置。
  3. 【請求項3】  前記判別手段は、前記切り出し手段に
    より切り出された各手書き文字を辞書パターンとのマッ
    チングにより認識し、辞書パターンの文字フォントを参
    照してフォントデータの輪郭線をベクトル化することを
    特徴とする請求項1記載の自動文書清書装置。
JP03023691A 1991-01-25 1991-01-25 自動文書清書装置 Expired - Fee Related JP3122476B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03023691A JP3122476B2 (ja) 1991-01-25 1991-01-25 自動文書清書装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03023691A JP3122476B2 (ja) 1991-01-25 1991-01-25 自動文書清書装置

Publications (2)

Publication Number Publication Date
JPH04241074A true JPH04241074A (ja) 1992-08-28
JP3122476B2 JP3122476B2 (ja) 2001-01-09

Family

ID=12117455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03023691A Expired - Fee Related JP3122476B2 (ja) 1991-01-25 1991-01-25 自動文書清書装置

Country Status (1)

Country Link
JP (1) JP3122476B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317762B1 (en) 1995-11-22 2001-11-13 Fujitsu Limited Document creating apparatus creates free format document from handwritten data converting into normalized size
JP2013063618A (ja) * 2011-09-20 2013-04-11 Casio Computer Co Ltd 印字装置、印字方法、及びプログラム
JP2015014846A (ja) * 2013-07-03 2015-01-22 日本電信電話株式会社 文字認識装置、方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317762B1 (en) 1995-11-22 2001-11-13 Fujitsu Limited Document creating apparatus creates free format document from handwritten data converting into normalized size
JP2009015860A (ja) * 1995-11-22 2009-01-22 Fujitsu Ltd 文書作成装置及び記憶媒体
JP2013063618A (ja) * 2011-09-20 2013-04-11 Casio Computer Co Ltd 印字装置、印字方法、及びプログラム
JP2015014846A (ja) * 2013-07-03 2015-01-22 日本電信電話株式会社 文字認識装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP3122476B2 (ja) 2001-01-09

Similar Documents

Publication Publication Date Title
US6754385B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
CN111814722A (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JPH03122773A (ja) 画像形成装置
JP3411472B2 (ja) パターン抽出装置
JP3285686B2 (ja) 領域分割方法
JPH04241074A (ja) 自動文書清書装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2000090194A (ja) 画像処理方法および画像処理装置
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP2581809B2 (ja) 文字切出し装置
JPH0728935A (ja) 文書画像処理装置
JP2576350B2 (ja) 文字列抽出装置
JPH05174185A (ja) 日本語文字認識装置
JPH04130979A (ja) 文字画像切出し方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH0950488A (ja) 異サイズ混在文字列の読取り方法
JP2671533B2 (ja) 文字列認識方法及びその装置
JP2708604B2 (ja) 文字認識方法
JPH0728934A (ja) 文書画像処理装置
JP3334369B2 (ja) 選択項目認識装置
Messelodi et al. Detection of polygonal frames in complex document images
JPH0632074B2 (ja) 正規化方法
Rait et al. Automatic Language-Independent Indexing of Documents Using Image Processing
JPH0620096A (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071020

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081020

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081020

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091020

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees