JPH07121734A - 文字画像編集装置 - Google Patents

文字画像編集装置

Info

Publication number
JPH07121734A
JPH07121734A JP5285567A JP28556793A JPH07121734A JP H07121734 A JPH07121734 A JP H07121734A JP 5285567 A JP5285567 A JP 5285567A JP 28556793 A JP28556793 A JP 28556793A JP H07121734 A JPH07121734 A JP H07121734A
Authority
JP
Japan
Prior art keywords
image
character
line
image data
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5285567A
Other languages
English (en)
Inventor
Makoto Shibayama
誠 柴山
Tomoyuki Goto
知之 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP5285567A priority Critical patent/JPH07121734A/ja
Publication of JPH07121734A publication Critical patent/JPH07121734A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 文字画像データを、画像のまま簡単な処理を
するだけで含まれる文字の情報が自然な形で異なるフォ
ーマットへ変換することのできる文字画像編集装置を提
供する。 【構成】この文字画像編集装置は、編集対象領域および
編集後の領域を指定する編集対象指定手段3と、指定さ
れた編集対象領域の画像データを切り出す画像切出し手
段4と、前記切り出した領域における文字画像データの
各行を分割し、分割した各行を1つの行に連結する行分
割手段5と、その行分割手段により得られた連結された
文字画像データを、指定された編集後の画像領域の幅に
あわせて、かつ文字の切れめの位置で、分割し、前記指
定された編集後の画像領域に配列する文字列画像配列手
段7とを備えたものである。

Description

【発明の詳細な説明】
【0001】
【産業上利用分野】本発明は、文字を含む画像(イメー
ジ)を文字を中心として画像のまま編集することのでき
る文字画像編集装置に関し、特に編集後の領域幅等に合
わせて文字列画像を編集するものに関する。
【0002】
【従来の技術】紙で与えられた情報を電子情報の形式で
ファイルするための従来の技術としては、イメージスキ
ャナ等で原稿を読み取り、そのまま画像データ(イメー
ジデータ)として保管する方法や、画像データを文字認
識(OCR)の技術を用いてコード化しコードデータと
して保管する方法がある。コード化されていない画像デ
ータの場合、一部分を取り出して表示するときに、必ず
しも入力時と同じフォーマットで表示できるという保証
はない。表示の時に元の画像データとフォーマットが変
わる場合、画像として拡大/縮小など適宜に変形するす
ることは勿論可能であるが、画像における文字列を考慮
に入れた編集ではないので、文字が不自然な形に変形さ
れたり、不揃いになったりして、それでは読み手にとっ
て読みにくい情報になってしまう。他方、文字認識装置
により文字画像をコード化する方法では、フォーマット
の編集は容易に行うことができるが、高価な文字認識装
置が必要であり問題である。
【0003】これを解決する手段として、予め画像とし
て1文字ずつ切り出しておき、編集後の文字サイズ、行
間、文字間および段落が不自然にならないように、それ
らの切り出した文字を再配置するという方法が提案され
ている(例えば、特開平5−81401号公報)。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来技術では、1文字ずつ切り出して、レイアウトの変換
を行うので、繁雑な処理を必要とし、処理時間も多く要
するという問題がある。そこで、本発明は、文字画像デ
ータを、画像のまま簡単な処理をするだけで含まれる文
字の情報が自然な形で異なるフォーマットへ変換するこ
とのできる文字画像編集装置を提供することを目的とす
るものである。
【0005】
【課題を解決するための手段】本発明の文字画像編集装
置は、編集対象領域および編集後の領域を指定する編集
対象指定手段(図1の3)と、指定された編集対象領域
の画像データを切り出す画像切出し手段(図1の4)
と、前記切り出した領域における文字画像データの各行
を分割し、分割した各行を1つの行に連結する行分割手
段(図1の5)と、前記行分割手段により得られた連結
された文字画像データを、指定された編集後の画像領域
の幅にあわせて、かつ文字の切れめの位置で、分割し、
前記指定された編集後の画像領域に配列する文字列画像
配列手段(図1の7)とを備えたものである。
【0006】
【作用】編集対象領域および編集後の領域は編集対象指
定手段により指定される。その指定は、オペレータの入
力装置による指示であっても、あるいは入力される文書
が一定のフォーマットのものである場合には、どの領域
を指定するかは予め決めておくことができるので、指定
情報を予めファイルやデータベースに登録しておき、そ
れを取り出して用いるようにしてもよい。指定された編
集対象領域が、入力された文書画像から、画像切出し手
段により切り出される。行分割手段は、その切り出され
た編集対象領域内にある文字画像データの行の切れ目を
検出し、その検出した切れ目により編集対象領域の画像
データを分割し、分割した各領域の画像データを直列に
連結して1行の文字列画像データとする。文字列画像配
列手段は行分割手段により生成された1行の文字列画像
を先頭から編集後の領域のほぽ幅毎に順次分割する。そ
の際、分割する位置が文字と文字の間に来るようにする
ため、文字列の切れ目を検出して、分割位置を決定す
る。そして、そのように分割した文字列画像をならべ
て、行を折り返した形の編集後の領域の文字画像を得
る。本発明によれば、文字画像を文字単位で切り出すの
ではなく、行単位で切出し、それを一旦1つの行に連結
した後、それを所定の幅毎にきりのよい位置で分割し
て、それを再配列するようにしたので、編集処理が簡単
で、高速な文字画像編集装置を得ることができる。ま
た、領域の幅を拡大または縮小したときに、元の画像を
そのまま拡大縮小するのではなく、文字列の長さを幅に
合わせて調節することになるので、より自然な領域の幅
の変換を行うことができる。さらに、本発明によれば、
画像データのまま取り扱うので、コード化できない情報
も扱うことができ、コード化のための辞書等を持つ必要
もなく、コード化による間違いも起こすことがない。
【0007】
【実施例】図1は実施例の文字画像編集装置の構成を示
すものである。この装置は、文書原稿を画像データとし
てとして入力するイメージスキャナ等の画像入力手段1
と、入力された画像データあるいは処理の中間結果や最
終結果の画像データを記憶する画像メモリ2と、編集対
象領域および編集後の領域を指定する編集対象指定手段
3と、指定された編集対象領域の画像データを切り出す
画像切出し手段4と、その切り出した領域の画像データ
における文字列の行の切れ目を検出し、その切れ目で画
像データを分割し、分割した各行の画像データを1つの
行に連結して連結行画像データを形成する行分割手段5
と、その行分割手段5により得られた連結行文字画像デ
ータを、指定された編集後の画像領域の幅にあわせて、
かつ文字の切れめの位置で、分割し、前記指定された編
集後の画像領域に配列する文字列画像配列手段7と、そ
の分割処理の中間の結果を保持する文字列画像バッファ
6を備えている。なお、画像入力手段1は文書原稿から
読み取る外に、予めアプリケーションプログラム(図示
しない文書、画像編集手段)によって作成され、ファイ
ルとして保存された画像データを読み込むものであって
もよい。
【0008】次に以上のように構成された本実施例の動
作について図2、図3、図4、図5を用いて説明する。
図2は本実施例の全体の概略の処理を示すものである。
その概略は、編集対象の領域の画像データの切出しを行
い(ステップS21)、その領域内にある文字画像の行
の切れ目を検出し(ステップS22)、その切れ目によ
り行に分割し、次に分割した行の画像を連結して1行に
変換する(ステップS23)。その1行にされた文字画
像の行を指定された幅に納まる長さ毎に文字列の切れ目
で切り分ける(ステップS24)。そして分けられた行
を2次元的に再配列する(ステップS25)。
【0009】図3は図2のステップS21〜S23の詳
細な処理フロー示すものである。まず、画像切出し手段
4は、イメージスキャナ等の画像読み取り装置等によっ
て画像メモリ2に読み込まれた文書の画像データから、
編集対象指定手段3によつて指定されている領域の画像
画像データの切出しを行う(ステップS31、図5の
(a))。指定されている領域の位置情報については、
オペレータの操作により指定する。あるいは文書が定型
のフォーマットのものである場合には、どの領域を指定
するかは予め決めておくことができるので、指定情報を
予めファイルに書き込んでおきそれを読み出して用いた
り、データベースに登録しておき、それを問合せて指定
情報を得るように構成しても良い。切り出した画像のス
キューの有無を調べ(ステップS32)、スキューがあ
ればそれを補正する(ステップS33)。
【0010】この文字画像データが横書きで書かれてい
るものである場合は、まず、行分割手段5は、画像切出
し手段により切り出された対象の画像データ領域を図5
(b)の矢印で示す縦方向に走査して同図の太線で示す
各横方向のドットの数を調べ、そのドットの数の縦方向
の分布を求める(ステップS34、)。縦書きの文書の
場合には、像データ領域を横方向に走査して各縦方向の
ドットの数を調べ、そのドットの数の横方向の分布を求
める。このようにして求めたドットの分布から、行間で
はドットの数が0に近いので、行の切れ目を判別するこ
とができる(ステップS35)。その際、明らかに余分
な空白は取り除く。そして、そのように判別した行の切
れ目で分割する(ステップS36)。分割された各行の
余分な空白(例えば、行の途中で改行がなされている場
合の改行以降の空白部分)を除去して実質的な文字画像
部分を得て(ステップS37)、これらを連結して図5
(c)に示すように1行の文字画像データとする(ステ
ップS38)。なお、連結された文字画像データは文字
列が長くなる場合には、必ずしも物理的に連結されてい
る必要はなく、仮想的(論理的)に1行の文字列として
扱うことが可能であればよい。
【0011】図4は文字列画像配列手段7の処理である
図2のステップS24〜S25の詳細な処理フローを示
すものである。文字列画像配列手段7による文字列幅の
変更(拡大/縮小)はステップS38で得られた連結さ
れた文字列を基に行う。まず、編集対象指定手段3から
転記先の領域(編集後の領域)の画像のサイズ即ちその
領域の幅および高さを獲得する(ステップS41)。そ
の転記先の画像サイズの幅をステップS38の処理にお
いて連結された文字列幅と比較して、短いか否か即ち折
り返す必要があるか否かを判定する(ステップS4
2)。転記先の文字列幅が前記連結された文字列の幅よ
りも長い場合は、変更作業は行なわず、転記先の画像の
幅の範囲に連結された文字列画像データをそのまま配置
する(ステップS48)。
【0012】図5(d)に示すように、転記先の文字列
幅がこの連結された文字列幅よりも短い場合は、その転
記先の文字列幅の位置から連結された文字列画像データ
を図5(e)の矢印で示すように先頭方向に向って、ス
キャンを行い、同図(e)の太線で示す方向のドットの
数を調べその横方向ドットの分布を調べ、最初の文字列
の切れ目を判断する(ステップS43)。切れ目はドッ
トが空白の部分によってわかるが、1つの漢字でも例え
ば「川」のように空白によって別れるものがある。漢字
文字列における文字と文字との間隔が比較的大きい場合
には空白の大きさに閾値を設けることにより文字列の切
れ目は比較的正確に求めることができるが、文字間の間
隔が小さい場合には、別な判定基準を付加する必要があ
る。例えば、文字の高さに比べて文字幅が小さいときに
は切れ目としないというような基準が必要となる。
【0013】転記先の文字列幅に収まる範囲で文字列の
切れ目が見つかると、そこで画像を分割する(ステップ
S44)。分割した文字列画像を文字列画像バッファ6
のあるアドレスに入れ(ステップS45)、残りの文字
列画像を別のアドレスに入れる(ステップS46)。別
アドレスのバッファ位置に入れた文字列画像データの幅
を調べ(ステップS47)、ステップS42へ戻り、前
記別アドレスのバッファ位置の文字列画像データについ
てさらに折り返す必要があるか否かをを判定し、折り返
す必要があると判定したときは、ステップS43〜S4
7の処理を繰返して、分割を行う。このように次つぎと
分割を行って行き、残りの文字列画像の幅が転記先の幅
よりも小さくなり、さらに折り返す必要がなくなった
ら、転記先の文字列画像の幅の範囲に、分割された各文
字列画像を順次縦に並べて結合する(ステップS4
8)。これにより図5(f)に示すように行を幅の範囲
でうまく折り返したようにすることができる。
【0014】転記先の文字列の高さが、作成された画像
の高さよりも小さい場合は、縦横均等の縮小をしたり、
あるいは切り捨てる処理を行うようにすればよい。
【0015】
【発明の効果】本発明によれば、文字画像を文字単位で
切り出すのではなく、行単位で切出し、それを1つの行
に連結した文字画像データにまとめ、その文字画像を所
定の幅毎にきりのよい位置で分割して、それを再配列す
るようにしたので、編集処理が簡単で、高速な文字画像
編集装置を得ることができる。また、領域の幅を拡大ま
たは縮小したときに、元の画像をそのまま拡大縮小する
のではなく、文字列の長さを幅に合わせて調節すること
になるので、より自然な領域の幅の変換を行うことがで
きる。さらに、本発明によれば、画像データのまま取り
扱うので、コード化できない情報も扱うことができ、コ
ード化のための辞書等を持つ必要もなく、コード化によ
る間違いも起こすことがない。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す図
【図2】実施例の動作の概略を示す処理フロー図
【図3】実施例における行の分割と行の連結を行う処理
フロー図
【図4】実施例における指定された幅への変換の処理を
示すフロー図
【図5】(a)〜(f)は実施例の動作を説明するため
の文字画像領域を示す図
【符号の説明】
1…画像入力手段、2…画像メモリ、3…編集対象指定
手段、4…画像切出し手段、5…行分割手段、6…文字
列画像バッファ、7…文字列画像配列手段。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】編集対象領域および編集後の領域を指定す
    る編集対象指定手段と、 指定された編集対象領域の画像データを切り出す画像切
    出し手段と、 前記切り出した領域における文字画像データの各行を分
    割し、分割した各行を1つの行に連結する行分割手段
    と、 前記行分割手段により得られた連結された文字画像デー
    タを、指定された編集後の画像領域の幅にあわせて、か
    つ文字の切れめの位置で、分割し、前記指定された編集
    後の画像領域に配列する文字列画像配列手段とを備えた
    文字画像編集装置。
JP5285567A 1993-10-21 1993-10-21 文字画像編集装置 Pending JPH07121734A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5285567A JPH07121734A (ja) 1993-10-21 1993-10-21 文字画像編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5285567A JPH07121734A (ja) 1993-10-21 1993-10-21 文字画像編集装置

Publications (1)

Publication Number Publication Date
JPH07121734A true JPH07121734A (ja) 1995-05-12

Family

ID=17693231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5285567A Pending JPH07121734A (ja) 1993-10-21 1993-10-21 文字画像編集装置

Country Status (1)

Country Link
JP (1) JPH07121734A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260304A (ja) * 2005-03-17 2006-09-28 Ricoh Co Ltd 情報管理装置、サーバ、画像形成装置、情報表示処理装置、情報管理方法、情報表示処理方法、情報管理プログラム、情報表示処理プログラム及びコンピュータ読み取り可能な記録媒体
CN102208022A (zh) * 2010-03-31 2011-10-05 富士通株式会社 遮挡字符恢复装置及其方法、遮挡字符识别装置及其方法
JP2015170981A (ja) * 2014-03-06 2015-09-28 ブラザー工業株式会社 画像処理装置
JP2015170979A (ja) * 2014-03-06 2015-09-28 ブラザー工業株式会社 画像処理装置
JP2015170978A (ja) * 2014-03-06 2015-09-28 ブラザー工業株式会社 画像処理装置
JP2019016236A (ja) * 2017-07-07 2019-01-31 インターマン株式会社 文字列画像表示方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260304A (ja) * 2005-03-17 2006-09-28 Ricoh Co Ltd 情報管理装置、サーバ、画像形成装置、情報表示処理装置、情報管理方法、情報表示処理方法、情報管理プログラム、情報表示処理プログラム及びコンピュータ読み取り可能な記録媒体
CN102208022A (zh) * 2010-03-31 2011-10-05 富士通株式会社 遮挡字符恢复装置及其方法、遮挡字符识别装置及其方法
JP2015170981A (ja) * 2014-03-06 2015-09-28 ブラザー工業株式会社 画像処理装置
JP2015170979A (ja) * 2014-03-06 2015-09-28 ブラザー工業株式会社 画像処理装置
JP2015170978A (ja) * 2014-03-06 2015-09-28 ブラザー工業株式会社 画像処理装置
JP2019016236A (ja) * 2017-07-07 2019-01-31 インターマン株式会社 文字列画像表示方法

Similar Documents

Publication Publication Date Title
US6072941A (en) Image processing apparatus and method which classifies images according to attributes
JP4261558B2 (ja) 画像処理方法
JP2930612B2 (ja) 画像形成装置
US6466954B1 (en) Method of analyzing a layout structure of an image using character recognition, and displaying or modifying the layout
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
EP0629078B1 (en) Apparatus for processing and reproducing image information
EP0690415B1 (en) Editing scanned document images using simple interpretations
US5509092A (en) Method and apparatus for generating information on recognized characters
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
US5978522A (en) Image processing apparatus enabling easy setting of spatial frequency characteristic of image data
US5617115A (en) Word processing unit with document display function
EP0343786A2 (en) Method and apparatus for reading and recording text in digital form
US5592574A (en) Method and apparatus for expansion of white space in document images on a digital scanning device
JPH07121734A (ja) 文字画像編集装置
JPH0818790A (ja) ハーフトーン画像の圧縮方式
JP2001216292A (ja) レイアウト画像編集装置及びレイアウト画像編集方法
JPH07262317A (ja) 文書処理装置
JP3157534B2 (ja) 表認識方法
JPH08293033A (ja) 情報処理装置
JP2968725B2 (ja) 文字パターン作成装置
JP2933947B2 (ja) 画像処理方法及び装置
JP2857260B2 (ja) 矩形領域の判定方法
JP3471925B2 (ja) 複写装置及び画像処理方法
JPH04342089A (ja) 文字入力処理方法
JP2001274976A (ja) 文書データ作成方法および装置並びに文字データ復元方法および装置