JP2001273509A - 文書画像編集装置及び文書画像編集方法 - Google Patents

文書画像編集装置及び文書画像編集方法

Info

Publication number
JP2001273509A
JP2001273509A JP2000087884A JP2000087884A JP2001273509A JP 2001273509 A JP2001273509 A JP 2001273509A JP 2000087884 A JP2000087884 A JP 2000087884A JP 2000087884 A JP2000087884 A JP 2000087884A JP 2001273509 A JP2001273509 A JP 2001273509A
Authority
JP
Japan
Prior art keywords
document image
layout
character
image data
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000087884A
Other languages
English (en)
Inventor
Katsumi Kato
克己 加藤
Yoshiaki Kurosawa
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000087884A priority Critical patent/JP2001273509A/ja
Publication of JP2001273509A publication Critical patent/JP2001273509A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【課題】レイアウト認識技術により得られたレイアウト
構成要素に関する情報に基づき、文章領域中の任意文字
列に対する編集を行なう際に、ユーザの指示に従った任
意の編集操作を可能とし、編集作業を円滑に効率よく行
う。 【解決手段】文書画像データのレイアウト構成を解析す
るレイアウト解析部13と、得られたレイアウト情報と上
記文書画像データから表示用データを生成して表示する
表示管理部16及び表示部17と、ユーザ入力の受付けを行
なう操作入力部15と、文書画像データ中の複数ブロック
で構成された文章部分中の任意文字列範囲が指定された
際にその指定された文字列範囲を他の文字列と区分して
表示させ、区分表示した文字列範囲に対して操作入力部
15により編集の指示入力がなされた場合にその編集処理
を実行する画像処理部14とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、レイアウト認識技
術を利用した、例えば、デジタル複写機、文書情報を扱
うコンピュータシステム等に適用して好適な文書画像編
集装置及び文書画像編集方法に関する。
【0002】また本発明は、文書が記録された紙面上を
スキャナ等により走査して得た文書画像データを入力
し、その内容を表示画面上で編集可能にオペレータに提
示する機能を備えたシステムに適用して好適な文書画像
編集装置及び文書画像編集方法に関する。
【0003】
【従来の技術】紙面上の各種文書を画像データとして電
子化することにより、従来、複数の紙面上の文書を切り
貼りして新しい文書を作成していた編集作業を、コンピ
ュータ上で容易に行うことのできるようにした紙文書の
編集技術が種々開発されている。
【0004】この際の基本的な編集機能として、文章部
分の任意の領域を削除し、あるいは他の領域に移動また
はコピーすることが考えられる。
【0005】しかしながら、このように文書画像を一般
の画像データとして編集操作する場合、文章部分に相当
する領域を正確に指定し選択するには微妙な操作が必要
であり、ユーザにかかる操作負担が大きいという問題が
生じる。このため前処理として画像認識技術等を用い、
ユーザ操作を省力化することが求められていた。
【0006】文書画像に画像認識技術等の前処理を施す
場合には、まずレイアウト認識技術により文書のレイア
ウト構成要素を抽出し、文章と判定される部分があれ
ば、さらに文字認識技術により文章部分が文字コード化
され、コード化された文字情報に対して、編集内容を指
定することで削除や移動、コピー等の編集操作を行なう
ことが実現される。
【0007】しかしながら、現状の文字認識技術におい
ては、文字を誤認識する可能性を含み、しかも一般的な
文書画像中に含まれる文字数が非常に多いことから、誤
認識した部分を必ずしもユーザが発見できるとは限ら
ず、したがって文章内容を大幅に書き変えるような場合
を除いて、文字認識まで行なうことは不要であり、レイ
アウト構成要素の抽出まで行なえば十分と考えられる。
【0008】文字認識までは行なわずに、レイアウト認
識技術で文書画像のレイアウト構成要素を抽出した段階
の文書画像に対し、特開平6−187333「文書作成
装置」のように、指定したレイアウトフォーマット用に
予め設定された文字サイズに抽出した構成要素部分の画
像サイズを変更したり、特開平3−122773「画像
形成装置」のように、指定した貼り込み先の領域の状態
に合わせて、文章領域の画像を整形して貼り付ける事例
も存在した。
【0009】しかしながら、これらの事例では予め決め
られたフォーマットに合わせて、貼り付ける画像を整形
するに止まるもので、文章領域の画像を貼り付けた後
に、ユーザが任意に編集作業を行なうことはできず、し
たがって編集作業の面では柔軟性に欠けるという不具合
があった。
【0010】
【発明が解決しようとする課題】上述したように従来で
は、レイアウト認識技術で文書画像のレイアウト構成要
素を抽出した段階の文書画像に対し、文章領域の画像を
貼り付けた後に、ユーザが任意に文字列を削除、移動あ
るいはコピーするような編集作業を行なうことができ
ず、したがって編集作業の面で柔軟性に欠けるという不
具合があった。
【0011】本発明は上記実情に鑑みなされたもので、
レイアウト認識技術により得られたレイアウト構成要素
に関する情報に基づき、文章領域中の任意文字列に対す
る編集を行なう際に、ユーザの指示にしたがった任意の
編集操作を可能にして、編集作業が円滑に効率よく行な
える、柔軟な文書作成を可能にした文書画像編集装置及
び文書画像編集方法を提供することを目的とする。
【0012】また本発明は、オペレータの指示にしたが
って文書画像中に含まれる文章領域の編集を行なう際
に、レイアウト認識技術によるレイアウト情報を有効に
用いて、よりわかりやすい表示形態で編集作業を実行す
ることが可能な文書画像編集装置及び文書画像編集方法
を提供することを目的とする。
【0013】また本発明は、文書画像に含まれる文章領
域中のレイアウト認識の誤りを訂正し、任意文字列範囲
を指定した上でその指定範囲の文字認識を行なうこと
で、より高い認識率を得て誤認識を極力排除し、認識結
果を有効に編集に活用することが可能となる文書画像編
集装置及び文書画像編集方法を提供することを目的とす
る。
【0014】
【課題を解決するための手段】請求項1記載の発明は、
文書画像データのレイアウト構成を解析するレイアウト
解析手段と、このレイアウト解析手段より得られるレイ
アウト情報と上記文書画像データから表示用データを生
成して表示する表示手段と、ユーザ入力の受付けを行な
う操作入力手段と、この操作入力手段より上記文書画像
データ中の複数ブロックで構成された文章部分中の任意
文字列範囲が指定された際にその指定された文字列範囲
を他の文字列と区分して表示する表示制御手段と、この
表示制御手段で区分して表示した文字列範囲に対して上
記操作入力手段より編集の指示入力がなされた場合にそ
の編集処理を実行する編集処理手段とを具備したことを
特徴とする。
【0015】このような構成とすれば、レイアウト認識
技術により得られたレイアウト構成要素に関する情報に
基づき、文章領域中の任意文字列に対する編集を行なう
際に、より見やすい状態としてユーザの指示にしたがっ
た任意の編集操作を可能として、編集作業を円滑に効率
よく行なうことができる。
【0016】請求項2記載の発明は、上記請求項1記載
の発明において、上記表示手段は、上記レイアウト解析
手段で得られるレイアウト情報に基づいて上記文書画像
データをブロック、行及び文字の各単位でそれぞれ識別
可能に表示し、且つ選択可能とすることを特徴とする。
【0017】このような構成とすれば、上記請求項1記
載の発明の作用に加えて、文書画像データの構成がより
見やすい状態で表示されるため、編集の範囲や位置の確
認及び指定が容易となる。
【0018】請求項3記載の発明は、上記請求項1記載
の発明において、上記レイアウト解析手段は、上記操作
入力手段により上記レイアウト解析手段で得た文書画像
データのレイアウト情報をブロック、行または文字のい
ずれかの単位で分割または統合するべく指示入力がなさ
れた場合に、その指示入力に従ってレイアウト情報を修
正することを特徴とする。
【0019】このような構成とすれば、上記請求項1記
載の発明の作用に加えて、レイアウト解析で得られた文
書画像に対する修正操作をより容易に行なうことができ
る。
【0020】請求項4記載の発明は、上記請求項1記載
の発明において、上記レイアウト解析手段がレイアウト
構成を解析するための文書画像データを格納しておく画
像格納手段をさらに具備し、この画像格納手段は、文書
画像データを画像ブロック毎にファイル化して格納する
ことを特徴とする。
【0021】このような構成とすれば、上記請求項1記
載の発明の作用に加えて、文書画像データを構成する各
画像ブロック毎に独立したファイルとして格納するため
に、編集作業で内容に変化を生じた画像ブロックに対応
するファイルのみ格納されているデータを書換えるよう
にすればよいので、文書画像データの取扱いが容易とな
る。
【0022】請求項5記載の発明は、上記請求項1記載
の発明において、上記レイアウト解析手段がレイアウト
構成を解析するための文書画像データを格納しておく画
像格納手段をさらに具備し、この画像格納手段は、文書
画像データに添付する添付画像データを合わせて格納
し、上記操作入力手段での選択入力により文書画像デー
タに対する添付画像データの出力の有無を設定すること
を特徴とする。
【0023】このような構成とすれば、上記請求項1記
載の発明の作用に加えて、例えば文書画像データに対す
る添削画像等を添付画像データとして合わせて格納し、
必要に応じて文書画像データのみを出力するか、添付画
像データを合わせて出力するかを選択することが可能と
なる。
【0024】請求項6記載の発明は、文書画像データか
ら表示用データを生成して表示する表示手段と、ユーザ
入力の受付けを行なう操作入力手段と、この操作入力手
段より上記表示手段で表示される文書画像の任意領域が
指定された際にその指定された領域中の文書画像の文字
認識を行なう文字認識手段と、この文字認識手段で得た
文字認識結果を上記操作入力手段での編集の指示入力に
応じて文書画像中の任意の位置で編集処理する編集処理
手段とを具備したことを特徴とする。
【0025】このような構成とすれば、ポインティング
デバイス等により文書画像データの任意領域を指定した
上でその領域内の文書画像による文字認識を実行させ、
得た認識結果を用いて編集動作に移行することができる
ため、認識結果と画像ブロックを同様に扱うことが可能
となる。
【0026】請求項7記載の発明は、文書画像データの
レイアウト構成を解析するレイアウト解析手段と、この
レイアウト解析手段より得られるレイアウト情報と上記
文書画像データから表示用データを生成して表示する表
示手段と、ユーザ入力の受付けを行なう操作入力手段
と、この操作入力手段より上記文書画像データ中の複数
ブロックで構成された文章部分中の任意文字列範囲が指
定された際にその指定された文字列範囲を他の文字列と
区分して表示する第1の表示制御手段と、この第1の表
示制御手段で区分して表示した文字列範囲に対して文字
認識処理を行なう文字認識手段と、この文字認識手段で
得た文字認識結果を上記指定された文字列範囲に代えて
表示させる第2の表示制御手段とを具備したことを特徴
とする。
【0027】このような構成とすれば、レイアウト認識
技術によるレイアウト情報を有効に用いて、文書画像に
含まれる文章領域中の任意文字列範囲を指定した上でそ
の指定範囲の文字認識を行なうことで、より高い認識率
を得て誤認識を極力排除し、認識結果を有効に編集に活
用することが可能となる。
【0028】請求項8記載の発明は、上記請求項7記載
の発明において、上記レイアウト解析手段は、上記操作
入力手段により上記レイアウト解析手段で得た文書画像
データのレイアウト情報をブロック、行または文字のい
ずれかの単位で分割または統合するべく指示入力がなさ
れた場合に、その指示入力に従ってレイアウト情報を修
正することを特徴とする。
【0029】このような構成とすれば、上記請求項7記
載の発明の作用に加えて、レイアウト情報を修正した上
でそれに基づいた任意の文字列による文字認識を行なわ
せることができるため、文字の認識率をより向上させる
ことが可能となる。
【0030】請求項9記載の発明は、文書画像データの
レイアウト構成を解析し、解析して得たレイアウト情報
と上記文書画像データから表示用データを生成して表示
する際、上記文書画像データ中の複数ブロックで構成さ
れた文章部分中の任意文字列範囲が指定されるとその指
定された文字列範囲を他の文字列と区分して表示し、区
分して表示した文字列範囲に対して編集の指示入力がな
されるとその編集処理を実行することを特徴とする。
【0031】このような方法とすれば、レイアウト認識
技術により得られたレイアウト構成要素に関する情報に
基づき、文章領域中の任意文字列に対する編集を行なう
際に、より見やすい状態としてユーザの指示にしたがっ
た任意の編集操作を可能として、編集作業を円滑に効率
よく行なわせることができる。
【0032】請求項10記載の発明は、文書画像データ
から表示用データを生成して表示する際、表示される文
書画像の任意領域が指定されるとその指定された領域中
の文書画像の文字認識を行ない、得た文字認識結果を用
い、編集の指示入力に応じて文書画像中の任意の位置で
編集処理することを特徴とする。
【0033】このような方法とすれば、ポインティング
デバイス等により文書画像データの任意領域を指定した
上でその領域内の文書画像による文字認識を実行させ、
得た認識結果を用いて編集動作に移行させることができ
るため、認識結果と画像ブロックを同様に扱うことが可
能となる。
【0034】請求項11記載の発明は、文書画像データ
のレイアウト構成を解析し、解析して得たレイアウト情
報と上記文書画像データから表示用データを生成して表
示する際、上記文書画像データ中の複数ブロックで構成
された文章部分中の任意文字列範囲が指定されるとその
指定された文字列範囲を他の文字列と区分して表示し、
区分して表示した文字列範囲に対して文字認識処理を行
ない、得た文字認識結果を上記指定された文字列範囲に
代えて表示させることを特徴とする。
【0035】このような方法とすれば、レイアウト認識
技術によるレイアウト情報を有効に用いて、文書画像に
含まれる文章領域中の任意文字列範囲を指定した上でそ
の指定範囲の文字認識を行なわせることで、より高い認
識率を得て誤認識を極力排除し、認識結果を有効に編集
に活用させることが可能となる。
【0036】
【発明の実施の形態】(第1の実施の形態) <第1の実施の形態の構成>以下図面を参照して本発明
の第1の実施の形態について説明する。
【0037】図1は同実施の形態に係る文書画像編集装
置の構成を示すもので、11は紙面P上の文書画像を走
査して入力するイメージスキャナでなる画像入力部であ
り、例えば図2(A)に示すような、文章、写真等を含
む各種の文書が記録された紙面P上を走査して、紙面P
上の文書画像を読込み、文書画像データとして出力す
る。
【0038】12は上記したような文書画像データを保
存、格納した上で、編集対象となる文書画像データを出
力する画像格納部である。
【0039】13は文書画像データのレイアウト解析を
行なうレイアウト解析部であり、上記画像格納部12よ
り出力された編集対象となる文書画像データのレイアウ
トを解析し、レイアウト構成要素を出力する。
【0040】ここで、レイアウト解析技術は文書画像理
解分野で知られている既存の技術であり、レイアウト構
成要素とは、文字の位置サイズ情報、行の位置サイズ情
報、複数行からなるパラグラフに相当する文章ブロック
の位置サイズ情報などの情報の他、写真、図、テキスト
などの領域の位置サイズ情報、種類などからなるもの
で、その領域をさらに細かく分類し、タイトル、著者
名、日付け、ヘッダー、フッターなどの分類情報を含む
ことも可能である。
【0041】なお、上記位置サイズ情報とは、位置とサ
イズが互いに関係しており、例えば、矩形の左端と右端
の位置座標の差が横方向のサイズであるので、その意味
で、特に位置とサイズを区別せず、これらの情報を位置
サイズ情報と呼称するものとする。
【0042】14は、レイアウト解析部13の出力する
レイアウト構成要素と原画像を用いて表示管理部16で
表示画面を構成させる画像処理部であり、例えばレイア
ウト解析で得られたブロックを取出して表示するように
表示管理部16で画面を構成させる。
【0043】図2(A)は入力された原画像20を例示
するもので、21がテキスト領域、22が写真領域であ
るとする。この原画像20に対し、レイアウト解析部1
3で得られるレイアウト解析の結果、図2(B)に示す
ように表示画面23上のブロック領域24が得られるも
ので、これが表示データとして表示管理部16により作
成され、表示部17で表示出力される。
【0044】ここでは、各ブロック領域24についてそ
れぞれ分かりやすくするために枠を表示している。
【0045】また、このとき、最初の表示をレイアウト
解析を行なわずに原画像のみを表示するようにし、この
文書画像編集装置のオペレータの指示を操作入力部15
で受付けて、その後にレイアウト解析を行ない、得られ
たレイアウト構成要素をその後に表示するようにしても
良い。
【0046】しかるに、このような表示部17での表示
画面23を見て上記オペレータは例えばポインティング
デバイスとしてのマウスを備えた操作入力部15により
操作を行なう。この操作情報は、操作入力部15から画
像処理部14に直接入力され、これを受けて画像処理部
14はあらためて表示画面を作成しなおして、表示管理
部16により表示を行なわせるように動作するもので、
オペレータは必要に応じて画像の編集作業を行なうべく
操作入力部15を操作する。
【0047】そして、オペレータの操作による画像の編
集作業や確認作業が終了すると、当該画像が画像出力部
18を経由してこの文書画像編集装置の外部に出力され
る。
【0048】<第1の実施の形態の動作>次に上記実施
の形態の動作について説明する。図3は文書画像の入力
から編集、出力に至る全体の処理の流れを示すもので、
その当初には編集対象とする紙面Pを画像入力部11に
より操作して文書画像データの入力を行なう(ステップ
A01)。
【0049】図7(1)は紙面Pを画像入力部11で操
作して読み取った入力画像を例示するものである。
【0050】画像入力部11で読み取った文書画像デー
タは画像格納部12に格納された後、レイアウト解析部
13に読出されて画像処理部14の制御の下にレイアウ
ト構成要素が解析され(ステップA02)、その解析結
果に基づいて表示管理部16で表示画面が構成されて
(ステップA03)、表示部17で表示出力される(ス
テップA04)。
【0051】図7(2)はそのレイアウト解析結果とし
て得られるレイアウト構成要素のそれぞれについて、各
文字毎の位置と大きさから定まる文字枠を原画像に重ね
て表示部17で表示される画面を例示したものである。
【0052】なお、ここでは各文字1つ1つについて切
り出しを行ない、文字単位で枠線で囲むようにして表示
するものとしたが、図9に示すように文字列に対する矩
形の枠を行単位とし、且つ各文字画像の間の空白の中央
に間仕切り線を示すような表示形態であっても良いし、
また、図10に示すように上記間仕切り線を表示せず、
行単位で枠のみを表示しても良く、その他、どのような
枠を表示するものとしても、また枠を表示しないものと
しても良いものとする。
【0053】さらに、ここではその処理は行なわない
が、レイアウト解析を行なった後に自動的にその解析結
果の文字画像に対して文字認識を行なうように構成して
も良い。
【0054】しかして、上記のような表示を行なってい
る状態で、オペレータによる操作入力部15での編集コ
マンドその他の入力を受付けるもので(ステップA0
5)、入力があったと判断した時点で、まずその入力が
なんらかの編集コマンドであるか否かを判断し(ステッ
プA06)、編集コマンドでないと判断した場合には、
さらに文書画像の編集を終了するための入力操作である
か否かを判断する(ステップA07)。
【0055】ここで、終了するための入力操作であると
判断した場合にはそのままこの文書画像の編集動作を終
了するが、終了するための入力操作ではないと判断した
場合には、その操作の内容に対応した必要な処理を実行
し(ステップA08)、その後に再び上記ステップA0
5からの編集コマンドその他の入力を受付けに戻る。
【0056】また、ステップA06で操作入力されたの
がなんらかの編集コマンドであると判断した場合には、
そのコマンドの内容に対応して、文書画像に対しする編
集処理を実行し(ステップA09)、実行した結果さら
にレイアウト解析が必要であるか否かを判断して(ステ
ップA10)、必要であれば上記ステップA02から、
必要でなければ上記ステップA03からの処理を繰返し
実行する。
【0057】図4乃至図6は上記ステップA09での返
信処理の詳細な内容を示すサブルーチンであり、その当
初には操作入力部15のマウスのボタンがクリックさ
れ、且つその時の表示部17画面でのカーソルの位置が
任意の文字画像を指定している状態となるのを待機する
(ステップB01,B02)。
【0058】図7(3)は上記図7(2)の表示画面か
らカーソルCが図示する位置に移動された状態を示すも
ので、この状態でマウスのボタンがクリックされると、
上記ステップB01,B02でこれが判断され、当該位
置にある文字画像「ま」を指定文字列の開始点として設
定し、他の文字画像とは異なる色で区分表示する(ステ
ップB03)。
【0059】その後、マウスのボタンのクリックが解除
されるか、あるいはカーソルCで指示される文字画像が
移動するのを待機するもので(ステップB04,B0
5)、カーソルCで指示される文字画像が移動したと判
断した場合には、その移動した位置にある文字画像を指
定文字列の終了点として設定した上で(ステップB0
6)、指定文字列の開始点から終了点に至る間をすべて
他の文字画像とは異なる色で区分表示し(ステップB0
7)、再び上記ステップB04からの処理に戻る。
【0060】図7(4)は上記図7(3)の表示画面か
らマウスのボタンをクリックしたままドラッグし、カー
ソルCが次行の文字画像「く」まで移動させた場合の表
示状態を例示するもので、これにより図中に31で示す
指定文字列「まぼろしのごとく」がオペレータによって
指示されたものとして他の文字画像とは異なる色で区分
表示されることとなる。
【0061】なお、ここでは指定された文字列の文字画
像を他の文字画像と色を変えることで区分表示するもの
としたが、これに限らず、オペレータにどれが修正対象
の文字列画像であるかが分かり易く表示されるのであれ
ば、当該文字列を構成する個々の文字画像の矩形の形
状、色の濃度、あるいは文字フォント等を組合わせて他
の区分表示するものとしても良い。
【0062】その後、ステップB04でマウスのボタン
のクリックが解除されたと判断すると、その時点で他の
文字画像とは異なる色で区分表示されている開始点から
終了点に至る間の指定文字列画像をあらためて修正対象
として設定した上で(ステップB08)、再び操作入力
部15のマウスのボタンがクリックされるのを待機する
(ステップB09)。
【0063】そして、マウスのボタンがクリックされた
と判断すると、次にその時点で表示部17画面でのカー
ソルCの位置が任意の文字画像を指定しているか否かを
判断する(ステップB10)。
【0064】カーソルCの位置が文字画像であった場
合、上記指定文字列を削除して他の文字列を修正対象と
して指定することとなるので、上記ステップB03に戻
って当該位置にある文字画像を指定文字列の開始点とし
て設定し、他の文字画像とは異なる色で区分表示し、そ
の後上記と同様に指定文字列画像の終了点までの新たな
設定を行なう。
【0065】また、上記ステップB10でカーソルCの
位置が文字画像ではなかった場合には、指定文字列に対
する修正の内容が指示されたこととなるので、マウスの
ボタンのクリックが解除されるのを待機し(ステップB
11)、クリックが解除されると、そのカーソルCの位
置が「削除」を指示するボタンの位置であるか否かを判
断する(ステップB12)。
【0066】「削除」を指示するボタンの位置であった
場合、その指示通り修正対象となっている文字列画像を
消去する(ステップB14)。
【0067】次いで、消去した文字列画像の先頭位置を
「S1 」、同文字列画像の最後尾に続く位置を「E1 」
とし(ステップB15)、変数kに1を代入した上で
(ステップB16)、「Ek」で示される位置の文字画
像を「Sk」で示される文字画像の位置まで移動し、元
の「Ek」で示される位置の文字画像を消去する(ステ
ップB17)。
【0068】その後、「Sk」が「E1 」に達するか、
「Ek」で示される位置がレイアウト構成上、最終文字
画像であったか、あるいは段落の終わりを示す文字画像
であったか否かを、行末以前スペースがあることや、行
頭にスペースのあることから判断し(ステップB1
8)、そうでなければ上記変数kの値を「+1」更新設
定して(ステップB19)、上記ステップB17からの
処理を繰返し実行する。
【0069】こうして、修正対象としての文字列画像を
消去してから、その後に続く文字画像を順次前に詰める
処理を実行していく。
【0070】図8(1)は上記図7(4)で示した状態
から文字列31が削除され、それに続く「なり」の文字
列32が後処理として前に移動した状態を示す。
【0071】この図8(1)の状態で上記ステップB1
8では「Ek」で示される位置がレイアウト構成上、段
落の終わりを示す文字画像であると判断し、次に「S
k」で示される文字画像の位置と「Ek」で示される位
置の次の文字画像との間に空白行が存在するか否かを判
断する(ステップB20)。
【0072】ここで、図8(1)に示す如く上記削除の
修正による後処理として空白行33が存在すると判断し
た場合にのみ、その空白行33をなくすべく、レイアウ
ト解析結果として得られた行ピッチを用いて、後に続く
文字画像を上にずらすようにして、行を詰める処理を実
行する(ステップB21)。図8(2)はこうして空白
行の行詰めを行なった結果を示す。その後、再び次の編
集に備えて上記ステップB01からの処理に戻る。
【0073】また、上記ステップB12でカーソルCの
位置が「削除」を指示するボタンの位置ではないと判断
した場合には、次いでカーソルCの位置が「移動」を指
示するボタンの位置であるか否かを判断する(ステップ
B13)。
【0074】「移動」を指示するボタンの位置でもない
と判断した場合、上記ステップB09〜B11でマウス
のボタンをクリックしたことによる操作はNOP(無
効)として、再び上記ステップB09からの処理に戻
る。
【0075】しかして、ステップB13でクリック操作
が「移動」を指示するボタンの位置であると判断した場
合には、次に移動先の位置を指定するためのクリック操
作がなされるのを待機し(ステップB22)、次にその
クリック操作が終えたことを確認した上で(ステップB
23)、その時点でカーソルCで指定された位置が文字
画像であるか否かを判断する(ステップB24)。
【0076】文字画像でなかった場合、移動先がわから
ず、文字列の移動を行なうことができないので、その操
作はNOP(無効)として、再び上記ステップB22か
らの処理に戻る。
【0077】また、文字画像であった場合には、当該文
字画像位置を移動先の挿入位置として設定した上で(ス
テップB25)、まず修正対象となっている文字列画像
を消去し(ステップB26)、次いで、消去した文字列
画像の最後尾から続けて、修正対象文字数分先の位置を
「E1 」、同最後尾の文字画像位置を「S1 」とし(ス
テップB27)、変数kに1を代入した上で(ステップ
B28)、「Sk」で示される位置の文字画像を「E
k」で示される文字画像の位置まで移動し、元の「S
k」で示される位置の文字画像を消去する(ステップB
29)。
【0078】その後、「Sk」で示される位置が上記ス
テップB25で設定した挿入先の位置となったか否かを
判断し(ステップB30)、そうでなければ上記変数k
の値を「+1」更新設定して(ステップB31)、上記
ステップB29からの処理を繰返し実行する。
【0079】こうして、修正対象としての文字列画像を
消去してから、その後に続く挿入先位置までの間の文字
画像を順次前に詰める処理を実行していく。
【0080】そして、上記ステップB30で「Sk」で
示される位置が上記ステップB25で設定した挿入先の
位置となったと判断すると、その「Sk」で示される位
置から順に上記修正対象としての文字列画像を貼り付け
るべく配置設定し(ステップB32)、以上で再び次の
編集に備えて上記ステップB01からの処理に戻る。
【0081】図8(3)は上記図7(4)で示した場合
と同様に指定文字列31として「まぼろしのごとく」を
他の文字画像とは異なる色で区分表示した上で、さらに
移動先としてカーソルCで図示する位置を指定している
状態を示すものである。
【0082】このような移動を実行することにより、図
8(4)に示す如く指定文字列31が上記図8(3)に
おいてカーソルCで示した位置に挿入配置される。
【0083】なお、上記実施の形態の動作に加えて、修
正対象となる文字列画像の画像情報などを一時画像処理
部14が所定のメモリ空間にバッファリングしておき、
編集処理としての移動を、パーソナルコンピュータでコ
ピー&ペーストと称される2つの操作に分けて実行する
ものとしても良い。この場合も上記で説明したのと同様
の方法で修正を行なうことが可能となる。
【0084】また、移動処理は表示されている画面内に
限って行なうだけではなく、文書画像のブロックやペー
ジを飛び越えて行なうことも当然可能である。ブロック
外に移動することもでき、この場合はレイアウト情報に
基づいてその位置に移動すべき文字画像を各々貼り付け
ることによって移動を実行する。その画像をあらためて
1つのブロックとして登録する。この際には、横書の場
合であればブロックの横幅を指定することによって自動
的に改行を行なって文字画像を配置するものとする。
【0085】<第1の実施の形態の他の動作1>次に上
記実施の形態の動作時の文書画像中の任意の範囲を指定
する場合の表示形態について、他の動作1として説明す
る。図11はレイアウト解析部13により得られる結果
を例示するもので、図中の41がブロック枠であり、こ
のブロック枠41中に行枠42が配置されることとな
る。これらは原画像と重ね合わせて表示するが、原画像
だけ表示して、枠41,42は表示しないような構成と
しても良い。
【0086】しかるに、ブロック枠41の矩形内部でオ
ペレータが操作入力部15のマウスのクリックなど何ら
かの指示操作を行なうことにより、当該ブロックが選択
されたものと見なす。
【0087】この際、ブロック枠41や、表示されてい
る原画像の当該ブロック部分の表示方法を他の部分と異
ならせるように表示制御することで、選択されたブロッ
クをオペレータが容易に識別できるように表示する。
【0088】さらに、カーソルCを行枠42の付近に移
動させ、マウスのクリックなどなんらかの指示操作を行
なうことにより、当該行が選択されたものと見なす。当
該行も、原画像の当該部分や行枠42の表示方法を他の
部分と異ならせるように表示制御することで、選択され
た行をオペレータが容易に識別できるように表示する。
【0089】また、カーソルCが行枠42内にある時
は、カーソルCの表示形状を枠42外にある時と変える
ことで、枠42内の文字位置を指定するモードになって
いることオペレータに知らせるものとする。この状態
で、前に記載した文字列範囲の開始点と終了点をクリッ
ク操作するなどの手段により任意の文字列を選択できる
ようにする。
【0090】ブロックの指定を行なう時にブロック枠4
1の付近でカーソルCを位置させてマウスのボタンをク
リックすることにより、当該ブロックが選択されるよう
に構成しても良い。この時、ブロック内部や行枠42付
近にカーソルが移動した時にはブロックではなく行を指
定するモード状態となっていることをオペレータに知ら
せるように、カーソルCの表示形状を変更するように構
成するようにしても良い。
【0091】このような表示形態及び範囲の指定形態を
採ることにより、これまでのようにブロックと行と文字
の選択を混在した状況で行なわなければならない場合で
も、操作が複雑で取り扱いが困難になるという不具合を
生じることなく、上記のようにブロックの指定をブロッ
ク枠41付近でのクリック操作により、また行の指定を
行枠42付近でのクリック操作によりそれぞれ行なうよ
うに設定することにより、ブロック、行と文字の指定の
操作を視覚的にもはっきり区別して実行することがで
き、より操作が容易となり、オペレータの負担を軽減し
て、編集動作の効率を向上することができる。
【0092】<第1の実施の形態の他の動作2>次に上
記実施の形態の動作時の特にレイアウト解析結果に対す
る修正動作について、他の動作2として説明する。図1
2(A)はレイアウト構成要素の修正、追加操作を例示
するもので、51はブロックとして指定したいテキスト
領域であるが、レイアウト解析では抽出できなかったも
のとする。このテキスト領域51に対して、これを囲む
領域52をオペレータが操作入力部15のマウス等を操
作して指定することによってテキスト領域を決定する。
この指定された領域内で、余白部分を除くようにして図
12(B)に示すようなテキスト領域51を囲む枠53
を決定し、これをブロックエリアとして登録するものと
する。
【0093】これは例えば、1つのブロックであるとい
う制限の基でブロック抽出を上記領域52の指定に基づ
いてやり直させることができる。
【0094】これに対し、オペレータが指定した領域5
2をそのままブロックとして登録するようにもできるよ
うにしても良く、その場合は、どちらでブロックの修正
を行なうかのモードをオペレータが選べるように構成す
る。
【0095】また、上記では元来テキスト領域51に対
応するブロックは登録されていないものとして説明した
が、すでにレイアウト解析の結果、間違えたブロックが
登録されている場合には、その部分を消去して新たなブ
ロックを登録することで、ブロックの統合、分割ができ
るようにするものとしても良い。
【0096】図13はこのようなブロックの統合、分割
を行なう場合を例示するもので、図13(A)では複数
のブロック54,55を指定して統合を指示することに
よって新たなブロック56を作成するものである。
【0097】また、図13(B)では、1つのブロック
57を指定し、複数、例えば2つの新たなブロック5
8,59を指定して分割を指示することにより、ブロッ
クの分割ができるようにしている。
【0098】また、図14は複数の行を統合して1つの
行にする場合を例示するもので、ここでは2つの行6
2,63を領域61で囲むように操作入力部15のマウ
ス等により指示し、さらに統合を指示することによっ
て、統合を実行している。
【0099】なお、領域61により囲むような指示を行
なわず、単に複数の行をそれぞれポイント指定するよう
にしても良いし、さらには行の抽出を、前記指定に基づ
いて1つの行であるという制限の基でやり直すようにし
ても良い。
【0100】図15は1つの行64を複数、例えば2つ
に分割する場合を例示するもので、オペレータの指示に
よって行の分割モードとすることで、変形したカーソル
65を表示させ、行分割モードであることをオペレータ
に示す。この時に、カーソル65に合わせて分割位置を
破線66のようにして示しても良い。そのような表示状
態で、カーソル65及び破線66が所望の位置となるよ
うに操作入力部15のマウスを移動操作してから、マウ
スのボタンをクリックすると、その位置で行を分割して
新たな複数の行を登録し、元の行の情報を削除するよう
にする。
【0101】また、指示された位置がすくなくとも行間
の切れ目(余白)にあることを前提にして、レイアウト
解析部13で行抽出をやり直すように構成しても良い。
【0102】さらに、オペレータが指定した領域をその
まま行として登録するものとしても良いし、または再度
行の抽出を行なうものとしても良く、その場合、どちら
で行の修正を行なうかを示すモードをオペレータが設定
指定するように構成する。
【0103】このモード指定方法は行修正に限らずブロ
ックの修正を行なう場合でも適用できる。
【0104】図16は複数の文字画像を統合して1つの
文字画像にする場合を例示するもので、ここでは2つの
文字画像72,73を領域71で囲むように操作入力部
15のマウス等により指示し、さらに統合を指示するこ
とによって、統合を実行している。
【0105】なお、領域71により囲むような指示を行
なわず、単に複数の文字画像をそれぞれポイント指定す
るようにしても良いし、さらには文字画像の抽出を、前
記指定に基づいて1つの文字画像であるという制限の基
でやり直すようにしても良い。
【0106】図17は1つの文字画像74を複数、例え
ば2つに分割する場合を例示するもので、オペレータの
指示によって文字画像の分割モードとすることで、変形
したカーソル75を表示させ、文字分割モードであるこ
とをオペレータに示す。この時に、カーソル75に合わ
せて分割位置を破線66のようにして示しても良い。そ
のような表示状態で、カーソル75及び破線76が所望
の位置となるように操作入力部15のマウスを移動操作
してから、マウスのボタンをクリックすると、その位置
で文字画像を分割して新たな複数の文字画像を登録し、
元の文字画像の情報を削除するようにする。
【0107】また、指示された位置がすくなくとも文字
画像間の切れ目(余白)にあることを前提にして、レイ
アウト解析部13で文字画像抽出をやり直すように構成
しても良い。
【0108】さらに、オペレータが指定した領域をその
まま文字画像として登録するものとしても良いし、また
は再度文字画像の抽出を行なうものとしても良く、その
場合、どちらで文字画像の修正を行なうかを示すモード
をオペレータが設定指定するように構成する。
【0109】さらに、続く図18乃至図20は文字領域
の他の修正処理を例示するものである。
【0110】ここでは、文字画像の領域を矩形で表すこ
とはしておらず、文字画像の領域間に線を入れて表示し
ている。
【0111】図18(1)において81は行を示す枠
で、82はその中で文字領域間の線であるが、ここでは
あえて間違ったレイアウト解析の結果を例示している。
【0112】操作入力部15を操作してのオペレータの
指示により、この線82を指定することができ、これに
よって線の形状、色、濃度などを変更して新たな線83
とすることで、当該線82が選択されていることを図1
8(2)に示すようにオペレータに知らせる。
【0113】次に図18(3)に示すようにオペレータ
の操作によりこの選択された線83を左右に動かし、適
切な位置でオペレータが確定の指示を出すものとする。
この位置によって文字領域間の切れ目としてレイアウト
構成要素の情報を更新する。
【0114】またさらに、その位置が少なくとも切れ目
であることを前提に文字の切り出しを再度行ない、新た
に得られた位置を文字画像領域間の切れ目として登録し
ても良い。
【0115】このように、オペレータが操作入力部15
で指定した領域をそのまま文字画像の領域として登録す
ることもできるようにして、再度文字の切り出しを行な
っても良く、その場合、どちらで文字領域の修正を行な
うかをモードをオペレータが選択できるようにするもの
とする。
【0116】図19は2つの文字画像を分離する場合の
表示形態を例示するもので、この場合には操作入力部1
5によるオペレータの分割指示によって、表示されるカ
ーソル84の形状を変更し、文字画像の分割モードであ
ることを知らせるものとする。この場合、文字画像の領
域の分割を適切な位置で確定できるように装置を構成す
るものとする。
【0117】図20は複数の文字画像の領域を統合する
場合の表示形態を例示するもので、この場合には余分な
文字画像の領域間の線85を上記図18で説明した場合
と同様な手法で指示し、さらに編集内容として削除を指
定することによって、この線85を削除し、結果として
この線85に隣り合う2つの文字領域を統合することが
できるものである。
【0118】<第1の実施の形態の他の動作3>次に上
記実施の形態の動作時の特にレイアウト解析結果に対す
る画像格納部12での格納動作について、他の動作3と
して説明する。ここで画像格納部12に格納された原画
像をレイアウト解析部13が読出してレイアウト解析
し、その結果得られるレイアウト構成要素に基づいて画
像処理部14が各レイアウト構成要素、具体的には各構
成要素としてのブロック、行、文字画像の単位毎に対応
する画像データを原画像から切り出し、階層構造化して
フォルダ化、ファイル化して画像格納部12に再度格納
し直す構成とする。
【0119】この時、すべてのレイアウト構成要素の画
像データを格納する必要はなく、必要な画像だけでも良
い。たとえば、文字画像領域毎に画像データをファイル
化するのであれば、行、ブロックをそれぞれその上位の
フォルダとすることで、行の画像データを別途ファイル
化して保持する必要はない。
【0120】表示部17で表示するための表示画面を構
成する際には、上記レイアウト構成要素の画像データを
用いて全体の画像を作成するようにする。
【0121】こうすることによって、レイアウト構成要
素の移動、削除、変形を行なった時に消えてしまう部分
などをもとに戻す処理などが簡単にできるようになる。
【0122】<第1の実施の形態の他の動作4>次に上
記実施の形態の動作時の特にレイアウト解析結果に対す
る画像格納部12での格納動作について、他の動作4と
して説明する。ここでは、紙面Pを原画像としてレイア
ウト解析部13で得たレイアウト構成要素の画像データ
に加えて、例えば添削の画像や注釈の画像などを、原画
像に対して一時的に重ね合わせて表示するための一時表
示用構成要素として加えて画像格納部12に格納させる
ものとする。
【0123】しかるに、この画像格納部12に格納して
いる画像データを例えば画像出力部18により外部機器
に出力する時は、この一時表示用構成要素を用いずに原
画像から得たレイアウト構成要素の画像データのみによ
り出力画像を生成し、出力するものとする。
【0124】一方、この画像格納部12に格納している
画像データを例えば表示部17で表示させる時は、この
一時表示用構成要素を原画像のレイアウト構成要素の画
像データに加えて表示してもよいし、あるいは原画像の
レイアウト構成要素の画像データのみ、あるいは一時表
示用構成要素の画像データのみを選択的に表示してもよ
いものとする。
【0125】これらの選択操作は操作入力部15を用い
てオペレータの指示によって決められるものとする。
【0126】一時表示用構成要素は、任意のレイアウト
構成要素の画像データに対してオペレータが指示するこ
とによってそのレイアウト構成要素を一時表示用構成要
素として定義するように変更設定しても良いし、オペレ
ータの操作により、原画像とは別に文字や図形を画像と
して生成して、それを一時表示用構成要素としても良
い。また、ある一時表示用構成要素に対してオペレータ
が指示することにより、これをレイアウト構成要素に転
換するようにもできるものとする。
【0127】さらに、レイアウト構成要素の画像データ
の一部にフラグを設定し、そのフラッグのオン/オフを
変更設定することによって、一時表示用構成要素である
ことを示すような構成にしても良い。
【0128】しかるに、上記一時表示用構成要素の画像
データは、表示する際に原画像のレイアウト構成要素の
画像データとは色や濃度を変えるなどの処理を施して区
分表示すると、より一層その違いがわかりやすくなるの
で、一時表示用構成要素の画像データは、レイアウト構
成要素の画像データを仮に消去する操作や、付箋、マー
キングなどとして用いることができ、より多彩な表示画
像を構成することかできるものである。
【0129】さらに、一時表示用構成要素として複数種
類の一時表示用構成要素を用意して用途ごとに区分表示
して、それらを使い分けられるように構成するものとし
ても良い。
【0130】(第2の実施の形態) <第2の実施の形態の構成>以下図面を参照して本発明
の第2の実施の形態について説明する。
【0131】図21は同実施の形態に係る文書画像編集
装置の構成を示すもので、91は紙面P上の文書画像を
走査して入力するイメージスキャナでなる画像入力部で
あり、各種の文書が記録された紙面P上を走査して、紙
面P上の文書画像を読込み、文書画像データとして出力
する。
【0132】92は上記したような文書画像データを保
存、格納し、必要に応じて出力する格納部である。
【0133】93は画像格納部92から読出した文書画
像データのレイアウト解析を行なうレイアウト解析部で
あり、上記格納部92より出力された編集対象となる文
書画像データのレイアウトを解析し、レイアウト構成要
素を出力する。
【0134】ここで、レイアウト解析技術は文書画像理
解分野で知られている既存の技術であり、レイアウト構
成要素とは、文字の位置サイズ情報、行の位置サイズ情
報、複数行からなるパラグラフに相当する文章ブロック
の位置サイズ情報などの情報の他、写真、図、テキスト
などの領域の位置サイズ情報、種類などからなるもの
で、その領域をさらに細かく分類し、タイトル、著者
名、日付け、ヘッダー、フッターなどの分類情報を含む
ことも可能である。
【0135】なお、上記位置サイズ情報とは、位置とサ
イズが互いに関係しており、例えば、矩形の左端と右端
の位置座標の差が横方向のサイズであるので、その意味
で、特に位置とサイズを区別せず、これらの情報を位置
サイズ情報と呼称するものとする。
【0136】また、94はレイアウト解析部93の出力
するレイアウト構成要素と原画像とを用いて文字認識を
行なう文字認識部であり、文字認識の結果得られた文字
コードを出力する。
【0137】95は、格納部92に格納される原画像
と、レイアウト解析部93の出力するレイアウト構成要
素、あるいは文字認識部94で得られた文字コードデー
タを用いて表示管理部96で表示画面を構成させる文書
処理部であり、表示管理部96で構成させた画面を表示
部97で表示出力させる。
【0138】しかるに、表示部97での表示画面を見て
この文書画像編集装置のオペレータは例えばポインティ
ングデバイスとしてのマウスを備えた操作入力部98に
より操作を行なう。この操作情報は、操作入力部98か
ら上記文書処理部95に直接入力され、これを受けて文
書処理部95はあらためて表示画面を作成しなおして、
表示管理部96により表示部97での表示を行なわせる
ように動作するもので、オペレータは必要に応じて画像
の編集作業を行なうべく操作入力部98を操作する。
【0139】そして、オペレータの操作による画像の編
集作業や文字認識処理、確認作業等が終了すると、当該
文書のデータが出力部99を経由してこの文書画像編集
装置の外部に出力される。
【0140】<第2の実施の形態の動作>次に上記実施
の形態の動作について説明する。紙面Pから入力された
原画像の画像データは、格納部92に格納された後、ま
ず直接表示管理部96に読み出されて表示データが作成
され、表示部97で表示される。
【0141】この表示画像に対して、オペレータが読取
る画像の領域を操作入力部98でのポインティグデバイ
スなどで指示する。指示された領域に対応する画像デー
タは格納部92からレイアウト解析部93に読出され、
ここでレイアウト解析がなされるもので、解析の結果得
られたレイアウト構成要素は格納部92に格納される。
【0142】次いで、この格納部92に格納されレイア
ウト構成要素と原画像の画像データとが文字認識部94
により読出され、文字認識部94は各文字画像領域毎に
文字認識を行なって、その文字認識結果としての文字コ
ードデータを格納部92に格納させる。文字認識後、文
書処理部95は文字認識によって得られた文字コードデ
ータではなく、上記レイアウト解析により得られたレイ
アウト構成要素と原画像データとにより再度表示データ
を作成し、表示管理部96により表示部97に表示させ
るもので、その表示内容に対する文字列の削除、移動、
コピーを含んだ各種編集指定が操作入力部98でオペレ
ータによりなされると、文書処理部95はその編集指定
に対応した編集処理を実行し、文書データを作成して格
納部92に格納する。
【0143】しかして、作成された文書データは出力部
99により外部へ出力される。
【0144】上記操作入力部98での操作に基づいた編
集処理は、一般的なワープロソフト等でキーボードを用
いて文字を入力し、編集する場合と同等の操作性を実現
するものとし、レイアウト解析により得られたレイアウ
ト構成要素と原画像とにより表示される内容に対して、
挿入、移動、コピー等の編集処理を行なう。
【0145】このように、ポインティングデバイス等に
より文書画像データの任意領域を指定した上でその領域
内の文書画像による文字認識を実行させ、得た認識結果
を用いて編集動作に移行することができるため、より高
い認識率を得て誤認識を極力排除することができ、認識
結果を有効に編集に活用することが可能となる。
【0146】なお、紙面Pを走査して画像入力部91で
入力する画像は、2値画像、濃淡画像、カラー画像いず
れであっても良く、また縮小、拡大など変形を施したも
のであっても良い。
【0147】<第2の実施の形態の他の動作1>次に上
記実施の形態の他の動作1として、特に領域指示を行な
う場合の表示画面と操作状況とを説明する。
【0148】ここでは、読取るべき領域の指定をレイア
ウト解析部93によるレイアウト解析と文字認識部94
による文字認識の後に行なうものとして構成した場合の
動作について説明する。
【0149】図7(1)は画像入力部91で入力する紙
面Pの原画像を例示するもので、図7(2)はその原画
像をレイアウト解析部93によりレイアウト解析した場
合の結果として得られる、各文字画像の1つ1つの文字
位置と大きさから定まる文字枠を原画像に重ねて表示し
たものである。
【0150】この場合の文字枠は上記図7(2)に示し
た内容ではなく、文字画像と文字画像の間の中央に間仕
切り線を示す図9に示したようなものであっても良く、
さらには文字枠を表示せず、図10に示したように行枠
のみを表示するものとしてもしても良いし、その他、ど
のような枠を用いるものとしても、あるいは枠自体を表
示しないものとしても良い。
【0151】このレイアウト解析を行なった後、図7
(3)に示すように操作入力部98のポインティングデ
バイスを用いて表示画面上でカーソルCを表示させるも
ので、ここでは読取対象の文字列画像中の図示する
「ま」の位置までカーソルCを移動させている状態を示
す。
【0152】ここでマウスのボタンをクリックし、その
ままドラッグして次に、図7(4)に示すように読取対
象の文字列画像中の図示する「く」の位置までカーソル
Cを移動させ、それからクリックを解除すると、こうし
た位置指定によって文字列「まぼろしのごとくなり」が
選択されたこととなり、他の文字画像と色を変えるなど
して区分表示される。
【0153】なお、この区分表示は、いずれもオペレー
タがどれが読取対象として選択した文字列画像であるか
を分かり易くするためであり、他にも矩形内全体や文字
画像の色や濃度、文字の表示フォントを変えるなどの方
法が考えられる。
【0154】こうして読取対象として選択した文字列画
像は、矩形領域の並び方から改行位置がある場合にこれ
を推定して各矩形の接続関係を求め、これによってオペ
レータによって指示された先頭文字画像と最後尾の文字
画像から読取対象文字列画像を決めるようにする。
【0155】しかるに、こうして選択した読取対象とな
る文字列画像を用いて文字認識部94で文字認識処理を
実行し、文字認識結果としての文字コードデータを得
て、これを格納部92に格納する。
【0156】文書処理部95は、この格納部92に格納
した文字コードデータの列から表示データを作成し、上
記該当する文字画像に代えて編集中の文書に表示させ
る。
【0157】このように、レイアウト認識技術によるレ
イアウト情報を有効に用いて、文書画像に含まれる文章
領域中の任意文字列範囲を指定した上でその指定範囲の
文字認識を行なうことで、より高い認識率を得て誤認識
を極力排除することができ、認識結果を有効に編集に活
用することが可能となる。
【0158】<第2の実施の形態の他の動作2>次に上
記実施の形態の他の動作2を説明する。
【0159】紙面Pから入力された原画像の画像データ
は、格納部92に格納された後、格納部92からレイア
ウト解析部93に読出され、ここでレイアウト解析がな
されるもので、解析の結果得られたレイアウト構成要素
は格納部92に格納される。
【0160】次いで、この格納部92に格納されたレイ
アウト構成要素と原画像の画像データとが文字認識部9
4により読出され、文字認識部94は各文字画像領域毎
に文字認識を行なって、その文字認識結果としての文字
コードデータを格納部92に格納させる。
【0161】文字認識後、文書処理部95は文字認識に
よって得られた文字コードデータではなく、上記レイア
ウト解析により得られたレイアウト構成要素と原画像デ
ータとにより再度表示データを作成し、表示管理部96
により表示部97に表示させるもので、その表示内容に
対する文字列の削除、移動、コピーを含んだ各種編集指
定が操作入力部98でオペレータによりなされると、文
書処理部95はその編集指定に対応した編集処理を実行
し、文書データを作成して格納部92に格納する。
【0162】しかして、編集処理によって内容が変更さ
れた部分は必要により再度レイアウト解析部93によっ
てレイアウト解析され、文字認識部94で文字認識され
るもので、こうして編集処理がなされ、最終的に得られ
た結果としての文書データが出力部99により外部へ出
力される。
【0163】なお、上記動作においては、文字認識部9
4による文字認識処理を最終的な文字列の編集処理の後
に一括して行なうものとしても良い。
【0164】<第2の実施の形態の他の動作3>次に上
記実施の形態の他の動作3を説明する。紙面Pから入力
された原画像の画像データは、格納部92に格納された
後、レイアウト解析部93に読出され、レイアウト解析
が行なわれて、解析の結果得られたレイアウト構成要素
に関する情報は格納部92に格納される。
【0165】上記レイアウト解析により得られたレイア
ウト構成要素と原画像データにより表示データが作成さ
れ、表示管理部96により表示部97に表示され、その
表示内容に対し、レイアウト認識で誤ったブロックの領
域、行の領域、文字領域などのレイアウト構成要素があ
れば、オペレータにより操作部98から訂正操作入力が
行なわれると、文字認識部94にて訂正されたレイアウ
ト構成要素の情報と原画像に基づいて文字認識が行なわ
れ、その認識結果は格納部92に格納される。
【0166】最終的に得られた文字認識結果としての文
書データは出力部99により外部に出力される。
【0167】なお、上記第1乃至第2の実施の形態にお
いては、いずれも文書画像が横書きであるものとして説
明したが、レイアウト解析により縦書きの文書画像であ
っても同様に適用することができることは勿論である。
【0168】その他、本発明は上記各実施の形態に限定
されるものではなく、その要旨を逸脱しない範囲内で種
々変形して実施することが可能であるものとする。
【0169】
【発明の効果】請求項1記載の発明によれば、レイアウ
ト認識技術により得られたレイアウト構成要素に関する
情報に基づき、文章領域中の任意文字列に対する編集を
行なう際に、より見やすい状態としてユーザの指示にし
たがった任意の編集操作を可能として、編集作業を円滑
に効率よく行なうことができる。
【0170】請求項2記載の発明によれば、上記請求項
1記載の発明の効果に加えて、文書画像データの構成が
より見やすい状態で表示、選択可能であるため、編集の
範囲や位置を確認することが容易となる。
【0171】請求項3記載の発明によれば、上記請求項
1記載の発明の効果に加えて、レイアウト解析で得られ
た文書画像に対する修正操作をより容易に行なうことが
できる。
【0172】請求項4記載の発明によれば、上記請求項
1記載の発明の効果に加えて、文書画像データを構成す
る各画像ブロック毎に独立したファイルとして格納する
ために、編集作業で内容に変化を生じた画像ブロックに
対応するファイルのみ格納されているデータを書換える
ようにすればよいので、文書画像データの取扱いが容易
となる。
【0173】請求項5記載の発明によれば、上記請求項
1記載の発明の効果に加えて、例えば文書画像データに
対する添削画像等を添付画像データとして合わせて格納
し、必要に応じて文書画像データのみを出力するか、添
付画像データを合わせて出力するかを選択することが可
能となる。
【0174】請求項6記載の発明によれば、ポインティ
ングデバイス等により文書画像データの任意領域を指定
した上でその領域内の文書画像による文字認識を実行さ
せ、得た認識結果を用いて編集動作に移行することがで
きるため、認識結果を他のレイアウト構成要素と同様に
編集処理することが可能となる。
【0175】請求項7記載の発明によれば、レイアウト
認識技術によるレイアウト情報を有効に用いて、文書画
像に含まれる文章領域中の任意文字列範囲を指定した上
でその指定範囲の文字認識を行なうことで、より高い認
識率を得て誤認識を極力排除し、認識結果を有効に編集
に活用することが可能となる。
【0176】請求項8記載の発明によれば、上記請求項
7記載の発明の効果に加えて、レイアウト情報を修正し
た上でそれに基づいた任意の文字列による文字認識を行
なわせることができるため、文字の認識率をより向上さ
せることが可能となる。
【0177】請求項9記載の発明によれば、レイアウト
認識技術により得られたレイアウト構成要素に関する情
報に基づき、文章領域中の任意文字列に対する編集を行
なう際に、より見やすい状態としてユーザの指示にした
がった任意の編集操作を可能として、編集作業を円滑に
効率よく行なわせることができる。
【0178】請求項10記載の発明によれば、ポインテ
ィングデバイス等により文書画像データの任意領域を指
定した上でその領域内の文書画像による文字認識を実行
させ、得た認識結果を用いて編集動作に移行させること
ができるため、認識結果を他のレイアウト構成要素と同
様に編集処理することが可能となる。
【0179】請求項11記載の発明によれば、レイアウ
ト認識技術によるレイアウト情報を有効に用いて、文書
画像に含まれる文章領域中の任意文字列範囲を指定した
上でその指定範囲の文字認識を行なわせることで、より
高い認識率を得て誤認識を極力排除し、認識結果を有効
に編集に活用させることが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る文書画像編集
装置の構成を示すブロック図。
【図2】同実施の形態に係る入出力される文書画像デー
タを例示する図。
【図3】同実施の形態に係る文書画像編集全体の処理内
容を示すフローチャート。
【図4】同実施の形態に係る画像編集の詳細な処理内容
を示すフローチャート。
【図5】同実施の形態に係る画像編集の詳細な処理内容
を示すフローチャート。
【図6】同実施の形態に係る画像編集の詳細な処理内容
を示すフローチャート。
【図7】同実施の形態に係る動作時の表示画面を例示す
る図。
【図8】同実施の形態に係る動作時の表示画面を例示す
る図。
【図9】同実施の形態に係るレイアウト解析結果の他の
表示例を示す図。
【図10】同実施の形態に係るレイアウト解析結果の他
の表示例を示す図。
【図11】同実施の形態に係る他の動作例1でのレイア
ウト解析結果を例示する図。
【図12】同実施の形態に係る他の動作例2でのブロッ
ク領域の修正、追加動作を例示する図。
【図13】同実施の形態に係る他の動作例2でのブロッ
ク領域の統合と分割の修正動作を例示する図。
【図14】同実施の形態に係る他の動作例2での行領域
の統合の修正動作を例示する図。
【図15】同実施の形態に係る他の動作例2での行領域
の分割の修正動作を例示する図。
【図16】同実施の形態に係る他の動作例2での文字画
像領域の統合の修正動作を例示する図。
【図17】同実施の形態に係る他の動作例2での文字画
像領域の分割の修正動作を例示する図。
【図18】同実施の形態に係る他の動作例2での文字画
像領域の他の修正動作を例示する図。
【図19】同実施の形態に係る他の動作例2での文字画
像領域の分割の他の修正動作を例示する図。
【図20】同実施の形態に係る他の動作例2での文字画
像領域の統合の他の修正動作を例示する図。
【図21】本発明の第2の実施の形態に係る文書画像編
集装置の構成を示すブロック図。
【符号の説明】
11…画像入力部 12…画像格納部 13…レイアウト解析部 14…画像処理部 15…操作入力部 16…表示管理部 17…表示部 18…画像出力部 21…テキスト領域 22…写真領域 23…表示画面 24…ブロック領域 31…指定文字列 32…文字列 33…空白行 41…ブロック枠 42…行枠 51…テキスト領域 52…領域 53…枠 54〜59…ブロック 61…領域 62〜64…行 65…カーソル 66…(分割位置を表わす)破線 71…領域 72〜74…文字画像 75…カーソル 76…(分割位置を表わす)破線 81…行枠81 82,83…文字領域間の線 84…カーソル 85…文字領域間の線 91…画像入力部 92…格納部 93…レイアウト解析部 94…文字認識部 95…文書処理部 96…表示管理部 97…表示部 98…操作入力部 99…出力部 P…紙面

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】文書画像データのレイアウト構成を解析す
    るレイアウト解析手段と、 このレイアウト解析手段より得られるレイアウト情報と
    上記文書画像データから表示用データを生成して表示す
    る表示手段と、 ユーザ入力の受付けを行なう操作入力手段と、 この操作入力手段より上記文書画像データ中の複数ブロ
    ックで構成された文章部分中の任意文字列範囲が指定さ
    れた際にその指定された文字列範囲を他の文字列と区分
    して表示する表示制御手段と、 この表示制御手段で区分して表示した文字列範囲に対し
    て上記操作入力手段より編集の指示入力がなされた場合
    にその編集処理を実行する編集処理手段とを具備したこ
    とを特徴とする文書画像編集装置。
  2. 【請求項2】上記表示手段は、上記レイアウト解析手段
    で得られるレイアウト情報に基づいて上記文書画像デー
    タをブロック、行及び文字の各単位でそれぞれ識別可能
    に表示し、且つ選択可能とすることを特徴とする請求項
    1記載の文書画像編集装置。
  3. 【請求項3】上記レイアウト解析手段は、上記操作入力
    手段により上記レイアウト解析手段で得た文書画像デー
    タのレイアウト情報をブロック、行または文字のいずれ
    かの単位で分割または統合するべく指示入力がなされた
    場合に、その指示入力に従ってレイアウト情報を修正す
    ることを特徴とする請求項1記載の文書画像編集装置。
  4. 【請求項4】上記レイアウト解析手段がレイアウト構成
    を解析するための文書画像データを格納しておく画像格
    納手段をさらに具備し、 この画像格納手段は、文書画像データを画像ブロック毎
    にファイル化して格納することを特徴とする請求項1記
    載の文書画像編集装置。
  5. 【請求項5】上記レイアウト解析手段がレイアウト構成
    を解析するための文書画像データを格納しておく画像格
    納手段をさらに具備し、 この画像格納手段は、文書画像データに添付する添付画
    像データを合わせて格納し、 上記操作入力手段での選択入力により文書画像データに
    対する添付画像データの出力の有無を設定することを特
    徴とする請求項1記載の文書画像編集装置。
  6. 【請求項6】文書画像データから表示用データを生成し
    て表示する表示手段と、 ユーザ入力の受付けを行なう操作入力手段と、 この操作入力手段より上記表示手段で表示される文書画
    像の任意領域が指定された際にその指定された領域中の
    文書画像の文字認識を行なう文字認識手段と、 この文字認識手段で得た文字認識結果を上記操作入力手
    段での編集の指示入力に応じて文書画像中の任意の位置
    で編集処理する編集処理手段とを具備したことを特徴と
    する文書画像編集装置。
  7. 【請求項7】文書画像データのレイアウト構成を解析す
    るレイアウト解析手段と、 このレイアウト解析手段より得られるレイアウト情報と
    上記文書画像データから表示用データを生成して表示す
    る表示手段と、 ユーザ入力の受付けを行なう操作入力手段と、 この操作入力手段より上記文書画像データ中の複数ブロ
    ックで構成された文章部分中の任意文字列範囲が指定さ
    れた際にその指定された文字列範囲を他の文字列と区分
    して表示する第1の表示制御手段と、 この第1の表示制御手段で区分して表示した文字列範囲
    に対して文字認識処理を行なう文字認識手段と、 この文字認識手段で得た文字認識結果を上記指定された
    文字列範囲に代えて表示させる第2の表示制御手段とを
    具備したことを特徴とする文書画像編集装置。
  8. 【請求項8】上記レイアウト解析手段は、上記操作入力
    手段により上記レイアウト解析手段で得た文書画像デー
    タのレイアウト情報をブロック、行または文字のいずれ
    かの単位で分割または統合するべく指示入力がなされた
    場合に、その指示入力に従ってレイアウト情報を修正す
    ることを特徴とする請求項7記載の文書画像編集装置。
  9. 【請求項9】文書画像データのレイアウト構成を解析
    し、解析して得たレイアウト情報と上記文書画像データ
    から表示用データを生成して表示する際、 上記文書画像データ中の複数ブロックで構成された文章
    部分中の任意文字列範囲が指定されるとその指定された
    文字列範囲を他の文字列と区分して表示し、 区分して表示した文字列範囲に対して編集の指示入力が
    なされるとその編集処理を実行することを特徴とする文
    書画像編集方法。
  10. 【請求項10】文書画像データから表示用データを生成
    して表示する際、 表示される文書画像の任意領域が指定されるとその指定
    された領域中の文書画像の文字認識を行ない、 得た文字認識結果を用い、編集の指示入力に応じて文書
    画像中の任意の位置で編集処理することを特徴とする文
    書画像編集方法。
  11. 【請求項11】文書画像データのレイアウト構成を解析
    し、解析して得たレイアウト情報と上記文書画像データ
    から表示用データを生成して表示する際、 上記文書画像データ中の複数ブロックで構成された文章
    部分中の任意文字列範囲が指定されるとその指定された
    文字列範囲を他の文字列と区分して表示し、区分して表
    示した文字列範囲に対して文字認識処理を行ない、 得た文字認識結果を上記指定された文字列範囲に代えて
    表示させることを特徴とする文書画像編集方法。
JP2000087884A 2000-03-28 2000-03-28 文書画像編集装置及び文書画像編集方法 Pending JP2001273509A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000087884A JP2001273509A (ja) 2000-03-28 2000-03-28 文書画像編集装置及び文書画像編集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000087884A JP2001273509A (ja) 2000-03-28 2000-03-28 文書画像編集装置及び文書画像編集方法

Publications (1)

Publication Number Publication Date
JP2001273509A true JP2001273509A (ja) 2001-10-05

Family

ID=18603831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000087884A Pending JP2001273509A (ja) 2000-03-28 2000-03-28 文書画像編集装置及び文書画像編集方法

Country Status (1)

Country Link
JP (1) JP2001273509A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006251987A (ja) * 2005-03-09 2006-09-21 Oki Data Corp データ処理手段およびそれを備えた印刷処理システム
JP2007199919A (ja) * 2006-01-25 2007-08-09 Infocity Inc 画像処理装置および方法
JP2010218466A (ja) * 2009-03-18 2010-09-30 Ricoh Co Ltd 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体
JP2018142286A (ja) * 2017-02-28 2018-09-13 シナノケンシ株式会社 電子図書製作用プログラム
KR20190084051A (ko) * 2016-11-14 2019-07-15 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 계층화된 콘텐츠 선택

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006251987A (ja) * 2005-03-09 2006-09-21 Oki Data Corp データ処理手段およびそれを備えた印刷処理システム
JP4545618B2 (ja) * 2005-03-09 2010-09-15 株式会社沖データ データ処理方法、データ処理装置およびそれを用いる印刷処理システム
JP2007199919A (ja) * 2006-01-25 2007-08-09 Infocity Inc 画像処理装置および方法
JP2010218466A (ja) * 2009-03-18 2010-09-30 Ricoh Co Ltd 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体
KR20190084051A (ko) * 2016-11-14 2019-07-15 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 계층화된 콘텐츠 선택
JP2019536156A (ja) * 2016-11-14 2019-12-12 マイクロソフト テクノロジー ライセンシング,エルエルシー レイヤード・コンテンツの選択
JP7100637B2 (ja) 2016-11-14 2022-07-13 マイクロソフト テクノロジー ライセンシング,エルエルシー レイヤード・コンテンツの選択
KR102468164B1 (ko) * 2016-11-14 2022-11-16 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 계층화된 콘텐츠 선택
JP2018142286A (ja) * 2017-02-28 2018-09-13 シナノケンシ株式会社 電子図書製作用プログラム

Similar Documents

Publication Publication Date Title
US5734761A (en) Editing scanned document images using simple interpretations
US8788936B2 (en) Information processing apparatus and method
JP2005174260A (ja) 文書処理装置及び文書処理方法
JP2001101164A (ja) 文書画像処理装置及び文書画像処理方法
JP2001101435A (ja) 文書画像処理装置文書画像処理方法
JP2006262442A (ja) 画像編集装置と画像編集方法
JP2001273509A (ja) 文書画像編集装置及び文書画像編集方法
US7272784B2 (en) Form processing method, form processing program, and form processing apparatus
JP2001118077A (ja) 文書作成装置および文書作成方法
JP3965836B2 (ja) 画像処理システム
JP2007086823A (ja) 情報処理装置、制御方法、およびプログラム
US9104649B2 (en) Information processing apparatus and program
JP3607913B2 (ja) 画像表示装置
JP2000227914A (ja) 文書編集装置
JP3598594B2 (ja) 文書処理装置及び文書処理方法
JP2008090789A (ja) 文書管理システム、文書管理方法、文書管理プログラム及びその記憶媒体
JPS60118885A (ja) ワ−ドプロセツサ
JP2004139142A (ja) 情報処理装置、その制御方法、制御プログラムを提供する媒体、及び制御プログラム
JP4756149B2 (ja) フォトアルバム作成システム及びフォトアルバム作成コンピュータプログラム
JP2009015717A (ja) 帳票作成装置及び帳票作成方法、プログラム及び記憶媒体
JP2800254B2 (ja) 画像一文字処理装置
JP3154790B2 (ja) 光学的文字読取装置
JP4376753B2 (ja) 印刷データ処理装置、印刷システム、ページデータへのオブジェクト合成方法、およびプログラム
US20080222082A1 (en) Information processing apparatus, information processing method, and information processing program
JP2001184349A (ja) 文書編集装置および文書編集方法および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070403

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070604

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070918