JP2003085164A - 文書出力装置、方法及びコンピュータプログラム - Google Patents

文書出力装置、方法及びコンピュータプログラム

Info

Publication number
JP2003085164A
JP2003085164A JP2001271409A JP2001271409A JP2003085164A JP 2003085164 A JP2003085164 A JP 2003085164A JP 2001271409 A JP2001271409 A JP 2001271409A JP 2001271409 A JP2001271409 A JP 2001271409A JP 2003085164 A JP2003085164 A JP 2003085164A
Authority
JP
Japan
Prior art keywords
document
text
character image
image
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001271409A
Other languages
English (en)
Inventor
Shinichi Mori
真一 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xelo Inc
Original Assignee
Xelo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xelo Inc filed Critical Xelo Inc
Priority to JP2001271409A priority Critical patent/JP2003085164A/ja
Publication of JP2003085164A publication Critical patent/JP2003085164A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文字画像を編集可能なデータに変換するに
は、データのコンバート処理などの処理を行う必要があ
り、大変煩わしかった。 【解決手段】 指示検出部11が、所定のポータブル・
ドキュメント・フォーマット文書に対する単一の支持操
作による変換指示を検出すると、テキスト変換部17
が、ポータブル・ドキュメント・フォーマット文書に含
まれる当該文字画像をテキストに変換し、表示制御部1
8が、変換されたテキスト文書を表示出力するようにし
た。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、簡単な操作によ
り、文字画像を編集可能なテキストデータへ変換して出
力する技術に関する。特に、ポータブルドキュメントフ
ォーマット文書を編集可能なテキスト文書へ変換して出
力する際に好適な技術に関する。
【0002】
【従来の技術】近年、コンピュータの普及により、文書
の電子化が進んでいる。文書を電子化するにあたって、
最近では、PDF(Portable Document Format)が多用
されている。このPDFファイルは、相手のコンピュー
タの機種や環境によらず、オリジナルの画像をかなりの
程度正確に再生することができるという優れた特徴をも
っている。
【0003】
【発明が解決しようとしている課題】しかし、PDF
は、画像データを含んでおり、この画像データは直接そ
の内容を編集できない。そのため、PDF文書を編集す
る場合、利用者が所定のコンバートプログラム等を用い
て、PDF文書を一旦リッチテキスト等に変換し、それ
から利用者が編集を行うための所定のワープロプログラ
ム等を起動させて、当該ワープロプログラムの形式に変
換してから、文書の編集を行う必要があり、この処理が
大変煩わしかった。
【0004】また、文書の編集を行う際、文字部分だけ
でなく図形等の画像を含めた文書全体のレイアウトが重
要となるが、従来のようにPDF文書中の文字画像部分
だけをテキストデータとして抜き出して編集したので
は、テキスト文書の編集はできても、文書全体のレイア
ウトを考慮した編集はできなかった。
【0005】本発明は、上記実情に鑑みてなされたもの
で、文字画像を簡単な操作で、編集可能なデータへ変換
して出力することができる技術を提供することを目的と
する。
【0006】
【課題を解決するための手段】本発明第1の観点にかか
る文書出力装置は、少なくとも文字画像を含むポータブ
ルドキュメントフォーマットの文書に対して、当該文書
のテキスト文書を作成する旨の単一の指示操作がされた
ことを検出する検出手段と、上記指示操作の検出を契機
に、当該ポータブルドキュメントフォーマットの文書に
含まれる文字画像をテキスト文書に変換する変換手段
と、上記変換したテキスト文書を編集可能な形態で出力
する出力手段と、を有することを特徴とする。
【0007】上記出力手段は、上記変換したテキスト文
書を上記ポータブルドキュメントフォーマットの文書に
重畳し、この重畳した文書のうちテキスト文書について
は編集可能な形態で出力してもよい。また、上記出力手
段は、上記ポータブルドキュメントフォーマット文書中
の各文字画像に個々の文字と対応するテキスト文書を重
畳し、この重畳した文書のうちテキスト文書については
編集可能な形態で出力してもよい。また、上記出力手段
は、ポータブルドキュメントフォーマット中の文字画像
部分を非表示とし、当該文字画像を表示していた領域
に、当該文字画像を変換したテキスト文書を編集可能に
表示するようにしてもよい。
【0008】上記出力手段は、テキスト文書を、上記文
字画像とは異なる態様で所定の表示装置に表示させるよ
うにしてもよい。また、上記ポータブルドキュメントフ
ォーマットの文書に含まれる文字画像の領域、図形画像
の領域その他の領域のレイアウトを判定するレイアウト
判定手段をさらに有し、上記変換手段は、上記レイアウ
ト判定手段により文字画像の領域と判定された領域に対
して上記の変換処理を行うようにしてもよい。また、出
力手段は、所定の文書作成プログラムを起動し、当該文
書作成プログラムに、上記変換されたテキスト文書を編
集可能な形態で出力させるようにしてもよい。
【0009】本発明の第2の観点にかかる文書出力装置
は、少なくとも文字画像を含む所定形式で表現される画
像に対して、単一の指示操作による当該画像のテキスト
文書に変換する指示がされたことを検出する検出手段
と、上記指示操作の検出を契機に、上記画像に含まれる
文字画像をテキスト文書に変換する変換手段と、上記変
換したテキスト文書を編集可能な形態で出力する出力手
段と、を有することを特徴とする。
【0010】また、上記出力手段は、画像中の文字画像
データ部分を非表示とし、当該文字画像を表示していた
領域に当該文字画像を変換したテキスト文書を編集可能
に表示するようにしてもよい。また、上記出力手段は、
変換したテキスト文書を画像中の対応する文字画像に重
畳し、当該テキスト文書については編集可能に表示し、
所定の指示操作がなされたことを検出すると、上記文字
画像については非表示とするようにしてもよい。
【0011】本発明の一の観点にかかかる文書出力方法
は、所定のコンピュータでコンピュータプログラムを読
み込ませることにより、上記コンピュータで、少なくと
も文字画像を含む所定の画像に対して、単一の指示操作
による当該画像のテキスト変換の指示がされたことを検
出する処理と、上記指示の検出を契機に、上記画像に含
まれる文字画像をテキストに変換する処理と、変換した
テキストを、編集可能な形態で出力する処理と、を実行
することを特徴とする。
【0012】本発明の一の観点にかかるコンピュータプ
ログラムは、少なくとも文字画像を含む所定の画像に対
して、単一の指示操作による当該画像のテキスト変換の
指示がされたことを検出する処理と、上記指示の検出を
契機に、上記画像に含まれる文字画像をテキストに変換
する処理と、変換したテキストを、編集可能な形態で出
力する処理と、をコンピュータに実行させるためのもの
であることを特徴とする。
【0013】
【発明の実施の形態】以下、図面を参照して本発明にか
かる実施形態を説明する。 <第1実施形態>本実施形態では、PDF文書をテキスト
文書に変換して出力する場合の例を説明する。図1は、
本発明にかかる文書出力装置の一実施形態を示した図で
ある。図1において、文書出力装置1は、利用者がPD
F文書に含まれる文字画像をテキスト文書として出力さ
せるために使用する装置であって、CPU(CentralPro
cessing Unit)と、コンピュータ装置のハードディス
ク、RAM、ROM等に記憶されたプログラムにより、
図1に示した機能ブロックが実現されている。この図1
に示した機能ブロックは、画像ファイル記憶部11、辞
書記憶部12、プログラム記憶部13、文書情報記憶部
14、指示検出部15、レイアウト判定部16、テキス
ト変換部17、表示制御部18から構成されている。
【0014】画像ファイル記憶部11は、変換対象とな
るPDF文書ファイルを記憶することができる記憶装置
である。このPDF文書は、文字画像だけを含むもので
もよいし、文字画像とそれ以外の画像(例えば、図形画
像等)を含んでもよい。
【0015】辞書記憶部12は、文字画像をテキストデ
ータに変換する際に参照される情報を記憶するデータベ
ースである。具体的には、辞書記憶部12には、例え
ば、個々の文字画像と、当該文字のテキストデータがそ
れぞれ対応付けられて記憶されている。
【0016】プログラム記憶部13は、種々の処理を行
うためのプログラムを記憶することができる記憶装置で
ある。この記憶されるプログラムとしては、例えば、P
DF文書を表示するためのプログラムや、文書作成プロ
グラムとしてのワープロプログラムなどを含む。
【0017】文書情報記憶部14は、変換後の文書情報
を記憶するための記憶装置である。この文書情報記憶部
14に記憶されるデータの一例を図2に示す。図2に示
すように、文書情報記憶部14には、例えば、当該変換
対象となった画像のファイル名と、変換後のテキスト
と、画像中での当該テキストの表示位置を表す座標が、
それぞれ対応付けられて記憶されている。この座標は、
例えば、画像の縦方向にX軸、横方向にY軸を定めて、
これに基づいてXY座標を表すことができる。
【0018】指示検出部15は、利用者が特定したPD
F文書に対する変換指示を検出する。この変換指示の検
出は、例えば、指示検出部15が、所定のPDF文書を
表示した状態で、利用者が所定の「変換」指示を表すア
イコン等を、ワンクリック等の単一の指示操作により指
示したか否かを検出することにより行う。なお、単一の
指示操作とは、本明細書では、アイコン等をワンクリッ
クすることだけでなく、アイコン等をダブルクリックす
る場合など、ある一つの処理の実行を指示するための一
連の操作を含む。
【0019】レイアウト判定部16は、上記検出部15
による変換指示の検出を契機に、指定されたPDF文書
に含まれる文字画像の領域、図形画像の領域その他の領
域のレイアウトを判定する。この判定処理は、例えば、
レイアウト判定部16が、画像処理により画像全体のヒ
ストグラムを作成し、当該ヒストグラムの特徴から、各
領域のレイアウトを判定してもよい。なお、この判定処
理は、領域のレイアウトが判定できる処理であれば、ヒ
ストグラムを用いた処理に限定されない。また、この判
定処理を行う際、レイアウト判定部16が、読み込んだ
画像の向き判定、傾き補正、ノイズデータの除去等の処
理を行うようにしてもよい。また、レイアウト判定部1
6は、文字画像領域の判定を行う前に、指定されたファ
イルが、画像ファイルか、それともテキストファイルか
など、ファイルの種類を判定するようにしてもよい。
【0020】テキスト変換部17は、特定されたPDF
文書中の文字画像をテキストに変換する。このテキスト
変換処理は、例えば、テキスト変換部17が、辞書記憶
部12を参照して、当該文字画像の特徴から、これに最
も近い特徴を有するテキストに変換するようにしてもよ
い。また、レイアウト判定部16が予め文字画像領域を
判定した場合には、テキスト変換部17は、当該文字画
像領域に対してだけ、このテキスト変換処理を行うよう
にしてもよい。また、テキスト変換部17は、テキスト
変換処理を行う際に、各文字画像ごとに当該文書上での
座標を特定し、特定した座標及び当該変換したテキスト
データを、当該画像ファイル名に対応付けて、文書情報
記憶部14に記憶してもよい。
【0021】表示制御部18は、画像ファイル11に記
憶されている所定のPDF文書を表示することができ
る。このPDF文書の表示は、例えば、表示制御部18
が、プログラム記憶部13に記憶されている所定の画像
表示プログラムを起動することにより行うことができ
る。
【0022】また、表示制御部18は、テキスト変換部
17により変換されたテキストを、PDF文書に重畳さ
せて表示し、このテキスト文書を編集可能な状態で出力
する。編集可能な状態とは、変換されたテキストを修
正、変更、削除等の処理が可能な状態をいう。また、重
畳させて表示する際には、例えば、表示制御部18が、
文書情報記憶部14を参照して、PDF文書中の各文字
画像に個々の文字と対応するテキスト文書が重なるよう
に重畳させて表示してもよい。
【0023】また、テキスト文書を表示する際には、文
字画像とは異なる態様でテキストを表示してもよい。こ
の態様としては、例えば文字画像を表示している色とは
異なる所定の色又は、異なる所定のフォントでテキスト
を表示してもよいし、また文字画像とは異なる所定のサ
イズでテキストを表示してもよい。このように異なる態
様でテキストを表示する場合、利用者が所定の設定ダイ
アログボックスから、テキストを表示する際の色やフォ
ント、サイズ等を設定できるようにし、当該指定された
態様で表示するようにしてもよい。
【0024】また、表示制御部18は、テキスト変換部
17により変換されたテキスト文書を、プログラム記憶
部13に記憶されている所定の文書作成プログラムを起
動させて、編集可能な形態で出力させるようにしてもよ
い。この際、表示制御部18は、例えば、プログラム記
憶部13に記憶されている文書作成プログラムとしての
ワープロプログラムを起動させて、このワープロプログ
ラムにより、テキスト文書を当該ワープロフォーマット
に変換させて、編集可能な状態で表示等させてもよい。
【0025】次に、本実施形態の文書出力装置1を使用
した文書出力方法について、図3を参照して説明する。
まず、図4に示すように、表示制御部18が、PDF表
示プログラムを起動させて、画像ファイル記憶部11に
記憶されている所定のPDF文書を所定の表示装置に表
示しているものとする。この状態で、指示検出部14
は、図4の画面に表示された変換機能を表すアイコン
(図4ではアイコン100)が、利用者によりワンクリ
ックなどの単一の指示操作により指示されたか否かを判
定する(S1)。利用者から指示がない場合は、指示検
出部11はこの処理を繰り返す。一方、この状態で、利
用者からの指示がされると、指示検出部15は、この単
一の指示操作を検出する。
【0026】指示検出部11による単一の指示操作の検
出を契機に、レイアウト判定部16は、指定された文書
がPDF文書か、それともテキスト文書かを判定する
(S2)。判定の結果、PDF文書である場合には、レ
イアウト判定部16が、当該PDF文書に含まれる文字
画像の領域、図形画像の領域その他の領域のレイアウト
を判定する(S3)。例えば、図4の例では、点線で図
示した領域P1からP3の各領域を文字画像領域と判定
し、その他のP4の領域等は図形等のその他の領域と判
定する。
【0027】レイアウト判定部16により文字画像領域
と判定された領域がある場合には、テキスト変換部17
は、当該領域の文字画像をテキストに変換する(S
4)。この変換は、例えば、テキスト変換部17が、辞
書記憶部12を参照して、辞書記憶部12の文字画像の
うち最も特徴が近似する文字のテキストを特定すること
などにより行う。また、テキスト変換部17は、変換対
象となる各文字画像の座標を特定する。そして、各文字
毎に、この座標と変換したテキストとを、当該PDF文
書のファイル名に対応付けて文書情報記憶部14に記憶
する(S5)。なお、この保存を行う際、例えば、変換
後のテキストをリッチテキスト形式等で保存してもよ
い。
【0028】表示制御部18は、文書記憶部14を参照
して、変換後のテキスト文書を、PDF文書上に重畳
し、当該テキスト文書を編集可能な形態で表示する(S
6)。テキスト文書を重畳させて表示する場合、表示制
御部18は、文字情報記憶部14の各文字の座標を参照
して、PDF文書中の各文字画像上に、個々の文字と対
応するテキスト文書を重畳して表示してもよい。また、
テキストの表示態様が設定されている時は、表示制御部
18は、当該設定に従って、当該テキスト文字を、文字
画像の表示態様とは異なる態様(色、フォント、大きさ
など)で表示してもよい。
【0029】次に、この状態で表示制御部18は、利用
者が図示しない「編集実行」のアイコンを指示したか否
かを判定する(S7)。利用者により「編集実行」の指
示がなされると、表示制御部18は、プログラム記憶部
13に記憶されてる文書作成プログラムとしてのワープ
ロプログラムを起動させて、当該ワープロプログラムに
より文書情報記憶部14に保存されているテキスト文書
(例えば、リッチテキスト)を編集可能な形態で出力表
示させる(S8)。
【0030】この状態で、利用者が文書の編集を終了し
て「文書保存」が指示されると、ワープロプログラム
は、当該編集された文書を所定のフォーマットで文書情
報記憶部14に保存し(S9)、処理を終了する。
【0031】また、上記S7でワープロによる「編集実
行」指示されない場合は、表示制御部18が、利用者に
より編集されたテキスト文書を文書情報記憶部14に保
存して、処理を終了する。
【0032】また、上記S2で特定された変換対象ファ
イルが、PDF文書ではなく、テキスト文書であると判
定された場合には、上述のS5以下の処理を行う。
【0033】このように、本実施形態によれば、指示検
出部15が、少なくとも文字画像を含むのPDF文書に
対するワンクリックによる変換指示を検出したことを契
機に、テキスト変換部17が当該PDF文書中の文字画
像をテキストデータに変換し、変換されたテキストデー
タを表示制御部18により編集可能な形態で表示出力す
ることができる。これにより、利用者は、ワンクリック
という極めて簡単な操作を行うだけで、PDF文書を編
集可能なテキスト文書に変換して出力できる。
【0034】また、表示制御手段18が、変換後のテキ
ストを、変換対象となった元のPDF文書上に重畳させ
て表示するようにすれば、元のPDF文書のレイアウト
を参照しながら、テキスト文書の編集を行うことができ
る。またこの際、テキスト文書の各文字を、個々の文字
画像上に重畳させて表示すれば、PDF文書と変換後の
テキスト文書の対応関係をより明らかにすることがで
き、PDF文書を参照してテキストの編集を容易に行う
ことができる。
【0035】さらに、表示制御部18が、変換後のテキ
スト文書を、PDF文書とは異なる態様で表示すること
により、テキスト文書とPDF文書とを明確に区別する
ことができる。
【0036】レイアウト判定部16により、PDF文書
中の文字領域を判別することにより、テキスト変換部1
7は当該文字領域と判定された領域に対してのみ変換処
理を行えばよいこととなり、効率的にテキスト変換処理
を行うことができる。
【0037】表示制御部18により、変換されたテキス
トを所定のワープロプログラムを起動させて編集可能に
表示することにより、PDF文書を簡単な操作でワープ
ロ文書のような文書編集が可能な状態で表示出力するこ
とができる。
【0038】<第2実施形態>次に、第2の実施形態に
ついて説明する。第1実施形態では、表示制御部18が
PDF文書上に、変換したテキストを重畳させて表示す
る例について説明したが、テキスト文書を出力する際、
表示制御部18がPDF文書中の文字画像部分を非表示
とし、当該文字画像を表示していた領域に当該文字画像
を変換したテキスト文書を編集可能に表示するようにし
てもよい。なお、本明細書で文字画像データ部分を非表
示とするとは、例えば、文字画像データを欠落させるこ
とにより文字画像を表示しないようにする場合だけでな
く、当該文字画像を透明とする場合を含む。
【0039】この場合、表示制御部18は、図3の処理
フローのS6の画面表示処理を行う際、PDF文書を非
表示とすると共に、文書情報記憶部14に記録されてい
る文字画像の座標を参照して、変換したテキスト文書を
当該文字画像を表示していた領域に表示させる。その他
の処理の流れは、図3の処理フローと同じである。
【0040】このような実施形態によっても、上述の実
施形態と同様に、文書全体のレイアウトを参照しなが
ら、テキスト文書の編集を行うことができる。
【0041】<第3実施形態>次に、第3の実施形態に
ついて説明する。第2の実施形態では、文字画像を非表
示としてテキスト文書のみを表示する例について説明し
たが、本実施形態では、表示制御部18が、変換したテ
キスト文書を、一旦PDF文書中の対応する文字画像に
重畳し、当該テキスト文書を利用者が編集可能に表示す
ると共に、利用者により文字画像を非表示とする旨の所
定の指示操作がなされたことを検出すると、PDF文書
中の文字画像を非表示とする例である。
【0042】この場合の文字出力方法を図5に従って説
明する。なお、第1実施形態の図3の処理フローのうち
同一の処理については同一の符号を付して説明を省略す
る。本実施形態では、テキスト変換部17により文字画
像がテキスト文書へ変換されると、表示制御部18が、
変換したテキスト文書を画像中の対応する文字画像に重
畳し、当該テキスト文書については編集可能に表示する
(S61)。この状態で、表示制御部18は、利用者から
文書画像を非表示とする旨の指示が成されたか否かを判
別する(S62)。なお、この利用者からの指示は、例
えば、「文書画像非表示」を表すアイコン等を利用者が
指示したか否かを検出することにより行ってもよい。利
用者が表示されたテキスト文書を編集するなどして、文
書画像を非表示とする旨の指示を行うと、表示制御部1
8は、PDF画像のうち文字画像部分を非表示とする
(S63)。そして、この状態で、利用者がテキスト文
書の内容を確認し、テキスト文書を保存するなどして処
理を終了する。
【0043】このように第3の実施形態によれば、表示
制御部18により一旦PDF文書とテキスト文書とを重
畳して表示した後、PDF文書の文字画像だけを非表示
とすることから、利用者はPDF文書を参照してテキス
ト文書の編集を行うことができるし、また編集後はPD
F文書を非表示として、当該編集後のテキスト文書を対
応するPDF文書の文字画像を表示していた領域に表示
することで文書全体のレイアウトを確認することができ
る。また、PDF文書にテキスト文書を重畳して表示す
ることから、テキスト変換の誤り等も容易に発見でき
る。
【0044】上述の第1から第3の実施形態では、変換
対象となるPDF文書を表示した状態からテキストへの
変換を行う例について説明したが、本発明はこれに限定
されるものではない。例えば、変換を行うPDF文書の
内容は表示せずに、指示検出部15が当該PDF文書の
ファイル名が指示されたことを検出したことにより、上
述の変換処理を行ってもよい。
【0045】また、上述の第1から第3の実施形態で
は、レイアウト判定部16により、PDF文書中から文
字画像領域を抽出するようにしたが、この処理を行うか
否かは任意である。また、上述の各実施形態では、利用
者からの指示により表示制御部18がワープロプログラ
ムを起動させる例を説明したが、利用者からの指示が無
くとも自動的に所定のワープロプログラムを起動させ
て、変換されたテキスト文書をワープロプログラムを用
いて編集可能に表示してもよい。また、単一の指示操作
を検出したことにより、PDF文書にテキスト文書を重
畳させて表示させずに、直ちにワープロプログラムを起
動させて、変換されたテキストを当該ワープロプログラ
ムにより編集可能に出力させるようにしてもよい。
【0046】上述の第1から第3の実施形態では、PD
F文書を変換してテキスト文書を出力する例について説
明したが、本発明はPDF文書に限定されるものでな
く、他の形式の文書画像であってもよい。
【0047】上述の第1から第3の実施形態の文書出力
装置1は、専用装置によらず、汎用のコンピュータとコ
ンピュータプログラムを用いて実現可能である。例え
ば、汎用のコンピュータに対して上述の動作を実行する
ためのコンピュータプログラムやこれを格納したコンピ
ュータ読み取り可能な媒体(FD、CD−ROM等)か
らコンピュータプログラムをインストールすることによ
り上述の処理を実行する文書出力装置1を構成するよう
にしてもよい。なお、上述の機能をOS(Operating Sy
stem)が分担又はOSとアプリケーションプログラムの
共同により実現する場合等には、OS以外の部分のみを
コンピュータプログラムとして、またこのコンピュータ
プログラムをコンピュータ読み取り可能な媒体に格納し
てもよい。
【0048】また、文書出力装置1用のコンピュータプ
ログラムを搬送波に重畳し、通信ネットワークを介して
配信することも可能である。例えば、通信ネットワーク
の掲示板(BBS)に当該プログラムを掲示し、これを
ネットワークを介して配信するようにしてもよい。そし
て、このコンピュータプログラムを起動し、OS制御下
で他のアプリケーションプログラムと同様に実行させる
ことにより上述の処理を実行させるようにしてもよい。
【0049】
【発明の効果】本発明によれば、簡単な操作で、文書画
像を編集可能なデータに変換し、出力することができ
る。
【図面の簡単な説明】
【図1】 本発明の一実施形態にかかる文書出力装置の
概略構成を示した図。
【図2】 本発明の一実施形態にかかる文書情報記憶部
のデータ構造の例を示した図。
【図3】 本発明の一実施形態にかかる文書出力方法の
処理フロー。
【図4】 本発明の一実施形態にかかる画像の表示画面
の例を示した図。
【図5】 本発明の別の実施形態にかかる文書出力方法
の処理フロー。
【符号の説明】
1 文書出力装置 15 指示検出部 16 レイアウト判定部 17 テキスト変換部 18 表示制御部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも文字画像を含むポータブルド
    キュメントフォーマットの文書に対して、当該文書のテ
    キスト文書を作成する旨の単一の指示操作がされたこと
    を検出する検出手段と、 上記指示操作の検出を契機に、当該ポータブルドキュメ
    ントフォーマットの文書に含まれる文字画像をテキスト
    文書に変換する変換手段と、 上記変換したテキスト文書を編集可能な形態で出力する
    出力手段と、 を有することを特徴とする文書出力装置。
  2. 【請求項2】 上記出力手段は、上記変換したテキスト
    文書を上記ポータブルドキュメントフォーマットの文書
    に重畳し、この重畳した文書のうちテキスト文書につい
    ては編集可能な形態で出力する、 請求項1記載の文書出力装置。
  3. 【請求項3】 上記出力手段は、上記ポータブルドキュ
    メントフォーマット文書中の各文字画像に個々の文字と
    対応するテキスト文書を重畳し、この重畳した文書のう
    ちテキスト文書については編集可能な形態で出力する、 請求項2記載の文書出力装置。
  4. 【請求項4】 上記出力手段は、ポータブルドキュメン
    トフォーマット中の文字画像部分を非表示とし、当該文
    字画像を表示していた領域に、当該文字画像を変換した
    テキスト文書を編集可能に表示する、請求項1記載の文
    書出力装置。
  5. 【請求項5】 上記出力手段は、テキスト文書を、上記
    文字画像とは異なる態様で所定の表示装置に表示させる
    請求項1乃至4のいずれかに記載の文書出力装置。
  6. 【請求項6】 上記ポータブルドキュメントフォーマッ
    トの文書に含まれる文字画像の領域、図形画像の領域そ
    の他の領域のレイアウトを判定するレイアウト判定手段
    をさらに有し、 上記変換手段は、上記レイアウト判定手段により文字画
    像の領域と判定された領域に対して上記の変換処理を行
    う、 請求項1乃至5のいずれかの項に記載の文書出力装置。
  7. 【請求項7】 出力手段は、所定の文書作成プログラム
    を起動し、当該文書作成プログラムに、上記変換された
    テキスト文書を編集可能な形態で出力させる、 請求項1記載の文書出力装置。
  8. 【請求項8】 少なくとも文字画像を含む所定形式で表
    現される画像に対して、単一の指示操作による当該画像
    のテキスト文書に変換する指示がされたことを検出する
    検出手段と、 上記指示操作の検出を契機に、上記画像に含まれる文字
    画像をテキスト文書に変換する変換手段と、 上記変換したテキスト文書を編集可能な形態で出力する
    出力手段と、 を有することを特徴とする文書出力装置。
  9. 【請求項9】 上記出力手段は、画像中の文字画像デー
    タ部分を非表示とし、当該文字画像を表示していた領域
    に当該文字画像を変換したテキスト文書を編集可能に表
    示する、請求項8記載の文書出力装置。
  10. 【請求項10】 上記出力手段は、変換したテキスト文
    書を画像中の対応する文字画像に重畳し、当該テキスト
    文書については編集可能に表示し、 所定の指示操作がなされたことを検出すると、上記文字
    画像については非表示とする請求項8記載の文書出力装
    置。
  11. 【請求項11】 所定のコンピュータでコンピュータプ
    ログラムを読み込ませることにより、 上記コンピュータで、 少なくとも文字画像を含む所定の画像に対して、単一の
    指示操作による当該画像のテキスト変換の指示がされた
    ことを検出する処理と、 上記指示の検出を契機に、上記画像に含まれる文字画像
    をテキストに変換する処理と、 変換したテキストを、編集可能な形態で出力する処理
    と、 を実行することを特徴とする文書出力方法。
  12. 【請求項12】 少なくとも文字画像を含む所定の画像
    に対して、単一の指示操作による当該画像のテキスト変
    換の指示がされたことを検出する処理と、 上記指示の検出を契機に、上記画像に含まれる文字画像
    をテキストに変換する処理と、 変換したテキストを、編集可能な形態で出力する処理
    と、 をコンピュータに実行させるためのコンピュータプログ
    ラム。
JP2001271409A 2001-09-07 2001-09-07 文書出力装置、方法及びコンピュータプログラム Pending JP2003085164A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001271409A JP2003085164A (ja) 2001-09-07 2001-09-07 文書出力装置、方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001271409A JP2003085164A (ja) 2001-09-07 2001-09-07 文書出力装置、方法及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2003085164A true JP2003085164A (ja) 2003-03-20

Family

ID=19096924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001271409A Pending JP2003085164A (ja) 2001-09-07 2001-09-07 文書出力装置、方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2003085164A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011210065A (ja) * 2010-03-30 2011-10-20 Fujifilm Corp ファイル通信システムおよびその動作制御方法
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
JP2016009395A (ja) * 2014-06-25 2016-01-18 京セラドキュメントソリューションズ株式会社 文書ファイル生成装置及び文書ファイル生成方法
JP2020086718A (ja) * 2018-11-20 2020-06-04 トッパン・フォームズ株式会社 文書データ変更装置、文書データ変更方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
JP2011210065A (ja) * 2010-03-30 2011-10-20 Fujifilm Corp ファイル通信システムおよびその動作制御方法
JP2016009395A (ja) * 2014-06-25 2016-01-18 京セラドキュメントソリューションズ株式会社 文書ファイル生成装置及び文書ファイル生成方法
JP2020086718A (ja) * 2018-11-20 2020-06-04 トッパン・フォームズ株式会社 文書データ変更装置、文書データ変更方法

Similar Documents

Publication Publication Date Title
US7464336B2 (en) Information processing apparatus, image edit apparatus, and control methods thereof, and computer program and computer-readable storage medium
JP2005174026A (ja) 情報処理装置及びその制御方法、プログラム
JP2005536783A (ja) pdfドキュメントのセクション抽出ツール
US7793224B1 (en) Methods and apparatus for formatting identified content
JP2003085164A (ja) 文書出力装置、方法及びコンピュータプログラム
JP2009204710A (ja) 触覚提示装置及び触覚提示方法
JP4305325B2 (ja) 付箋情報処理方法、付箋情報処理システム及び付箋情報処理プログラム
JP3564317B2 (ja) 文書表示方法及び表示装置
JPH06149465A (ja) 手書き入力装置
JP2001005806A (ja) 文字入力装置及び入力制御方法
JP3674905B2 (ja) 文書編集装置
JP2005311729A (ja) ファイル名作成装置及びファイル名作成プログラム
JP2004220621A (ja) データ表示装置及び方法及びデータ表示プログラムを記録した記録媒体
JPH11265397A (ja) 記憶媒体、情報アクセス方法、および情報アクセス装置
JP2002269495A (ja) 文字認識装置および文字認識プログラム
JPH04333966A (ja) 文書データ処理装置
JPH08129543A (ja) 文書処理装置および文書処理装置の文書処理方法
JP2845742B2 (ja) カットデータ情報管理装置
JP2973906B2 (ja) キャラクタ・ユーザ・インタフェース装置
JP2001296945A (ja) アプリケーション起動制御装置
JPH07129372A (ja) アプリケーション構築システム
JP2009258848A (ja) 上書画像処理方法及び情報処理装置
JPH06274588A (ja) マルチメディア情報処理方法
JPH05233611A (ja) 文書処理装置
JPH10188016A (ja) ドキュメントリーダ及びドキュメントリーダにおけるレイアウト解析ならびに修正処理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040810

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041008

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060124