JP2000057069A - 情報処理装置および方法およびシステム - Google Patents

情報処理装置および方法およびシステム

Info

Publication number
JP2000057069A
JP2000057069A JP10221977A JP22197798A JP2000057069A JP 2000057069 A JP2000057069 A JP 2000057069A JP 10221977 A JP10221977 A JP 10221977A JP 22197798 A JP22197798 A JP 22197798A JP 2000057069 A JP2000057069 A JP 2000057069A
Authority
JP
Japan
Prior art keywords
data
transmission request
unit
data file
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10221977A
Other languages
English (en)
Inventor
Yasumasa Sakai
康真 坂井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10221977A priority Critical patent/JP2000057069A/ja
Publication of JP2000057069A publication Critical patent/JP2000057069A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】文書ファイルを要求するクライアントとの通信
形態に基づいて、要求された文書ファイル中より選択的
にデータを送信することを可能とし、効率の良いデータ
送信を行う。 【解決手段】S41で外部装置よりデータファイルの送
信要求を受信すると、S42で当該受信がモデムを介し
たか否かを判定する。モデムを介した受信であった場合
は、S43で当該送信要求によって特定されるデータフ
ァイルを取得するとともに、当該データファイルよりテ
キストデータを抽出する。送信要求において要約を行う
旨の指示が無ければ、S46において、抽出されたテキ
ストデータをそのまま送信要求の発行元へ送信する。一
方、要約を行う旨が指定されていれば、S44、S45
において要約処理を施し、S46で、得られたテキスト
データを送信要求の発行元へ送信する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書の蓄積、検索な
どに利用されるドキュメントサーバシステムを実現する
ための情報処理装置および方法およびシステムに関する
ものである。
【0002】
【従来の技術】従来より、文書の共有利用を図るために
ドキュメントサーバをLAN上に設けて情報共有を図っ
てきた。例えば、ファイルサーバに所定のデータフォー
マット(例えば、Microsoft社のWORD(商標)のデ
ータフォーマット)の文書ファイルを置いておくといっ
たような単純な構成のドキュメントサーバによっても情
報共有の目的は達せられる。
【0003】
【発明が解決しようとする課題】しかしながら、例えば
WORD(商標)で作成した文書ファイルをクライアン
トからアクセスして参照するためには、クライアント装
置側にある程度以上のCPUパワーや表示能力が要求さ
れる。また外出時にモデムで接続してファイルを参照し
ようとすると、大きなWORD(商標)ファイルの場合
にはその表示までにかなりの時間がかかることが多い。
また、クライアントによっては、十分な表示能力がない
ので、テキスト内容だけを見たいという場合もある。こ
のように文書ファイルのテキストだけを参照したいとい
う場合であっても、当該文書ファイルの全体にアクセス
する必要がある。例えば、イメージ等の全ての内容の入
ったWORD(商標)ファイルにアクセスする必要があ
り、時間の浪費が避けられない。
【0004】また、クライアント側装置にWORD(商
標)のアプリケーションプログラムがインストールされ
ていなければ、送信された文書ファイルデータを見るこ
ともできない。
【0005】本発明は上記の問題に鑑みてなされたもの
であり、文書ファイルを要求するクライアントとの通信
形態に基づいて、要求された文書ファイル中より選択的
にデータを送信することを可能とし、効率の良いデータ
送信を実現することにある。
【0006】また、本発明の他の目的は、文書ファイル
を要求するクライアントが処理可能なデータフォーマッ
トに変換して文書ファイルの送信を行うことを可能とす
ることにある。
【0007】
【課題を解決するための手段】上記の目的を達成するた
めの本発明の情報処理装置は例えば以下の構成を備え
る。すなわち、外部装置よりデータファイルの送信要求
を通信手段を介して受信する受信手段と、前記送信要求
によって特定されるデータファイルを取得する取得手段
と、前記送信要求を受信した際の前記通信手段の通信形
態に基づいて、前記取得手段で取得されたデータファイ
ルより送信すべきデータを抽出する抽出手段と、前記抽
出手段で抽出されたデータを前記送信要求の送信元へ前
記通信手段を介して送信する送信手段とを備える。
【0008】また、好ましくは、前記通信手段は、第1
通信部と、該第1通信部よりも低速な通信を行う第2通
信部を有し、前記抽出手段は、前記受信手段が前記第2
通信部を介して前記送信要求を受信した場合には、特定
されたデータファイルのテキストの属性を有する領域よ
りテキストデータを抽出する。
【0009】また、好ましくは、前記受信手段が前記第
1通信部を介して前記送信要求を受信した場合、前記取
得手段で取得されたデータファイルを所定の汎用データ
フォーマットへ変換する変換手段を更に備え、前記送信
手段は、前記変換手段で変換されたデータファイルを送
信する。
【0010】また、本発明によれば、上記情報処理装置
をドキュメントサーバとして用いた情報処理システムが
提供される。また、本発明によれば、上記情報処理装置
において実現される情報処理方法が提供される。
【0011】また、本発明によれば、上記情報処理方法
をコンピュータに実現させるための制御プログラムを格
納した記憶媒体が提供される。
【0012】
【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な実施形態を説明する。
【0013】図1は本実施形態によるドキュメントサー
バシステムの構成を表す図である。図1において、11
はパーソナルコンピュータ(以下、パソコンと略す)に
よって構成されるドキュメントクライアント、12は同
様にパソコンサーバなどにより構成されるドキュメント
サーバである。13は画像を読み込むためのスキャナ、
14はデータに基づく画像を記録紙へ印刷するためのプ
リンタである。また、15は、インターネットを介して
接続されるドキュメントクライアントとしてのパソコン
である。
【0014】図2は本実施形態によるドキュメントサー
バの構成を示すブロック図である。21はLAN回線、
22はアナログ回線でそれぞれドキュメントサーバへの
データの出入り口となる。23はネットワークインター
フェイスカード(NIC)であり、LAN回線21上と
のデータのやり取りを行う。24はモデムでありシリア
ルポートコントローラ25に接続されている。モデム2
4はアナログ回線22との間でデータのやり取りを行
う。
【0015】26はシステムバスであり、各構成要素間
の相互のデータ交換はここを通じて行われる。27はハ
ードディスクコントローラであり、ハードディスクドラ
イブ28をコントロールする。ハードディスク28には
イメージとして読み込まれたドキュメントデータや、そ
れらに対して領域分割、文字認識、画像の圧縮処理を加
えて元画像を再現可能なフォーマットに変換して得られ
るデータが蓄積される。また、添付のフローチャートを
参照して後述する制御手順を実現するための制御プログ
ラムもハードディスク28に格納される。29はRAM
であり、様々な処理を実行するためのプログラムロード
エリア、或いは処理のためのワークエリアとして使われ
る。30はマイクロプロセッサユニット(MPU)であ
り、RAM29にロードされたプログラムにより種々の
処理を実行する。
【0016】図3は本実施形態のドキュメントサーバ1
2におけるドキュメント登録時の処理を表すフローチャ
ートである。
【0017】まず、ステップS31において、スキャナ
13などにより読み込まれたイメージファイルの読み込
み処理を行う。読み込まれたイメージファイルはハード
ディスク28に一時蓄積される。次に、ステップS32
において、そのイメージファイルに対して領域分割処理
を加え、イメージデータをテキスト、図、表の領域に分
割する。なお、上記のような領域分割処理は周知である
ので、ここでは説明を省略する。
【0018】次に、ステップS33〜ステップS38に
より、領域分割されて得られた各領域に対して処理を行
う。まず、ステップS33において、領域分割処理によ
って得られた分割領域のうちの1つを選択し、ステップ
S34においてその選択された分割領域の属性を判定す
る。当該分割領域のイメージデータがテキストを表すと
判定された場合はステップS35へ進み、テキストイメ
ージに対して文字認識処理を行う。この処理においては
文字間、行間の認識の他に文字フォントの認識までも行
うことも可能である。
【0019】また、ステップS34において当該分割領
域のイメージデータが図を表すと判定された場合は、ス
テップS36に進み、当該イメージデータに対して圧縮
処理を行う。この際、図が白黒2値の画像の場合にはH
M,MR或いはMMR圧縮を行い、カラー(グレーを含
む)の場合にはJPEG圧縮をかける。
【0020】更に、ステップS34において当該分割領
域のイメージデータが表であると判定された場合は、ス
テップS37へ進み、表解析を行う。これは表の行数、
列数の取得、ならびに変則的な表に対してはダミーセル
を追加して表解析しやすい表への変換処理を含んでい
る。なお、このような処理には周知の表解析処理を適用
できる。
【0021】ステップS38では、領域分割処理で得ら
れたすべての分割領域に対して、上記のステップS35
〜S37のいずれかの処理が施された否かを判定する。
まだ未処理の分割領域が存在するならば、ステップS3
3へ戻り、未処理の分割慮域を選択して上記処理を繰り
返す。こうしてすべての分割領域について処理を終える
と、ステップS39へ進む。
【0022】ステップS39では、以上の処理によって
得られた各分割領域のデータに基づいて元の画像を再構
築できるデータフォーマットへ編集し、文書ファイルと
して登録する。
【0023】図4は上記ステップS39で構築されるデ
ータフォーマットを説明する図である。101は読み込
んだイメージデータに対して領域分割処理を施した様子
を示している。図4の例では、領域分割処理の結果、2
つのテキスト領域(#1、#3ブロック)、図領域(#
2ブロック)および表領域(#4ブロック)に分割され
たことを表している。102は文書ファイルであり、イ
メージデータ101に基づいてステップS39で構築さ
れる文書ファイルのデータ構成例を示している。図示の
ように、各分割領域(以下ブロック)について、データ
の種類を表す「属性」と、データの内容である「デー
タ」と、当該ブロックの位置および大きさを示す「位置
/サイズ」を格納している。
【0024】例えば、#1ブロックはテキストの領域で
あり、「属性」には「テキスト」が与えられる。そし
て、その「データ」の欄には、ステップS35の文字認
識処理によって得られた文字コード、フォント/書式
(行間等)情報が格納されることになる。また、「位置
/サイズ」の欄には、イメージデータ101上の#1ブ
ロックの位置を示す情報(例えば左上と右下の座標値)
が格納される。
【0025】また、#2ブロックは図の領域であるの
で、「属性」にはステップS36の圧縮処理に適用した
圧縮方式を示す情報が格納される。本例では、JPEG
方式を採用しており、従って「属性」の欄に「JPE
G」と格納されている。そして、当該ブロックのデータ
の欄には、ステップS36で得られたJPEG圧縮デー
タが格納される。
【0026】また、#4のブロックは表の領域であるの
で、「属性」の欄には「テーブル」という属性が付与さ
れ、「データ」の欄にはステップS37による表解析の
結果が格納される。例えば、表組み(縦×横のセル数)
や各セル内のデータ(文字認識によって得られた文字コ
ードデータ)が格納される。
【0027】なお、ここで採用される文書ファイルのデ
ータフォーマットはステップS35、S36、S37で
生成されたデータを用いて読み込んだイメージの再構築
を行えればよく、上記のフォーマットに限定されるもの
ではない。
【0028】次に、クライアントから文書検索要求を受
けた場合の本実施形態のドキュメントサーバの動作を説
明する。図5は本実施形態のドキュメントサーバがクラ
イアントから文書検索要求を受けたときの処理手順を示
すフローチャートである。
【0029】まず、ステップS41において要求元のク
ライアントがどの回線で接続してきて、どのような要求
を出してきているかを確認する。本実施形態ではモデム
24(アナログ回線22)とNIC23(LAN回線2
1)のどちらの回線を経て要求を受けたかを判定するこ
とになる。
【0030】図6は本実施形態による文書要求コマンド
のデータ構成例を表す図である。文書要求コマンド60
0には、転送すべき文書ファイルを特定する文書ファイ
ル名601とそのデータ形態602を指定する情報が付
加される。データ形態602には、文書ファイル内のテ
キストデータに関して要約処理を行うか否かを指定した
り、ファイル形式をRTF(リッチテキストファイル)
に変換するか否か、或いはHTML(ハイパーテキスト
マークアップ言語)に変換するか否かを指定する情報が
記述される。なお、要約処理も周知であるので説明は省
略する。
【0031】ステップS42では、当該文書要求がモデ
ム接続によって受信されたのか否かを判断し、モデム接
続の場合にはステップS43へ進む。本実施形態の場
合、モデム接続によって文書ファイルが要求された場合
は、(1)要求元へ低速なアナログ回線を用いてデータ
を送ることになるため、また、(2)モバイルコンピュ
ータのようにそれほどCPUパワーの無いコンピュータ
へデータを送る可能性が高いため、要求された文書ファ
イルからテキストデータのみを抽出して送信する。
【0032】ステップS43では、指定された文書ファ
イルからテキストデータを抽出する。例えば図4で説明
したようなデータフォーマットを有する文書ファイルで
あれば、属性がテキストとなっているブロックのデータ
からテキストデータのみを抽出する。次に、ステップS
44において、文書要求コマンド内のデータ形態602
を参照することにより、要求元が要約処理を必要として
いるかを判断する。そして、要約処理が必要な場合はス
テップS44に進み、ステップS43で抽出したテキス
トデータに対して要約処理を行う。なお、要約処理は分
割されたブロック毎に行っても、テキストの全体にわた
って行ってもよい。
【0033】そして、ステップS46において、ステッ
プS45で得られた要約されたテキストデータをシリア
ルポートコントローラ25、モデム24を介して要求元
へ送信する。
【0034】一方、文書要求コマンドにおいて要約処理
が指定されていない場合には、ステップS44からステ
ップS46へそのまま進み、ステップS43で抽出した
テキストデータをシリアルポートコントローラ25、モ
デム24を介して要求元(クライアント)へ送信する。
【0035】さて、当該文書要求コマンドの発行元であ
るクライアントがLAN接続であった場合には、ステッ
プS42からステップS47へ進む。LAN回線を経由
してデータを送る場合には、(1)高速なデータ転送が
行える、(2)接続されている機器が据置型の高いCP
Uパワーを備えている可能性が高いとして、本実施形態
では、文書ファイルの全体を送信するものとする。
【0036】まず、ステップS47において、文書要求
コマンドによって指定された文書ファイルのデータを読
み出す。そして、ステップS48において、当該要求コ
マンドのデータ形態602を参照して、RTF、HTM
Lのいずれかへの変換要求が指示されているかを判定す
る。なお、図5では示していないが、データ形式の変換
が指示されていなければそのままのデータフォーマット
で要求元のクライアントへ当該文書ファイルを送信する
ものとする。
【0037】例えば、HTMLへのフォーマット変換が
指示されている場合、ステップS48からステップS4
9へ進む。ステップS49では、ステップS47で読み
出した文書ファイルのデータフォーマットを、HTML
形式に変換する。そして、ステップS51において、得
られたHTML形式のデータファイルをNIC23、L
AN回線22を介して要求元のクライアントへ送信す
る。なお、HTML変換処理では、文書ファイルの構築
時において「図」のブロックの画像データはJPEG圧
縮されているので、HTML変換時には特に画像の圧縮
方法を変える必要はない。
【0038】一方、RTFへのフォーマット変換が指示
されている場合はステップS48からステップS50へ
進む。ステップS50では、ステップS47で読み出し
た文書ファイルのデータフォーマットをRTF形式に変
換する。そして、ステップS51において、得られたR
TF形式のデータファイルをNIC23、LAN回線2
2を介して要求元のクライアントへ送信する。なお、ス
テップS50のRTF変換処理の場合には、RTFが図
の部分の画像データフォーマットとしてJPEG等の圧
縮形式をサポートしていないので、JPEG形式のデー
タをビットマップデータ(BMPデータ)へ変換する必
要がある。
【0039】以上述べたように上記実施形態によれば、
モデム接続されたクライアントにはテキスト情報のみが
提供されるので、比較的非力なCPUパワーのクライア
ントでもストレスなく文書の内容を読み出すことができ
るようになる。また、要約処理を使えば、小さなLCD
パネルしか持たないような表示能力の小さいクライアン
トでも当該文書の概要をすばやく把握できるようにな
る。又、LAN接続されたクライアントに対してはRT
FやHTMLで送ることにより、WORDフォーマット
で送る場合よりも小さなデータ量でレイアウト情報まで
も送れるのでLAN上のトラフィックの低減に役立つ。
【0040】なお、上記実施形態では文書ファイルの登
録処理としてスキャナから読み取ったイメージデータを
登録する場合を説明した。しかしながら、登録対象とな
るデータはこれに限られるものではなく、例えばWOR
D(登録商標)で作成された文書データを解析して図4
に示すような文書ファイルへ変換し、登録することも可
能である。
【0041】また、上記実施形態では、モデム接続によ
る文書要求であった場合は必ずテキストを選択するが、
モデム接続による場合もLAN接続と同様にデータ形態
602における指示内容に従ってデータ形態を決定して
もよい。なお、その場合、モデム接続でデータ形態に関
する指示が無い場合は指定された文書ファイル中のテキ
ストのみを送信し、LAN接続でデータ形態に関する指
示が無い場合は指定された文書ファイルをそのままのデ
ータ形式で送信するというように構成してもよいであろ
う。
【0042】更に、LAN接続の場合であっても、要約
処理の要否を選択できるように構成することも可能であ
る。
【0043】また、上記実施形態では、要求元との接続
形態でデータ形式(テキストのみとするか否か)を決め
ている。これは、要求コマンドを受信した接続形態で指
定された文書ファイルを要求元へ送るからである。従っ
て、指定された文書ファイルの送信先との接続形態に基
づいてデータ形式を決定してもよい。このようにすれ
ば、例えば、LAN回線で接続されたコンピュータから
アナログ回線で接続されたコンピュータへ文書ファイル
を送信する旨の指示を受けた場合、アナログ回線で接続
されたコンピュータに対してテキストのみのデータ形式
で送信することになる。
【0044】<他の実施形態>上記実施形態では、要求
元のクライアントとの接続形態により、送信すべきデー
タはサーバ側が決定している。しかしながら、図4に示
すようなデータフォーマットの文書ファイルであれば、
クライアント側から必要とするデータの属性を指定する
ことも可能である。例えば、図4の文書ファイルのうち
の「図」のみを受信するということが可能である。
【0045】図7は他の実施形態による要求コマンドの
データ構成を示す図である。図7において、603は要
求データ属性であり、当該要求コマンドで要求するデー
タ属性を指定する。なお、この要求データ属性603に
おいて属性が指定されていない場合は、当該文書ファイ
ルの全データを送信するものとする。
【0046】図8は他の実施形態によるドキュメントサ
ーバがクライアントから文書検索要求を受けたときの処
理手順を示す図である。
【0047】ステップS61において要求コマンドを受
信すると、ステップS62において、当該要求コマンド
の文書ファイル名601を参照して指定されている文書
ファイルを獲得する。次に、ステップS63において、
当該要求コマンドの要求データ属性603を参照し、送
信すべきデータの属性を判定する。
【0048】要求データ属性603がテキストを指定し
ている場合は、ステップS64において、ステップS6
2で獲得した文書ファイルからテキストデータを抽出し
て(テキストの属性を有するブロックのデータを抽出す
る)、ステップS67でこれを要求元のクライアントへ
送信する。このデータ送信には、LAN回線もしくはア
ナログ回線が用いられる。
【0049】また、ステップS63において、要求デー
タ属性603が「図」を指定していると判定された場合
は、ステップS65へ進み、ステップS62で獲得した
文書ファイルから図の属性を有するブロック(図4にお
いて、属性の欄にJPEGが記述されているブロック)
のデータを抽出して、これをステップS67で送信す
る。
【0050】更に、ステップS63において、要求デー
タ属性603が「表」を指定していると判定された場合
は、ステップS66へ進み、ステップS62で獲得した
文書ファイルから表の属性を有するブロック(図4にお
いて、属性の欄に「テーブル」が記述されているブロッ
ク)のデータを抽出して、これをステップS67で送信
する。
【0051】以上のように構成すれば、文書中の所望の
属性を有したデータを得ることが可能となる。
【0052】なお、本発明は、複数の機器(例えばホス
トコンピュータ,インタフェイス機器,リーダ,プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
【0053】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0054】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0055】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0056】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0057】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0058】
【発明の効果】以上説明したように、本発明によれば、
文書ファイルを要求するクライアントとの通信形態に基
づいて、要求された文書ファイル中より選択的にデータ
を送信することが可能となり、効率の良いデータ送信が
行える。
【0059】また、本発明によれば、文書ファイルを要
求するクライアントが処理可能なデータフォーマットに
変換して文書ファイルの送信を行うことが可能となる。
【0060】
【図面の簡単な説明】
【図1】本実施形態によるドキュメントサーバシステム
の構成を表す図である。
【図2】本実施形態によるドキュメントサーバの構成を
示すブロック図である。
【図3】本実施形態のドキュメントサーバ12における
ドキュメント登録時の処理を表すフローチャートであ
る。
【図4】上記ステップS39で構築されるデータフォー
マットを説明する図である。
【図5】本実施形態のドキュメントサーバがクライアン
トから文書検索要求を受けたときの処理手順を示すフロ
ーチャートである。
【図6】本実施形態による文書要求コマンドのデータ構
成例を表す図である。
【図7】他の実施形態による要求コマンドのデータ構成
を示す図である。
【図8】他の実施形態によるドキュメントサーバがクラ
イアントから文書検索要求を受けたときの処理手順を示
す図である。
【符号の説明】
21 LAN回線 22 アナログ回線 23 ネットワークインターフェイスカード 24 モデム 25 シリアルポートコントローラ 26 システムバス 27 ハードディスクコントローラ 28 ハードディスクドライブ 29 RAM 30 マイクロプロセッサ

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 外部装置よりデータファイルの送信要求
    を通信手段を介して受信する受信手段と、 前記送信要求によって特定されるデータファイルを取得
    する取得手段と、 前記送信要求を受信した際の前記通信手段の通信形態に
    基づいて、前記取得手段で取得されたデータファイルよ
    り送信すべきデータを抽出する抽出手段と、 前記抽出手段で抽出されたデータを前記送信要求の送信
    元へ前記通信手段を介して送信する送信手段とを備える
    ことを特徴とする情報処理装置。
  2. 【請求項2】 前記データファイルは、文書データをテ
    キスト、図、表等の属性毎に領域分割して格納してお
    り、各領域を単位としたデータ抽出が可能であり、 前記抽出手段は、前記送信要求を受信した前記受信手段
    の通信形態に基づいて抽出すべき属性を決定し、該決定
    された属性の領域のデータを抽出することを特徴とする
    請求項1に記載の情報処理装置。
  3. 【請求項3】 前記通信手段は、第1通信部と、該第1
    通信部よりも低速な通信を行う第2通信部を有し、 前記抽出手段は、前記受信手段が前記第2通信部を介し
    て前記送信要求を受信した場合には、特定されたデータ
    ファイルのテキストの属性を有する領域よりテキストデ
    ータを抽出することを特徴とする請求項2に記載の情報
    処理装置。
  4. 【請求項4】 前記抽出手段で抽出されたテキストデー
    タについて要約を施す要約手段を更に備えることを特徴
    とする請求項3に記載の情報処理装置。
  5. 【請求項5】 前記受信手段が前記第1通信部を介して
    前記送信要求を受信した場合、前記取得手段で取得され
    たデータファイルを所定の汎用データフォーマットへ変
    換する変換手段を更に備え、 前記送信手段は、前記変換手段で変換されたデータファ
    イルを送信することを特徴とする請求項3に記載の情報
    処理装置。
  6. 【請求項6】 文書イメージデータを解析して、テキス
    ト、図、表等の分割領域へ分割する分割手段と、 前記分割領域毎の位置と内容を示すデータで構成される
    データファイルを生成する生成手段と、 前記生成手段で生成されたデータファイルを文書データ
    ベースに登録する登録手段とを更に備えることを特徴と
    する請求項1に記載の情報処理装置。
  7. 【請求項7】 外部装置よりデータファイルの送信要求
    を通信手段を介して受信する受信工程と、 前記送信要求によって特定されるデータファイルを取得
    する取得工程と、 前記送信要求を受信した際の前記通信工程の通信形態に
    基づいて、前記取得工程で取得されたデータファイルよ
    り送信すべきデータを抽出する抽出工程と、 前記抽出工程で抽出されたデータを前記送信要求の送信
    元へ前記通信手段を介して送信する送信工程とを備える
    ことを特徴とする情報処理方法。
  8. 【請求項8】 前記データファイルは、文書データをテ
    キスト、図、表等の属性毎に領域分割して格納してお
    り、各領域を単位としたデータ抽出が可能であり、 前記抽出工程は、前記送信要求を受信した前記受信工程
    の通信形態に基づいて抽出すべき属性を決定し、該決定
    された属性の領域のデータを抽出することを特徴とする
    請求項7に記載の情報処理方法。
  9. 【請求項9】 前記通信手段は、第1通信部と、該第1
    通信部よりも低速な通信を行う第2通信部を有し、 前記抽出工程は、前記受信工程が前記第2通信部を介し
    て前記送信要求を受信した場合には、特定されたデータ
    ファイルのテキストの属性を有する領域よりテキストデ
    ータを抽出することを特徴とする請求項8に記載の情報
    処理方法。
  10. 【請求項10】 前記抽出工程で抽出されたテキストデ
    ータについて要約を施す要約工程を更に備えることを特
    徴とする請求項9に記載の情報処理方法。
  11. 【請求項11】 前記受信工程が前記第1通信部を介し
    て前記送信要求を受信した場合、前記取得工程で取得さ
    れたデータファイルを所定の汎用データフォーマットへ
    変換する変換工程を更に備え、 前記送信工程は、前記変換工程で変換されたデータファ
    イルを送信することを特徴とする請求項3に記載の情報
    処理方法。
  12. 【請求項12】 文書イメージデータを解析して、テキ
    スト、図、表等の分割領域へ分割する分割工程と、 前記分割領域毎の位置と内容を示すデータで構成される
    データファイルを生成する生成工程と、 前記生成工程で生成されたデータファイルを文書データ
    ベースに登録する登録工程とを更に備えることを特徴と
    する請求項7に記載の情報処理方法。
  13. 【請求項13】 請求項1乃至6のいずれかに記載の情
    報処理装置をドキュメントサーバとして用いた情報処理
    システム。
  14. 【請求項14】 コンピュータをドキュメントサーバと
    して動作させるための制御プログラムを格納した記憶媒
    体であって、該制御プログラムが、 外部装置よりデータファイルの送信要求を通信手段を介
    して受信する受信工程のコードと、 前記送信要求によって特定されるデータファイルを取得
    する取得工程のコードと、 前記送信要求を受信した際の前記通信工程の通信形態に
    基づいて、前記取得工程で取得されたデータファイルよ
    り送信すべきデータを抽出する抽出工程のコードと、 前記抽出工程で抽出されたデータを前記送信要求の送信
    元へ前記通信手段を介して送信する送信工程のコードと
    を備えることを特徴とする記憶媒体。
JP10221977A 1998-08-05 1998-08-05 情報処理装置および方法およびシステム Withdrawn JP2000057069A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10221977A JP2000057069A (ja) 1998-08-05 1998-08-05 情報処理装置および方法およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10221977A JP2000057069A (ja) 1998-08-05 1998-08-05 情報処理装置および方法およびシステム

Publications (1)

Publication Number Publication Date
JP2000057069A true JP2000057069A (ja) 2000-02-25

Family

ID=16775148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10221977A Withdrawn JP2000057069A (ja) 1998-08-05 1998-08-05 情報処理装置および方法およびシステム

Country Status (1)

Country Link
JP (1) JP2000057069A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010517174A (ja) * 2007-01-25 2010-05-20 マイクロソフト コーポレーション ストリーミング可能な対話的レンダリング非依存のページレイアウト
JP2014016897A (ja) * 2012-07-10 2014-01-30 Ricoh Co Ltd サービス提供システム、情報蓄積装置、情報処理装置、方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010517174A (ja) * 2007-01-25 2010-05-20 マイクロソフト コーポレーション ストリーミング可能な対話的レンダリング非依存のページレイアウト
US8745486B2 (en) 2007-01-25 2014-06-03 Microsoft Corporation Streamable interactive rendering-independent page layout
JP2014016897A (ja) * 2012-07-10 2014-01-30 Ricoh Co Ltd サービス提供システム、情報蓄積装置、情報処理装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
US5907835A (en) Electronic filing system using different application program for processing drawing commands for printing
US6295538B1 (en) Method and apparatus for creating metadata streams with embedded device information
US7940413B2 (en) Image processing device, image forming device, image processing method, image forming method, program, and computer readable recording medium on which the program is recorded
CN100432987C (zh) 信息处理装置、履历文件作成方法和程序
US20060187496A1 (en) Digital computer and system for recording information on operations
US20030210428A1 (en) Non-OCR method for capture of computer filled-in forms
JPH0944383A (ja) ハードコピー文書と電子文書との間の変換方法及び変換装置
US8570581B2 (en) Image forming method and system using XHTML-print data
JP2002259283A (ja) データ提供装置及びデータ提供方法並びにプログラム
WO2001022199A2 (en) Method and apparatus for creating and maintaining graphic representations of documents under a universal format
US20020029242A1 (en) Image editing method and system
JP3963614B2 (ja) データ通信システムならびにデータ通信システムを構成するサーバおよびクライアント・コンピュータ
US20040054983A1 (en) Information processing apparatus, information providing apparatus, information processing system, information processing method, program, and recording medium
JP2000322425A (ja) ドキュメントサーバ装置、文書処理方法、及び記憶媒体
JP4308448B2 (ja) 出力装置に応じたコンテンツの生成
JP2000057069A (ja) 情報処理装置および方法およびシステム
JP2008310816A (ja) 複数のマークアップ・ページ・データをコンパクトに表現するシステムおよび方法
JP2004062243A (ja) クライアントサーバシステム、クライアント、サーバ、コンピュータ装置、印刷用イメージの作成方法及びプログラム
US20040088655A1 (en) Chit printing system, chit printing apparatus and chit printing method
JP2006309443A (ja) 情報処理システム、情報処理装置、情報処理端末、情報処理方法、その方法をコンピュータで実行するプログラム、および記録媒体
US20040205589A1 (en) Document display apparatus, method, and storing medium
JPH1185740A (ja) 情報処理装置及びその方法及びファクシミリ装置
JP2010092141A (ja) 画像処理システム、画像読取装置、画像処理装置および画像処理プログラム
CN113743060B (zh) 可定制的报表生成方法、装置、计算机设备及存储介质
JPH08147445A (ja) 文書管理方法及びそれを実現する文書処理装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20051101