JP2000322425A - ドキュメントサーバ装置、文書処理方法、及び記憶媒体 - Google Patents

ドキュメントサーバ装置、文書処理方法、及び記憶媒体

Info

Publication number
JP2000322425A
JP2000322425A JP11128909A JP12890999A JP2000322425A JP 2000322425 A JP2000322425 A JP 2000322425A JP 11128909 A JP11128909 A JP 11128909A JP 12890999 A JP12890999 A JP 12890999A JP 2000322425 A JP2000322425 A JP 2000322425A
Authority
JP
Japan
Prior art keywords
document
client
character recognition
text
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11128909A
Other languages
English (en)
Inventor
Yasumasa Sakai
康真 坂井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11128909A priority Critical patent/JP2000322425A/ja
Publication of JP2000322425A publication Critical patent/JP2000322425A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 モデム接続されたクライアントにおいても、
ドキュメントサーバに保存された文書の内容をより高速
度で読み出すこと。 【解決手段】 イメージとして読み込んだ文書を、テキ
ストを含む複数の属性に応じて領域分割し(S33)、
分割されたテキスト領域に対して文字認識処理を行い
(S34)、クライアントの種類及び接続方法を識別し
(S401)、識別されたクライアントの種類及びクラ
イアントからの要求に応じて、テキストに対して要約を
生成する(S406)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ドキュメントサー
バシステムに関し、更に詳しくは、LAN上に設けら
れ、文書の蓄積および検索などに利用されるドキュメン
トサーバシステムに関するものである。
【0002】
【従来の技術】従来より、文書の共有利用を図るために
ドキュメントサーバをLAN上に設けて情報共有を図っ
てきた。単純な構成のドキュメントサーバでは、クライ
アントパソコンによりスキャナで文書を読み込み、ファ
イルサーバに画像ファイルのまま保存するものがある。
このようなサーバでも情報共有の目的を達することはで
きるが、文書サーバーシステムとして市販されているも
のでは、画像ファイルに検索のためのキーワードを関連
づけて保存し、文書検索し易くしているものがある。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来例ではクライアントは画像ファイルにアクセスして文
書を参照するために、クライアントはある程度以上の性
能のCPUや表示能力を有することが要求される。また
外出時に、モデムを介してドキュメントサーバに接続し
て文書を参照する場合には、その文書の画像ファイルが
大きいとその表示までにかなりの時間がかかってしま
う。
【0004】また、カラースキャンして得られた画像フ
ァイルを、モノクロ表示しかできないディスプレイを有
するクライアントで見ようとした場合、文字の明度とそ
の背景色の明度とが近い場合には、文字と背景色との区
別がつけにくく、読み取れない場合もあった。更に、テ
キスト表示能力しかないクライアントは画像ファイルを
表示することができないので、情報共有の恩恵に預かる
ことができなかった。
【0005】また、キーワードを文書画像入力時に入力
するためには、文書をスキャンする操作の他に、キーボ
ードなどによるキーワードを入力する操作を必要として
いた。このようにして手間をかけて入れたキーワード
も、文書検索時に入力語句と全く同じ語句が使われてい
ない場合に、検索でヒットすることは難しかった。
【0006】また、クライアントの表示装置の解像度に
よっては、文書蓄積時のスキャン解像度ではクライアン
トでの文書表示に支障をきたす場合もあった。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本発明におけるドキュメントサーバ装置は、イメー
ジとして読み込んだ文書を、テキストを含む複数の属性
に応じて領域分割する領域分割手段と、前記領域分割手
段により分割されたテキスト領域に対して、文字認識処
理を行う文字認識処理手段と、前記文字認識手段により
認識されたテキストに対して要約を生成する要約生成手
段と、クライアントの種類及び接続方法を識別する識別
手段と、前記識別手段により識別されたクライアントの
種類及びクライアントからの要求に応じて、前記要約生
成手段を制御する制御手段とを有する。
【0008】好ましくは、前記領域分割手段はカラー領
域分割手段であり、テキスト領域の下地色を認識し、前
記文字認識処理手段により認識されたテキストから、特
定の下地色のついた部分の文字認識結果をキーワードと
して抽出するキーワード抽出手段を更に有する。
【0009】また好ましくは、前記制御手段は、前記識
別手段により識別されたクライアントが要約を要求して
いる場合に、前記要約生成手段を付勢する。
【0010】更に好ましくは、前記複数の属性は図を含
み、前記領域分割手段により分割された図の領域に対し
て、2値化処理を行う2値化処理手段を更に有し、前記
制御手段は、前記識別手段により識別されたクライアン
トのディスプレイが白黒表示である場合に、前記2値化
処理手段を付勢する。
【0011】更に好ましくは、前記読み込まれた文書の
解像度を変換する解像度変換手段を更に有し、前記制御
手段は、前記識別手段により識別されたクライアントの
解像度が読み込まれた文書の解像度と異なる場合に、前
記解像度変換手段を付勢する。
【0012】更に好ましくは、前記識別手段により識別
されたクライアントがモデムを介して接続されている場
合に、前記制御手段による制御を行う。
【0013】更に好ましくは、前記文字認識手段により
文字認識されたテキストに対して、自動的に文字認識の
誤りを訂正する手段を更に有する。
【0014】更に好ましくは、前記複数の属性は図を含
み、前記領域分割手段により分割された図の領域に対し
て、複数の圧縮法から1つを選択して圧縮をかける圧縮
手段を更に有する。
【0015】更に好ましくは、前記識別手段により識別
されたクライアントの接続方法に応じて、文書のフォー
マットを変換する手段を更に有する。
【0016】また、本発明の好適な一態様によれば、イ
メージとして読み込んだ文書を、テキストを含む複数の
属性に応じて領域分割する領域分割工程と、前記領域分
割工程で分割されたテキスト領域に対して、文字認識処
理を行う文字認識処理工程と、クライアントの種類及び
接続方法を識別する識別工程と、前記識別工程により識
別されたクライアントの種類及びクライアントからの要
求に応じて、前記文字認識工程で認識されたテキストに
対して要約を生成する要約生成工程とを有する。
【0017】また、好ましくは、前記領域分割工程では
カラー領域分割を行い、テキスト領域の下地色を認識
し、前記文字認識処理工程により認識されたテキストか
ら、特定の下地色のついた部分の文字認識結果をキーワ
ードとして抽出するキーワード抽出工程を更に有する。
【0018】更に好ましくは、要約生成工程では、前記
識別工程により識別されたクライアントが要約を要求し
ている場合に、要約生成処理を実行する。
【0019】更に好ましくは、前記複数の属性は図を含
み、前記領域分割工程において分割された図の領域に対
して、2値化処理を行う2値化処理工程を更に有し、前
記2値化処理工程では、前記識別工程で識別されたクラ
イアントのディスプレイが白黒表示である場合に、前記
2値化処理を実行する。
【0020】更に好ましくは、前記読み込まれた文書の
解像度を変換する解像度変換工程を更に有し、前記解像
度変換工程では、前記識別工程で識別されたクライアン
トの解像度が読み込まれた文書の解像度と異なる場合
に、前記解像度変換処理を実行する。
【0021】更に好ましくは、前記識別工程により識別
されたクライアントがモデムを介して接続されている場
合に、上記各種処理を実行する。
【0022】更に好ましくは、前記文字認識工程で文字
認識されたテキストに対して、自動的に文字認識の誤り
を訂正する工程を更に有する。
【0023】更に好ましくは、前記複数の属性は図を含
み、前記領域分割工程で分割された図の領域に対して、
複数の圧縮法から1つを選択して圧縮をかける圧縮工程
を更に有する。
【0024】更に好ましくは、前記識別工程で識別され
たクライアントの接続方法に応じて、文書のフォーマッ
トを変換する工程を更に有する。
【0025】上記構成によれば、モデム接続されたクラ
イアントには、要求に応じて要約されたテキストが配信
されるため、文書のレイアウトを再現しつつ、かつ、比
較的非力な性能のCPUのクライアントにおいても文書
の内容を従来よりも高速度で読み出すことができるよう
になる。
【0026】また、クライアントのディスプレイがモノ
クロで、サーバ上のカラー文書を参照する場合でも、文
書は適応的2値化処理が施されたモノクロ文書に変換さ
れて配信されるため、カラーの下地色が除かれた読みや
すい文書が表示されることになる。
【0027】更に、クライアントディスプレイの解像度
に応じた解像度変換がされているので、クライアント側
で極端に大きく表示されたり、小さく表示されることが
なくなり、画像の品位を保つことができる。
【0028】又、LAN接続されたクライアントに対し
てはRTFやHTMLで文書を送ることにより、WOR
Dフォーマットで送る場合に比べて小さなデータ量でレ
イアウト情報までも送ることができるので、LAN上の
トラフィックの低減に役立つ。
【0029】さらに、キーワードに予めマーカーなどを
用いて下地色を付けておくことにより、文書読み込み時
に自動的にそのキーワードが抽出されて登録されるの
で、キーボードによるキーワード入力などの手間を省く
ことができる。
【0030】
【発明の実施の形態】以下、添付図面を参照して本発明
の好適な実施の形態を詳細に説明する。
【0031】図1は本発明のドキュメントサーバシステ
ムの構成を表す図である。同図において、11はパソコ
ン等のクライアント、12は同様にパソコンサーバ等に
より構成されるドキュメントサーバ、13は画像を読み
込むためのスキャナ、14は印刷するためのプリンタで
ある。プリンタ14には、ユーザインターフェース15
が設けられており、A4原稿1ページの縮小表示が可能
な程度の解像度と大きさを持った液晶パネルが実装され
ている。また、フィニッシャ等のアクセサリ16を装備
しても良い。なお、図1においてはスキャナ13とプリ
ンタ14は異なる機器として示されているが、プリンタ
・スキャナ一体型のものを用いてもよい。17はNot
es等のグループウェアのサーバ、18はUNIXワー
クステーションなどで構成されるメールサーバ、19は
パソコン、パーソナルディジタルアシスタント(PD
A)或いは専用端末等で構成されるブラウザである。
【0032】図2は、図1に示すドキュメントサーバ1
2の構成を示すブロック図である。21はLAN等のデ
ジタル回線、22はアナログ回線で、それぞれドキュメ
ントサーバ12へのデータの出入り口となる。23はネ
ットワークインターフェースカード(NIC)である。
24はモデムで、シリアルポートコントローラー25に
接続されている。26はシステムバスであり、データの
交換はこのシステムバス26を介して行われる。
【0033】27はハードディスクコントローラーであ
り、ハードディスクドライブ28をコントロールする。
ハードディスク28にはイメージとして読み込まれたド
キュメントや、それらに対して領域分割、文字認識、画
像の圧縮処理を加えて、元画像を再現可能なフォーマッ
ト(PAF:Page Analysis Forma
t)にして蓄積するためのデータが蓄積される。また本
発明を実装したプログラムも蓄積することができる。2
9はRAMであり、様々な処理を実行するためのプログ
ラムロードエリア、或いは処理のためのワークエリアと
して使われる。210はマイクロプロセッサーユニット
(MPU)であり、プログラムに従って種々の処理を実
行する。また、211はCD−ROMドライブであり、
外部記憶媒体であるCD−ROMからプログラムやデー
タ等を読み込む。なお、外部記憶媒体はCD−ROMに
限るものではなく、CD−ROMではない場合には、C
D−ROMドライブ211の代わりに外部記憶媒体に対
応するドライブを設ければよい。
【0034】図3はドキュメント登録時における、図2
に示すドキュメントサーバの動作を表すフローチャート
である。以下、図1から図3を参照してドキュメントサ
ーバの動作を説明する。
【0035】まず、ステップS31において、スキャナ
13により読み込まれた文書の画像ファイルを、デジタ
ル回線21またはアナログ回線22を介して取得し、取
得した画像ファイルをハードディスク28に一時保存す
る。ステップS32では、ステップS31でハードディ
スク28に保存した画像ファイルに対して、カラー領域
分割処理を行う。このカラー領域分割処理では、イメー
ジは、テキスト、図、表の属性別に各領域に分割され
る。分割されたそれぞれの領域は、ステップS33にお
いてその属性毎に区別され、ステップS34以降でそれ
ぞれの属性に応じた処理が行われる。
【0036】ステップS33で、テキスト領域と区別さ
れた場合には、ステップS34へ進み、文字認識処理を
行う。この処理においては、文字間、行間の認識の他
に、文字フォントの認識を行うことも可能である。得ら
れたテキストに対して、ステップS35で言語解析によ
る訂正を行い、文字認識処理の誤りを訂正する。ステッ
プS36では、ステップS32でカラー領域分割を行う
際に、文字の下地色も同時に認識されているので、その
情報を使って、予め定められた下地色を有する文字列、
例えば、マーカーなどにより予め色を付けられた文字列
をキーワードとして抽出し、それをハードディスク28
の検索インデックス領域へ書き込む。
【0037】また、ステップS33で領域の属性が図で
あると区別された場合には、ステップS37へ進み、図
の圧縮処理を行う。この際、図が白黒2値の画像の場合
には、MH、MR或いはMMR圧縮を行い、カラー(グ
レーを含む)の場合にはJPEG圧縮を行う。
【0038】また、ステップS33で表の領域と判断さ
れた場合には、ステップS37へ進み、表解析を行う。
これには、表の行数、列数の獲得、ならびに変則的な表
に対してはダミーセルを追加して表解析しやすい表への
変換処理が含まれる。
【0039】ステップS36,S37,S38の処理が
終了すると、元の画像を再構築できるデータフォーマッ
ト(PAF)への編集をステップS39で行い、それを
ハードディスク28へ書き込んで、処理を終了する。
【0040】次に、クライアントからの文書検索要求受
け付け時の動作について説明する。
【0041】図4及び図5は、クライアントからの文書
検索要求受け付け時の、ドキュメントサーバの動作を説
明するフローチャートである。
【0042】まず、図4のステップS401で要求元の
クライアントがどの回線で接続し、どのような要求を出
しているかを確認する。なお、ここで受信する要求は、
検索要求及びそのキーワードや要約の要求など、複数の
要求を含む。次にステップS402で、受信したキーワ
ードによる検索を行う。対応する文書が無かった場合に
は(ステップS403でNO)図5のステップS417
に進み、キーワードに対応する文書が見つからなかった
旨を要求元のクライアントへ返し、処理を終了する。
【0043】また、ステップS402での検索の結果、
対応する文書があった場合には(ステップS403でY
ES)ステップS404へ進み、モデム接続か否かを判
断する。モデム接続の場合にはステップS405へ進
み、要求元のクライアントが要約を必要としているか否
かを判断する。必要な場合はステップS406の要約処
理に進み、対象となるドキュメントのPAFデータから
テキスト部分のみを抜き出し、要約処理を行ってステッ
プS407へ進む。要約の必要がない場合には直接ステ
ップS407に進む。
【0044】ステップS407では、クライアントのデ
ィスプレイがモノクロか否かを判定し、モノクロの場合
にはステップS408でモノクロディスプレイに応じた
適応的2値化処理を行い、画像中の下地色を抜き、特に
図の中の文字がはっきり読みとれるようにカラー画像か
らモノクロ画像を作成し、ステップS409へ進む。ま
た、ステップS407でカラーディスプレイであると判
定された場合には、そのままステップS409に進む。
【0045】ステップS409では、クライアントのデ
ィスプレイ解像度情報を得て、サーバの持つ原画像の解
像度との差を判断する。クライアントのディスプレイと
の差ががあまりにも大きい場合には、クライアントのデ
ィスプレにおける画像表示が低品位なものなってしまう
ので、そのような場合は、ステップ410にて解像度変
換処理を施し、クライアントのディスプレイ解像度に近
づける。その後、図5のステップS411へ進む。
【0046】ステップS411では、モデム接続クライ
アントに対して送るのに適した、サイズの小さなテキス
ト、画像を使って、PAF情報に基づき、レイアウトの
再現可能なHTML文書を作成する。
【0047】ステップ412ではステップS411で作
成したHTML文書をシリアルポートコントローラー2
5を通じてモデム24からアナログ回線22へ送り出
し、要求元クライアントへ当該HTML文書を送信し、
処理を終了する。
【0048】また、ステップS404で、クライアント
がLAN接続であると判断した場合にはステップS41
3へ進み、PAFデータを読み出し、要求元クライアン
トの変換要求に従って、ステップS414でRTF変換
処理、或いはステップS415でHTML変換処理を行
う。
【0049】ステップS415のHTML変換処理で
は、PAFデータ構築時に図のブロックの画像データは
すでに圧縮されているので、HTML変換時には特に画
像の圧縮方法を変える必要はないが、ステップS413
のRTF変換処理の場合にはRTFが図の部分の画像デ
ータフォーマットとしてJPEG等の圧縮形式をサポー
トしていないので、BMPファイルへ変換する処理も行
う必要がある。
【0050】以上のようにして、HTML或いはRTF
に変換された当該文書はステップS416で、NIC2
3によりLANなどのデジタル回線21へ送出され、要
求元クライアントに当該文書情報が返送され、処理が終
了する。
【0051】なお、本実施の形態においては、文書はテ
キスト、図、表の属性別に各領域に分割されたが、属性
はこれらに限られるものではなく、任意に定めることが
可能である。
【0052】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記憶媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0053】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0054】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した図4および、または図5
に示すフローチャートに対応するプログラムコードが格
納されることになる。
【0055】
【発明の効果】以上述べたように本発明によれば、モデ
ム接続されたクライアントには、要求に応じて要約され
たテキストと、小さなサイズとなったHTML文書が原
画像に代わって配信されるため、文書のレイアウトを再
現しつつ、かつ、比較的非力な性能のCPUのクライア
ントにおいても文書の内容を従来よりも高速度で読み出
すことができるようになる。
【0056】また、クライアントのディスプレイがモノ
クロで、サーバ上のカラー文書を参照する場合でも、文
書は適応的2値化処理が施されたモノクロ文書に変換さ
れて配信されるため、カラーの下地色が除かれた読みや
すい文書が表示されることになる。
【0057】更に、クライアントディスプレイの解像度
に応じた解像度変換がされているので、クライアント側
で極端に大きく表示されたり、小さく表示されることが
なくなり、画像の品位を保つことができる。
【0058】又、LAN接続されたクライアントに対し
てはRTFやHTMLで文書を送ることにより、WOR
Dフォーマットで送る場合に比べて小さなデータ量でレ
イアウト情報までも送ることができるので、LAN上の
トラフィックの低減に役立つ。
【0059】さらに、キーワードに予めマーカーなどを
用いて下地色を付けておくことにより、文書読み込み時
に自動的にそのキーワードが抽出されて登録されるの
で、キーボードによるキーワード入力などの手間を省く
ことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態におけるドキュメントサー
バシステムの構成図である。
【図2】本発明の実施の形態におけるドキュメントサー
バの構成を示すブロック図である。
【図3】本発明の実施の形態のドキュメントサーバにお
けるドキュメント登録時の動作を表すフローチャートで
ある。
【図4】本発明の実施の形態のドキュメントサーバにお
けるクライアントからの文書検索要求受け付け時の動作
を表すフローチャートである。
【図5】本発明の実施の形態のドキュメントサーバにお
けるクライアントからの文書検索要求受け付け時の動作
を表すフローチャートである。
【符号の説明】
11 クライアント 12 ドキュメントサーバ 13 スキャナ 14 プリンタ 15 ユーザインターフェース 16 アクセサリ 17 グループウェアサーバ 18 メールサーバ 19 ブラウザ 21 デジタル回線 22 アナログ回線 23 ネットワークインターフェースカード 24 モデム 25 シリアルポートコントローラ 26 システムバス 27 ハードディスクコントローラ 28 ハードディスクドライブ 29 RAM 210 マイクロプロセッサ 211 CD−ROMドライブ
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/401 330A 15/62 330D 15/68 320Z Fターム(参考) 5B050 BA06 BA16 CA08 DA04 DA06 EA02 EA03 EA09 EA10 EA19 FA02 GA08 5B057 AA11 CA01 CA08 CA12 CA16 CB01 CB08 CB18 CD05 CE08 CE09 CE12 CG07 5B064 AA01 AB04 CA08 EA18 5B075 ND06 NK02 NK32 NR02 NR16 NS01 PQ02 PQ05 PQ20 5B082 AA00 GA01 GA02 GC04 HA05 HA08

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 イメージとして読み込んだ文書を、テキ
    ストを含む複数の属性に応じて領域分割する領域分割手
    段と、 前記領域分割手段により分割されたテキスト領域に対し
    て、文字認識処理を行う文字認識処理手段と、 前記文字認識手段により認識されたテキストに対して要
    約を生成する要約生成手段と、 クライアントの種類及び接続方法を識別する識別手段
    と、 前記識別手段により識別されたクライアントの種類及び
    クライアントからの要求に応じて、前記要約生成手段を
    制御する制御手段とを有することを特徴とするドキュメ
    ントサーバ装置。
  2. 【請求項2】 前記領域分割手段はカラー領域分割手段
    であり、テキスト領域の下地色を認識し、前記文字認識
    処理手段により認識されたテキストから、特定の下地色
    のついた部分の文字認識結果をキーワードとして抽出す
    るキーワード抽出手段を更に有することを特徴とする請
    求項1に記載のドキュメントサーバ装置。
  3. 【請求項3】 前記制御手段は、前記識別手段により識
    別されたクライアントが要約を要求している場合に、前
    記要約生成手段を付勢することを特徴とする請求項1ま
    たは2に記載のドキュメントサーバ装置。
  4. 【請求項4】 前記複数の属性は図を含み、前記領域分
    割手段により分割された図の領域に対して、2値化処理
    を行う2値化処理手段を更に有し、 前記制御手段は、前記識別手段により識別されたクライ
    アントのディスプレイが白黒表示である場合に、前記2
    値化処理手段を付勢することを特徴とする請求項1乃至
    3のいずれかに記載のドキュメントサーバ装置。
  5. 【請求項5】 前記読み込まれた文書の解像度を変換す
    る解像度変換手段を更に有し、 前記制御手段は、前記識別手段により識別されたクライ
    アントの解像度が読み込まれた文書の解像度と異なる場
    合に、前記解像度変換手段を付勢することを特徴とする
    請求項1乃至4のいずれかに記載のドキュメントサーバ
    装置。
  6. 【請求項6】 前記識別手段により識別されたクライア
    ントがモデムを介して接続されている場合に、前記制御
    手段による制御を行うことを特徴とする請求項3乃至5
    のいずれかに記載のドキュメントサーバ装置。
  7. 【請求項7】 前記文字認識手段により文字認識された
    テキストに対して、自動的に文字認識の誤りを訂正する
    手段を更に有することを特徴とする請求項1乃至6のい
    ずれかに記載のドキュメントサーバ装置。
  8. 【請求項8】 前記複数の属性は図を含み、前記領域分
    割手段により分割された図の領域に対して、複数の圧縮
    法から1つを選択して圧縮をかける圧縮手段を更に有す
    ることを特徴とする請求項1乃至7のいずれかに記載の
    ドキュメントサーバ装置。
  9. 【請求項9】 前記識別手段により識別されたクライ
    アントの接続方法に応じて、文書のフォーマットを変換
    する手段を更に有することを特徴とする請求項1乃至8
    のいずれかに記載のドキュメントサーバ装置。
  10. 【請求項10】 イメージとして読み込んだ文書を、テ
    キストを含む複数の属性に応じて領域分割する領域分割
    工程と、 前記領域分割工程で分割されたテキスト領域に対して、
    文字認識処理を行う文字認識処理工程と、 クライアントの種類及び接続方法を識別する識別工程
    と、 前記識別工程により識別されたクライアントの種類及び
    クライアントからの要求に応じて、前記文字認識工程で
    認識されたテキストに対して要約を生成する要約生成工
    程とを有することを特徴とする文書処理方法。
  11. 【請求項11】 前記領域分割工程ではカラー領域分割
    を行い、テキスト領域の下地色を認識し、前記文字認識
    処理工程により認識されたテキストから、特定の下地色
    のついた部分の文字認識結果をキーワードとして抽出す
    るキーワード抽出工程を更に有することを特徴とする請
    求項10に記載の文書処理方法。
  12. 【請求項12】 要約生成工程では、前記識別工程によ
    り識別されたクライアントが要約を要求している場合
    に、要約生成処理を実行することを特徴とする請求項1
    0または11に記載の文書処理方法。
  13. 【請求項13】 前記複数の属性は図を含み、前記領域
    分割工程において分割された図の領域に対して、2値化
    処理を行う2値化処理工程を更に有し、 前記2値化処理工程では、前記識別工程で識別されたク
    ライアントのディスプレイが白黒表示である場合に、前
    記2値化処理を実行することを特徴とする請求項10乃
    至12のいずれかに記載の文書処理方法。
  14. 【請求項14】 前記読み込まれた文書の解像度を変換
    する解像度変換工程を更に有し、 前記解像度変換工程では、前記識別工程で識別されたク
    ライアントの解像度が読み込まれた文書の解像度と異な
    る場合に、前記解像度変換処理を実行することを特徴と
    する請求項10乃至13のいずれかに記載の文書処理方
    法。
  15. 【請求項15】 前記識別工程により識別されたクライ
    アントがモデムを介して接続されている場合に、前記各
    種処理を実行することを特徴とする請求項12乃至14
    のいずれかに記載の文書処理方法。
  16. 【請求項16】 前記文字認識工程で文字認識されたテ
    キストに対して、自動的に文字認識の誤りを訂正する工
    程を更に有することを特徴とする請求項10乃至15の
    いずれかに記載の文書処理方法。
  17. 【請求項17】 前記複数の属性は図を含み、前記領域
    分割工程で分割された図の領域に対して、複数の圧縮法
    から1つを選択して圧縮をかける圧縮工程を更に有する
    ことを特徴とする請求項10乃至16のいずれかに記載
    の文書処理方法。
  18. 【請求項18】 前記識別工程で識別されたクライア
    ントの接続方法に応じて、文書のフォーマットを変換す
    る工程を更に有することを特徴とする請求項10乃至1
    7のいずれかに記載の文書処理方法。
  19. 【請求項19】 請求項10乃至18のいずれかに記載
    の文書処理方法を実現するためのプログラムコードを保
    持する記憶媒体。
JP11128909A 1999-05-10 1999-05-10 ドキュメントサーバ装置、文書処理方法、及び記憶媒体 Withdrawn JP2000322425A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11128909A JP2000322425A (ja) 1999-05-10 1999-05-10 ドキュメントサーバ装置、文書処理方法、及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11128909A JP2000322425A (ja) 1999-05-10 1999-05-10 ドキュメントサーバ装置、文書処理方法、及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2000322425A true JP2000322425A (ja) 2000-11-24

Family

ID=14996372

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11128909A Withdrawn JP2000322425A (ja) 1999-05-10 1999-05-10 ドキュメントサーバ装置、文書処理方法、及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2000322425A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005038344A (ja) * 2003-07-18 2005-02-10 Hitachi Ltd 書類引継システム及び書類引継方法
JP2006155588A (ja) * 2004-11-05 2006-06-15 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2007512589A (ja) * 2003-10-31 2007-05-17 アノト アクティエボラーク 電子ペンからのデータフローを制御するための情報管理装置及び方法
JP2007306405A (ja) * 2006-05-12 2007-11-22 Ricoh Co Ltd 画像形成システム、グループウェアサーバ、画像形成方法、データベース管理プログラム及び記憶媒体
JP2008176820A (ja) * 2001-03-23 2008-07-31 Arizan Corp 携帯用計算デバイスへの無線通信媒体を介するコンテンツ送達のためのシステムおよび方法
US7545992B2 (en) 2004-07-07 2009-06-09 Canon Kabushiki Kaisha Image processing system and image processing method
US7596271B2 (en) 2004-07-07 2009-09-29 Canon Kabushiki Kaisha Image processing system and image processing method
US8488146B2 (en) 2006-05-12 2013-07-16 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus and computer-readable storage medium
US8531697B2 (en) 2006-10-18 2013-09-10 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus, image forming method, and image forming program
JP2014089645A (ja) * 2012-10-31 2014-05-15 Toshiba Corp システムおよび情報提供方法並びに電子機器

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8572479B2 (en) 2001-03-23 2013-10-29 Arizan Corporation Systems and methods for content delivery over a wireless communication medium to a portable computing device
JP2008176820A (ja) * 2001-03-23 2008-07-31 Arizan Corp 携帯用計算デバイスへの無線通信媒体を介するコンテンツ送達のためのシステムおよび方法
US7954055B2 (en) 2001-03-23 2011-05-31 Arizan Corporation Systems and methods for content delivery over a wireless communication medium to a portable computing device
JP2011138533A (ja) * 2001-03-23 2011-07-14 Arizan Corp 携帯用計算デバイスへの無線通信媒体を介するコンテンツ送達のためのシステムおよび方法
JP2005038344A (ja) * 2003-07-18 2005-02-10 Hitachi Ltd 書類引継システム及び書類引継方法
JP2007512589A (ja) * 2003-10-31 2007-05-17 アノト アクティエボラーク 電子ペンからのデータフローを制御するための情報管理装置及び方法
US7545992B2 (en) 2004-07-07 2009-06-09 Canon Kabushiki Kaisha Image processing system and image processing method
US7596271B2 (en) 2004-07-07 2009-09-29 Canon Kabushiki Kaisha Image processing system and image processing method
JP2006155588A (ja) * 2004-11-05 2006-06-15 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2007306405A (ja) * 2006-05-12 2007-11-22 Ricoh Co Ltd 画像形成システム、グループウェアサーバ、画像形成方法、データベース管理プログラム及び記憶媒体
US8488146B2 (en) 2006-05-12 2013-07-16 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus and computer-readable storage medium
US8531697B2 (en) 2006-10-18 2013-09-10 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus, image forming method, and image forming program
JP2014089645A (ja) * 2012-10-31 2014-05-15 Toshiba Corp システムおよび情報提供方法並びに電子機器

Similar Documents

Publication Publication Date Title
US5781914A (en) Converting documents, with links to other electronic information, between hardcopy and electronic formats
JP2745406B2 (ja) 画像ファイリングシステムの制御方式
US7271928B2 (en) Data communication apparatus, image server, control method, storage medium, and image system
CN102117269B (zh) 对文档进行数字化的装置及方法
EP0460869B1 (en) Data retrieval system, display apparatus and method of recording and displaying
JP2002259283A (ja) データ提供装置及びデータ提供方法並びにプログラム
JP2000322425A (ja) ドキュメントサーバ装置、文書処理方法、及び記憶媒体
JP3963614B2 (ja) データ通信システムならびにデータ通信システムを構成するサーバおよびクライアント・コンピュータ
US20020111940A1 (en) Database system
JP3458001B2 (ja) 画像ファイル装置
JP2001061060A (ja) 縮小画像作成方法及び装置、記憶媒体
JPH0581395A (ja) 複数のサイズを有する文書用の交換可能なイメージ・オブジエクトを扱うためのデータ処理システムおよび方法
JP2005149323A (ja) 画像処理システム及び画像処理装置並びに画像処理方法
JPH10320356A (ja) オーバレイの差分初期化表示方法
JP2003308325A (ja) データ登録装置、データ登録方法、データ登録プログラムおよび記録媒体
JP2001101203A (ja) 電子ファイリング装置および電子ファイリング装置を利用した文書の検索方法
JPH11187231A (ja) 画像検索装置及び画像検索方法
JP2000029987A (ja) 画像読取装置の制御方法及び画像読取装置並びに画像読取システム
JP2000057069A (ja) 情報処理装置および方法およびシステム
JP2008117037A (ja) 文字認識辞書作成プログラム及び文字認識辞書作成方法
JPH0793485A (ja) 画像ファイリング装置
JP2635312B2 (ja) 画像処理装置
JP2000306076A (ja) 画像処理装置及び制御方法及び記憶媒体
JP2000112955A (ja) 画像表示方法および画像ファイリング装置および記録媒体
JPH01269170A (ja) 画像ファイリング装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060801