JPH08147446A - 電子ファイリング装置 - Google Patents

電子ファイリング装置

Info

Publication number
JPH08147446A
JPH08147446A JP6285260A JP28526094A JPH08147446A JP H08147446 A JPH08147446 A JP H08147446A JP 6285260 A JP6285260 A JP 6285260A JP 28526094 A JP28526094 A JP 28526094A JP H08147446 A JPH08147446 A JP H08147446A
Authority
JP
Japan
Prior art keywords
information
electronic filing
filing apparatus
document
printer driver
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6285260A
Other languages
English (en)
Other versions
JP3683925B2 (ja
Inventor
Yoshikazu Yokomizo
良和 横溝
Susumu Sugiura
杉浦  進
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP28526094A priority Critical patent/JP3683925B2/ja
Priority to US08/560,496 priority patent/US5907835A/en
Publication of JPH08147446A publication Critical patent/JPH08147446A/ja
Application granted granted Critical
Publication of JP3683925B2 publication Critical patent/JP3683925B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 電子ファイリング装置において、異なるアプ
リケーションで扱われた情報を統合してファイリングで
きるようにすること。 【構成】 アプリケーションからの情報を受けるプリン
タードライバー(6)と、ファイリングに適したフォー
マットに変換する手段(10−1)と、文字部分を認識
する手段(10−2)と、キーワードを抽出する手段
(10−3)と、データベースに登録する手段(10−
4)とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書を電子的な手段に
よりファイリング整理する電子ファイリング装置に関す
る。
【0002】本発明は、紙の原稿をスキャンした画像
と、DTP文書とを統合化し、共通に扱える電子ファイ
リング装置に関するものである。
【0003】
【従来の技術】従来の電子ファイリング装置は、大型で
高価な専用機であった。また、操作方法も専用のものな
ので、専門的に教育されたオペレーターが必要であるな
ど、使いにくい面があった。また、従来の電子ファイリ
ング装置はパーソナルコンピュータとは独立した装置に
なっており、DTP文書と共通に管理することはできな
かった。
【0004】
【発明が解決しようとしている課題】小型で安価な電子
ファイリング装置を実現する為には、市販のパーソナル
コンピュータ(以下パソコン)をベースにしたファイリ
ング技術を実現する事が考えられる。電子ファイリング
装置に必要な機能要素は、スキャナー、OCR、キーワ
ード検索機能、(光磁気)ディスク装置等であり、
「紙」に印刷された文書をスキャナーで読んでOCRで
文字情報をコード化し、キーワードを自動的に拾い出し
てディスク装置に一緒に保存していた。専用機であれ
ば、これだけの機能で十分であるが、パソコンをベース
に電子ファイリングを行う際には、対象とする文書は
「紙」に印刷された文書だけではなく、キーボードから
入力して作成されたDTP文書も統一的に扱う必要性が
出てくる。ところが、DTP文書というのは、作成した
アプリケーションによってファイルフォーマットが全く
異なり、それらをファイルの形で保存すると以下の様な
問題が生じる。
【0005】(1)ネットワーク上にあるサーバーに保
存したDTP文書を複数のパソコンからアクセスする場
合、全てのパソコンに作成時に用いたアプリケーション
と同じアプリケーションが存在するという保証は無い。
バージョンが違うだけでも問題である。
【0006】(2)ネットワーク上にアーキテクチャー
の異なるパソコンが存在する場合、たとえ同一アプリケ
ーションの作成したファイルでもファイル形式が異なる
のが普通なので、相互にアクセスできない。
【0007】(3)市販のアプリケーションには、キー
ワードを抽出する機能など無いのが普通であるから、電
子ファイリング装置としては使用できない。
【0008】(4)専用の検索ソフトを用意し、市販の
アプリケーションからは検索ソフトを介して間接的にフ
ァイリングをする場合、ファイルを媒介するか、カット
&ペースト機能を媒介して文書情報を伝送する訳だが、
操作手順が繁雑で時間がかかり、自動化も困難である。
【0009】(5)従来の電子ファイリング装置はパー
ソナルコンピュータとは独立した装置になっており、D
TP文書と共通に管理する事はできなかった。
【0010】
【課題を解決する為の手段】上記課題を解決する為に、
本発明は、アプリケーションソフトウエアからプリンタ
ドライバーに伝達される情報をデータベースに蓄積する
手段を有する電子ファイリング装置を提供する。
【0011】上記課題を解決する為に、本発明は好まし
くは前記電子ファイリング装置において、印刷用の描画
コマンドを文書蓄積に達したフォーマットに変換する手
段を有する。
【0012】上記課題を解決する為に、本発明は好まし
くは前記電子ファイリング装置において、キーワード検
索用の情報を抽出して保存する手段を有することを特徴
とする請求項1に記載の電子ファイリング装置。
【0013】上記課題を解決する為に、本発明は好まし
くは前記電子ファイリング装置において、描画コマンド
の中にビットマップ画像情報が含まれる場合には、該画
像データを蓄積する際に圧縮する手段を有する。
【0014】上記課題を解決する為に、本発明はアプリ
ケーションソフトウエアからプリンタドライバーに伝達
される描画情報を、特徴に応じて分割する手段と、上記
課題を解決する為に、本発明は好ましくは該分割された
情報毎に最適な圧縮処理を施す手段と、上記課題を解決
する為に、本発明は好ましくは前記圧縮された情報をデ
ータベースに蓄積する電子ファイリング装置を提供す
る。
【0015】上記課題を解決する為に、本発明は好まし
くは前記分割は、文字部分か、ベクトル描画部分か、ビ
ットマップ画像部分かによって行う。
【0016】上記課題を解決する為に、本発明は好まし
くは前記電子ファイリング装置において、プリンタドラ
イバーに伝達される描画情報の内、ビットマップ画像部
分を認識してコード化する手段と、前記認識して得たコ
ードの内、文字コードは前記文字部分と同様に扱う。
【0017】上記課題を解決する為に、本発明はアプリ
ケーションソフトウエアからプリンタドライバーに伝達
される描画情報からタイトル部分を抽出する手段と、前
記抽出されたタイトル情報を検索のキー情報として登録
する電子ファイリング装置を提供する。
【0018】上記課題を解決する為に、本発明は好まし
くは前記タイトル情報は、タイトルの有無とする。
【0019】上記課題を解決する為に、本発明は好まし
くは前記タイトル情報は、タイトルを認識して得たコー
ド情報とする。
【0020】上記課題を解決する為に、本発明は好まし
くは前記描画情報から特徴に応じて分割する手段を有す
る。
【0021】上記課題を解決する為に、本発明は好まし
くは前記分割は、文字部分か、ベクトル描画部分か、ビ
ットマップ画像部分かによって行う。
【0022】上記課題を解決する為に、本発明はアプリ
ケーションソフトウエアからプリンタドライバーに伝達
される描画情報から表部分を抽出する手段と、前記抽出
された表情報を検索のキー情報として登録する電子ファ
イリング装置を提供する。
【0023】上記課題を解決する為に、本発明は好まし
くは前記表情報は、表の有無とする。
【0024】上記課題を解決する為に、本発明は好まし
くは前記表情報は、表を構成する段数とする。
【0025】上記課題を解決する為に、本発明は好まし
くは前記描画情報から特徴に応じて分割する手段を有す
る。
【0026】上記課題を解決する為に、本発明は好まし
くは前記分割は、文字部分か、ベクトル描画部分か、ビ
ットマップ画像部分かによって行う。
【0027】上記課題を解決する為に、本発明はアプリ
ケーションソフトウエアからプリンタドライバーに伝達
される描画情報からグラフ部分を抽出する手段と、前記
抽出されたグラフ情報を検索のキー情報として登録する
電子ファイリング装置を提供する。
【0028】上記課題を解決する為に、本発明は好まし
くは前記グラフ情報は、グラフの有無とする。
【0029】上記課題を解決する為に、本発明は好まし
くは前記描画情報から特徴に応じて分割する手段を有す
る。
【0030】上記課題を解決する為に、本発明は好まし
くは前記分割は、文字部分か、ベクトル描画部分か、ビ
ットマップ画像部分かによって行う。
【0031】上記課題を解決する為に、本発明はアプリ
ケーションソフトウエアからプリンタドライバーに伝達
される描画情報からビットマップ画像部分を抽出する手
段と、上記課題を解決する為に、本発明は好ましくは前
記抽出されたビットマップ画像情報を検索のキー情報と
して登録する電子ファイリング装置を提供する。
【0032】上記課題を解決する為に、本発明は好まし
くは前記ビットマップ画像情報は、ビットマップ画像の
有無とする。
【0033】上記課題を解決する為に、本発明は好まし
くは前記ビットマップ画像情報は、ビットマップ画像の
個数とする。
【0034】上記課題を解決する為に、本発明は好まし
くは前記描画情報から特徴に応じて分割する手段を有す
る。
【0035】上記課題を解決する為に、本発明は好まし
くは前記分割は、文字部分か、ベクトル描画部分か、ビ
ットマップ画像部分かによって行う。
【0036】上記課題を解決する為に、本発明は原稿を
光学的に読み取る手段と、前記読み取った原稿の画像を
圧縮してデータベースに保存する手段と、前記読み取っ
た画像を文字部分と画像部分とに分割する手段と、前記
分割された文字部分を認識してコード化し、保存する手
段と、前記保存した文字コードと指定されたキーワード
が一致するか否か判定する手段と、前記判定により一致
すると判定される場合に、一致する画像を伸長して表示
する手段とを有する電子ファイリング装置を提供する。
【0037】上記課題を解決する為に、本発明は好まし
くは前記原稿を光学的に読み取る手段に替えて、公衆回
線により画像を受信する手段を有する。
【0038】上記課題を解決する為に、本発明は好まし
くはアプリケーションソフトウエアからプリンタドライ
バーに伝達された情報を蓄積に適したフォーマットに変
換する手段と、前記変換された情報を蓄積する手段とを
有する電子ファイリンク装置。
【0039】上記課題を解決する為に、本発明は好まし
くは前記変換の水準を複数段階設け、アプリケーション
ソフトウエアの機能の段階によって変換の水準を選択す
る。
【0040】上記課題を解決する為に、本発明は好まし
くは前記プリンタドライバーの情報の流れを双方向とす
る。
【0041】上記課題を解決する為に、本発明は好まし
くは前記アプリケーションソフトウエアとのインターフ
ェイスを汎用ドライバーの形式とする。
【0042】上記課題を解決する為に、本発明は好まし
くは前記情報の蓄積は、ネットワーク上のデータベース
とする。
【0043】上記課題を解決する為に、本発明は好まし
くは前記データベースに替えて、複数台数のクライアン
トコンピュータ同士で情報を送受信する手段を有する。
【0044】
【目的】本発明は、従来ハード/ソフト共にスタンドア
ロンの機械として提供されていた文書蓄積/検索装置
を、市販されているコンピュータをベースにし、市販さ
れている幾多のアプリケーションをフロントエンドとす
る文書蓄積/検索装置を提供する事を目的とする。
【0045】本発明は、デスクトップのパソコンを介し
て簡単に文書の蓄積/検索ができる様にすることで、小
型で安価な電子ファイリング方法及びその装置を提供す
ることを目的とする。
【0046】本発明は、従来行われていたキーワード検
索に加えて、DTP文書やスキャンされた画像の中に含
まれる「表」や「円グラフ」「タイトル」「ビットマッ
プ画像」等の有無や個数等によっても検索時間の短縮あ
るいは検索精度を上げる事を目的とする。
【0047】
【実施例】以下、図に基づき本発明の実施例を詳細に説
明する。
【0048】図1は本実施例の電子ファイリング装置の
ブロックダイヤグラムである。100はホストコンピュ
ータであり、枠で囲まれた機能を実行する。ここでは1
つの枠で表したが、この枠内に表した各機能は1つ或い
は複数のCPUで実行しても良いし、1つ或いは複数の
ホストコンピュータで実行しても良い。同図に於て、
1、2、3は市販のアプリケーションであり、例えばス
キャナーアプリ1、ワープロアプリ2、表計算アプリ3
等を示している。これらのアプリケーション間でデータ
のやり取りをするには、ファイル4、5を介して行うの
は非常に困難である。なぜなら、スキャナーアプリ、ワ
ープロアプリ、表計算アプリ等が生成するファイルのフ
ォーマットはそれぞれのベンダーが独自に定めたものな
ので、互換性は全く無いからである。アプリケーション
に依存しないファイルフォーマットとして「TIFF」
「PICT」「EPS」「GIF」「TGA」等の業界
標準フォーマットは全てのアプリケーションに対して万
能ではない。
【0049】コンピューターがMacintosh(登
録商標)やWindows(登録商標)の場合には、
「カット&ペースト」の機能を用いてやり取りする仕組
みが用意されているが、フォーマットは「PICT」か
「GIF」に限定されてしまう。よって、コンピュータ
が限定された場合であってもカット&ペーストでのデー
タのやり取りはできない。
【0050】一方、これらのアプリケーションが印刷す
る際にプリンタードライバーに引き渡すデータは、Ma
cintoshの場合はQuickDraw(登録商
標)、Windowsの場合はGDI(登録商標)に統
一されている。図1はMacintoshのアプリケー
ション1、2、3がプリンタードライバー6に印刷デー
タを渡している時の様子を示している。この時、Pos
tscriptアプリケーションの一部に例外はある
が、ほとんどのアプリケーションがQuickDraw
の描画コマンド7、8、9をプリンタードライバー6に
渡している。本発明はこの特徴に着目し、プリンタード
ライバー6の中に文書変換/蓄積機能を備え、Quic
kDrawを処理対象とした。
【0051】10−1はQuickDraw−共通文書
変換装置である。QuickDrawの描画コマンドは
コンピュータに依存した描画コマンドであり、Maci
ntoshのみに限定すれば殆んどのアプリケーション
に共通の言語であるが、WindowsではGDIコマ
ンドが用いられており、互換性は無い。従ってこのQu
ickDraw−共通文書変換装置10−1によりデー
タベース13にセーブしやすい一般的なドキュメントの
形に変換を行う。
【0052】共通文書12、14はドローであってもペ
イントであっても、また混在していてもどの場合でも各
々処理できる。ドローとは描画の線の太さ、色、座標点
を指定する数値で表現する描画方法で、それを受け取っ
た側も画像におとすにはその数値をデコードする機能が
なければならない。一方、ペイントとはビットマップ画
像の事であり、データのサイズは大きくなるが、受け取
った側のデコード機能は不用である。
【0053】10−2はOCR装置でビットマップ画像
を認識してコード化する場合に用いるが、すでにコード
状態であるドロー系の情報の場合にはこのOCR装置1
0−2はバイパスする。
【0054】10−3はキーワード抽出装置で、Qui
ckDraw−共通文書変換装置10−1により変換し
て得た共通文書の中から、検索に使えそうな単語を拾い
だし、その共通文書とセットでアクセスする為のもので
ある。
【0055】10−4はデータベースAPIで、ローカ
ルまたはネットワークを介して接続されているリモート
のデータベース13に接続する為のものである。
【0056】プリンタードライバーAPI6は、システ
ムが提供するものに合わせる。このAPIはプリンタが
印刷だけを想定している通常の場合はデータの流れは一
方通行であり、データベース13から引き出した文書を
QuickDrawコマンドに逆変換してアプリケーシ
ョン1、2、3側に送る事は出来ない。しかしながら、
本実施例におけるプリンタードライバーAPIは汎用ド
ライバーの形式とする。プリンタードライバーを介して
双方向の文書交換をする為には、OSやアプリケーショ
ンの変更が必要であるが、専用の文書検索ソフトウエア
を用いた場合には双方向の文書交換が実現できる。
【0057】共通文書12はLAN11を介してデータ
ベース13に送られる。
【0058】この図1における装置を文書のファイリン
グシステムとして用いるには、通常スキャナー15で原
稿を読み取る。その制御はスキャナーアプリ1が行う
が、そのアプリがスキャナー15により読み取った原稿
を印刷する場合にはやはりQuickDraw7に変換
してプリンタードライバー6に伝達する。QuickD
rawとは言っても、スキャン画像の場合には中身はビ
ットマップであるから、10−1でビットマップに戻
し、必要に応じて圧縮回路(図示せず)によって画像圧
縮を行う。
【0059】プリンタードライバー6は、パソコンのO
Sがサポートする全てのQuickDrawコマンドを
サポートしており、あらゆるアプリケーションからの印
刷要求に応える。一方、プリンタードライバー6が一方
通行であった時はアプリケーション1、2、3は自分の
都合により一部のQuickDrawコマンドしかサポ
ートしなくても何等問題は無かった。ところが、プリン
タードライバー6を双方向性にし、QuickDraw
−共通文書変換装置10−1が出力するQuickDr
awコマンドを各アプリケーションで表示可能にする為
には、やはり各アプリケーションが全てのQuickD
rawコマンドをサポートする必要がある。なぜなら、
その文書は自分より高機能なアプリケーションが作成し
たものかも知れないからである。その為プリンタードラ
イバー6は、アプリケーションに伝達しようとしたドロ
ー系のコマンドがアプリケーションに理解できないと拒
絶された場合には、それをペイント系のデータに変換し
て再度伝達をしなおす。
【0060】誤り制御機能の無いアプリケーションの為
に、QuickDraw運用に水準を設け、例えばJI
Sの漢字コードの毎く第一、第二、第三水準に分類し、
伝達しても理解されない事が分かっている場合には、あ
らかじめ低水準のQuickDrawコマンドに変換し
て伝達しても良い。
【0061】図2は、検索アプリの位置づけを説明する
図面である。同図に於て、図1と共通の機能要素には同
一の番号を付与してある。図1では市販のアプリケーシ
ョン1、2、3からデータベース13への文書蓄積を説
明したが、市販のアプリケーションはやはり文書蓄積/
検索用に設計されている訳ではないから、スピーディー
な検索には専用の検索アプリ16が必要となる。このア
プリはQuickDraw−共通文書変換装置10−1
と直接接続する。データフォーマットはQuickDr
awではなく共通文書フォーマット17である。10−
1は汎用ドライバーとして構築されている。
【0062】図3は、OCRアクセラレーターを使う場
合の実施例である。10−5がそのアクセラレータであ
る。アクセラレータは通常ハードウエアで実現する。O
CRには変換時間がかかるので、専用のハードウエアに
処理を代行させる事により高速化が図れる。
【0063】また、QuickDraw−共通文書変換
装置10−1はプリンタードライバー/汎用ドライバー
としてソフトウエアで実現する。一方、OCR10−
2、キーワード検索装置10−3、データベースAPI
10−4はバックグラウンドで走る汎用ドライバーとし
てソフトまたはハードで実現し、これらが処理をしてい
る時でも、オペレーターの他の装置を中断しない。
【0064】図4はその関係を詳細に説明した図であ
る。10−6はプリントキュー、10−7はバッファー
メモリーである。QuickDraw−共通文書変換装
置10−1はもっぱらプリンタードライバー6と一体で
動作し、プリントキュー10−6への出力はフォアグラ
ンドで行う。一方、OCR10−2以下はプリントキュ
ー10−6から文書データーをバックグランドで受取
り、アプリケーション1、2、3、16と同時並行的に
処理する。バッファーメモリー10−7は、プリントキ
ュー10−6が一時的に文書データーを蓄えておく為の
ものである。
【0065】図5は、対話式会議システムへの応用例で
ある。同図に於て、左半分は図1のパソコンと同じ物で
あり、説明上必要な番号には「a」の枝番を付けてあ
る。一方、右半分は第2のパソコンで、「b」の枝番を
付けたものは、「a」の枝番の付いた同じ番号の要素と
同じ物である。第1のパソコン(左)にはスキャナー1
5をそのまま残して説明してあるが、第2のパソコン
(右)にはスキャナーが無い場合の状態を説明してい
る。この場合、OCR、キーワード検索、データーベー
スAPI機能は不用なので斜線で示した様に機能を止め
て使う。ネットワーク上を流れるデーターが共通文書で
ある限りは、アプリケーションとのインターフェースは
共通文書であっても他のフォーマット、即ち、Quic
kDrawあっても構わない。スキャナー15からのデ
ータはプリンタードライバー6が共通文書に変換するの
で、何等問題無く、相互通信が可能である。
【0066】本実施例においてはプリンタードライバー
の、専らファイリングの為に用いられている部分のみ説
明するので、ここからは「ファイリングドライバー」と
呼ぶ事にする。ファイリングドライバーの機能は以下の
通りである。
【0067】(1)市販のアプリケーションからのファ
イリングを可能にする。
【0068】(2)形式はプリンタドライバーの形式で
作成する。市販のアプリケーションから一般のプリンタ
ーに印刷する時と全く同じ操作により、ファイリングを
実現する。すなわち、アプリケーションから発行される
GDI描画コマンドを所定のファイル形式に変換してハ
ードディスクにファイルを保存する。ファイリングに特
有のダイアログはファイリングドライバーが表示器(図
示せず)に表示する。
【0069】(3)ネットワーク対応は、データベース
自身がネットワーク対応しており、ファイリングドライ
バーとしては、特にネットワークを意識しなくてもネッ
トワーク上のファイルサーバーにアクセスできる。
【0070】(4)ファイル形式 例えばマイクロソフト社のWindowsのGDIの描
画コマンドは、最終的に以下の情報を含むファイル形式
でデータベースに保存される。
【0071】i)ビットマップ画像 ii)文字情報 iii)レイアウト情報 iv)キーワード情報 ビットマップ画像はファイリングの基本となる情報で、
「印刷ダイアログ」で選択した用紙サイズと同じサイズ
のビットマップ画像を、以下の圧縮方式のいずれかを用
いて圧縮する。
【0072】i)白黒2値画像 JBIG ii)多値画像 JPEG 文字情報に関しては、本来のファイリングではスキャナ
ーで読んだビットマップ画像にOCRを掛けて文字情報
を抽出する。ファイリングドライバーの中でもこの方法
を踏襲するが、GDIコードでドライバーに渡されるの
で、GDIコマンドから直接文字情報を抽出する。すな
わち、文字情報については、以下の2種類がある。
【0073】i)OCRによって得られる文字情報 ii)GDIコマンドを解析して得られる文字情報 レイアウト情報については、上記OCRの前処理プログ
ラムであるブロックセレクション(BS)情報から抽出
する。すなわち、レイアウト情報については以下の2種
類がある。
【0074】i)ブロックセレクションで得られるレイ
アウト情報 ii)GDIコマンドを解析して得られるレイアウト情
報 キーワード情報については、キーワード生成ルーチンを
用いて文字情報の中から抽出する。
【0075】レイアウト情報抽出の方法は以下の通りで
ある。
【0076】GDIコードを解析して、レイアウト情報
を抽出する。レイアウト情報はページ情報とブロック情
報とから成り、以下の手順でデーターの抽出を行う。
【0077】i)GDIコード抽出(データ入力) ii)ブロック分解 iii)ブロック情報抽出 iv)ページ情報抽出 v)DBアクセス(ファイル作成) ブロック分解/情報抽出の方法は以下の通りである。
【0078】〈バンディングの結合〉アプリから渡され
るGDIコードバンディングされている場合には、1ペ
ージ分全部のGDIコードを取得しまとめる。
【0079】〈ビットマップ画像である事の判定方法〉 (1)アプリから渡されるGDIコードの中から、ビッ
トマップ画像(Image)として定義されている部分
は、MS Windows SDKの記述により、容易
にビットマップ画像である事が判定できる。目標1で全
体画像をファイルに保存しているので、画像情報そのも
のは捨ててしまって構わない。ここで保存する情報は以
下の通り。
【0080】i)ビットマップ画像のID ii)ビットマップ画像の種類のID(二値、ハーフト
ーン、カラー、フルカラー) iii)ビットマップ画像のサイズ iv)印刷画面上での位置情報 v)ビットマップ画像の標準化色(8色)のヒストグラ
ムの上位3種類(標準化色とは、RGB各色成分の上位
3ビットをテーブルルックアップ方式で8色に変換す
る。)などである。
【0081】(2)判定に成功したGDIコードは、次
の判定では無視する。 〈表である事の判定方法〉Windows OSがファ
イリングドライバーに渡すGDIコードを解析し、その
中に表が含まれているかどうかを判別する方法は以下の
通り。
【0082】(1)グループ化:アプリケーションから
渡されるGDIコードの中から、斜め線を無視し、縦線
/横線のみを選別し、X座標またはY座標が「一致」す
る直線をグループにしていく。(一致する直線を加える
毎にその直線の座標も「一致」の判定基準に加える) (2)矩形領域算出:グループ化した直線のグループの
内、X座標、Y座標の最大値/最小値を「表」全体の矩
形領域と推定する。
【0083】(3)セル数算出:発見したX座標及びY
座標の種類の数から1を引いた数をX座標及びY座標の
セル数と推定する。セル数がX、Y方向共に2以上の
時、それを「表」と推定する。
【0084】(4)セルサイズ算出:発見したX座標及
びY座標の、数字が互いに接近する二点間の差分をセル
サイズと推定する。
【0085】(5)表の判定:矩形領域の内部に文字が
あれば、そこを「表」と断定する。文字が無ければ図形
と推定する。
【0086】(6)書式:「表」の内部の文字はまとめ
て、TAB−Text形式で表現する。
【0087】例えば、図6の様な表は図17の様にTA
B−Text形式表記できる。
【0088】ただし図17において、(T)はタブ、
(CR)はキャリッジリターン。
【0089】あるいは図18の様にSYLK形式で表記
しても良い。 〈図形の判定方法〉 (1)矩形領域の拡大:あるGDIコードが矩形領域を
持っている場合には、その矩形領域を「拡大された矩形
領域」とし、直線の様に矩形領域を持たないGDIコー
ドの場合には、それが持つ2点が構成する矩形領域を
「拡大された矩形領域」とする。
【0090】(2)コードのグループ化:「拡大された
矩形領域」同士が重なるGDIコード同士は、一つのグ
ループに属すると判定する。
【0091】例えば、図7(A)、(B)に示す様な図
形があった場合、(A)は直線の矩形領域が大きいので
1個のグループと判定されるが、(B)は2個のグルー
プと判定される。
【0092】(3)グループ化されたGDIコーポネン
トのX座標およびY座標の最大値/最小値を「図形の矩
形領域」とする。グループ化されたGDIコンポーネン
ト群を「ピクチャー」と呼ぶ。
【0093】(4)「ピクチャー」をコード化する。
【0094】コード化の基本ルールは図8に示す基本構
文に従って図19の様な項目の内容を記述する。
【0095】(5)図形を分類する 図形は図20のルールに従って分類する。
【0096】〈テキスト部の判定〉 (1)テキストの連結:1文字単独で文字が現れた場
合、フォントサイズから計算される「キャラクタ幅」に
単独文字があれば、「単語」として連結する。「単語」
はスペースを含まない。
【0097】(2)「単語」の連結:「単語」同士がス
ペースのサイズ程度に近接していれば、「行」として連
結する。「行」はスペースを含み得る。
【0098】(3)「文」の連結:「行」同士が「フォ
ント高さ」の3倍以内にあるときは、「文」として連結
する。「文」は複数の改行を含み得る。行端の「単語」
の連結はやらない。(日本語の場合、1行の全てが「単
語」として認識される場合がある。) (4)「文」をコード化する:コード化の基本ルールは
「ピクチャー」として類似しており、図9に示す基本構
文に従って図21の様な項目の内容を記述する。
【0099】〈ブロック情報抽出の方法〉ブロック毎に
ID番号を振る。その順番は、 i)自己ブロックID ii)自己ブロック位置 iii)ブロックの大きさ iv)ブロック属性(テキスト、図形、表、イメージ、
グラフ、タイトル、文字コード) v)親ブロックID vi)子ブロックID vii)そのページの中での順序
【0100】〈ページ情報抽出の方法〉タイトル部の判
定方法は以下の通りである。
【0101】ステップ1: (1)最大フォントの判定:その文書の中で最もサイズ
の大きな「ストリング」を判定する。
【0102】(2)場所の判定:最大サイズの「ストリ
ング」が用紙の1/4より上(または下)にある時、そ
れをタイトルと判定する。
【0103】ステップ2: (1)特徴フォントの判定:同一サイズであっても、ア
ンダーライン、〈〉、「」、{}で特徴付けられた「ス
トリング」が用紙の1/4より上にある時、それをタイ
トルと判定する。
【0104】ステップ3:上記のいずれにも該当しない
時、タイトルは無いものと判定する。
【0105】〈紙の文書の電子ファイリングとの統合〉
図10は、今まで述べてきたファイリングドライバーを
用いた市販アプリケーションからのファイリングと、紙
の文書の電子ファイリングとの統合化を説明する図であ
る。説明の都合上、市販アプリケーションからのファイ
リングを「DTPファイリング」、紙の文書の電子ファ
イリングを「OCRファイリング」と呼ぶ事にする。
【0106】図の中央にデータベース13があり、それ
より左側には、今まで述べてきたファイリングドライバ
ーを用いた市販のアプリケーションからのファイリング
装置のブロック図が、右側には、紙の文書をスキャンし
てファイリングする電子ファイリング装置のブロック図
が書いてある。
【0107】図2と共通の構成要素には同一の番号が付
与してある。
【0108】同図に於て、28はスキャナー、29はそ
れをドライブする為のスキャナーモジュール、31は電
子ファイリングエンジン、30は検索モジュールであ
る。スキャナーモジュール29と電子ファイリングエン
ジン31は、それぞれスキャナーアプリケーション1と
検索アプリケーション16に符合する。点線33で囲ん
で示す様に、スキャナーモジュール29と電子ファイリ
ングエンジン31は電子ファイリングエンジン31と一
体になり、全体で「電子ファイリングアプリケーショ
ン」を形成している。
【0109】電子ファイリングエンジン31には、ブロ
ックセレクション、OCR、キーワード抽出という3つ
の大きな機能がある。スキャナーモジュール29に指示
してスキャナー28から紙の原稿をスキャンして読み込
みます。読み込んだビットマップ画像はスキャナーモジ
ュール29で二値化され、電子ファイリングエンジン内
でブロックセレクションプログラムにより、レイアウト
情報が抽出される。抽出される情報は、テキスト領域及
び画像領域のいずれかのプロファイルを持った矩形領域
情報である。
【0110】画像領域を示す情報は、レイアウト検索用
にデータベースに保存される。ブロックセレクションの
結果に基づき、OCRソフトによってテキスト領域が文
字コードに変換される。
【0111】その後、キーワード抽出プログラムにより
テキスト情報からキーワードとして使えそうな情報が抽
出され、それぞれデーターベースAPI32を介してデ
ーターベース13に保存される。保存された文書は、検
索モジュール30で簡単に見る事ができる。
【0112】「OCRファイリング」はビットマップ画
像からブロックセレクションプログラムによってレイア
ウト情報を抽出するので、「DTPファイリング」ほど
には正確で詳細なレイアウト情報は得られないが、ビッ
トマップ画像の有無、タイトルの有無、と言ったレベル
の検索なら、両者共通に行える。OCRによって抽出し
たキャラクターコードは100%正確ではない。しか
し、抽出したキャラクターコードそのものを再利用する
のではなく、全文検索用のインデックス構築の為に用い
るので、そこそこに正確であれば良く、手で認識誤りを
修正する必要はない。
【0113】データベースAPI32を介して保存され
る情報は、 i)文書全体のビットマップ画像の圧縮結果 ii)ブロックセレクション結果 iii)OCR結果 iv)候補文字情報 v)OCR結果から抽出したキーワード情報 等である。
【0114】文書全体のビットマップ画像の圧縮方法は
JBIGを用いる。JBIGモノクロの文書の圧縮用で
あるが、階層符合化方式によりサムネール画像を簡単に
作れる。
【0115】図11は、原稿の入力先としてFaxを取
り込んでいるところを示す図である。Fax34で受診
したMMR画像情報は、FaxI/F35でビットマッ
プ画像に伸長され、電子ファイリングエンジン31に引
き渡される。それ以降は紙の原稿をスキャナーで読んだ
場合と全く同じである。
【0116】〈フローチャートの説明〉以下、フローチ
ャートを用いて、各部の動作を詳細に説明する。
【0117】図12は、アプリケーションプログラム
と、OS(Windows)、ファイリングドライバー
の動作を説明するフローチャートである。図中、左側が
アプリケーション、中央がOS、右側がファイリングド
ライバーの動作を示している。
【0118】OSがマルチタスクのものならもち論、シ
ングルタスクの場合でも、アプリケーションとOS、ド
ライバーの動作は見掛け上独立したタスクの様に振る舞
う。図中点線の矢印で示してある部分は、実際には関数
コールであるが、C++やクラス定義の中では、「メッセ
ージ」という表現を用いる事が一般的であり、本実施例
ではその例に習う事にする。
【0119】アプリケーションがドキュメントを作成し
てそれを本発明の電子ファイルにファイリングする時、
通常の印刷動作と全く同じ操作を行なう。印刷メニュー
を選択すると(ステップ2)、OSに対して印刷開始メ
ッセージが送られる。OSはこの時種々のOSサービス
を実行しながら(ステップ6)イベントループに入り
(ステップ7)、アプリケーションからの印刷開始メッ
セージを受け付けると、ドライバーを起動させる(ステ
ップ8)。
【0120】OSからのメッセージにより起動したファ
イリングドライバーは、レジスタセットやメモリ空間の
確保等の初期化処理を実行(ステップ14)した後、初
期化完了メッセージをOSに返す。この間OSはドライ
バーからの返事をループで待っている(ステップ9)。
【0121】そしてアプリケーションに対し、ドライバ
ーの準備が整った事を示すメッセージを送る(ステップ
10)。
【0122】アプリケーションはステップ3のループか
ら抜け出し、プリンターに描画すべきGDIコードを出
力する(ステップ4)。GDIコードを受け取ったOS
は、プリンター(ドライバー)がGDIプリンターなら
ばGDIコードのままで、またビットマッププリンター
ならばOSの中でGDIコードをラスタライズしてプリ
ンタードライバーに渡す(ステップ11)。ファイリン
グドライバーは、プリンタードライバーをエミュレート
しており、GDIプリンターかビットマッププリンター
のどちらかである事を宣言することにより、そのどちら
でも実現可能である。もしGDIプリンターであると宣
言すると、OSからはGDIコードがそのままの形で送
られて来るので、ドライバーの中では容易にGDIコー
ドの解析ができるし、ビットマップが必要なら、OSの
システムコールを呼んで、ラスタライズする事ができ
る。
【0123】もしビットマッププリンターであると宣言
すると、OSの中でGDIをビットマップに変換するG
DIサービス(ステップ11)が実行され、ファイリン
グドライバーにはビットマップが渡される。Windo
wsの場合、たとえビットマップにしても、ビットマッ
プ・コードの片すみに元のGDIコードが記載されてい
るから、本実施例ではビットマツプを宣言する事にす
る。
【0124】ファイリングドライバーは受け取ったGD
Iコードを解析し(ステップ16)、原稿に書かれてい
る内容の特徴を抽出し(ステップ17)、それをデータ
ベース13に保存する(ステップ18)。ドライバーか
らOSに対し、印刷完了のメッセージが届いたら、ドラ
イバーの処理待ちになっているループ(ステップ12)
から抜け出し、印刷完了メッセージをアプリケーション
に送る(ステップ13)と共に、ファイリングドライバ
ーを終了させ、メモリー空間からスワップアウトする。
アプリケーションは、OSからの印刷完了メッセージを
受けて、印刷シーケンスを終了する(ステップ5)。
【0125】図中、(*1)で示した部分(ステップ1
6及びステップ17)の詳細な処理を図13のフローチ
ャートを用いて説明する。
【0126】図13のフローチャートは、ファイリング
ドライバーでの動作である。ファイリングドライバー
は、OS経由でアプリケーションから取得したGDIコ
ードを解析し、画像か(ステップ21)、文字か(ステ
ップ22)、ドローか(ステップ23)を区別する。画
像を表すGDIコードは、JBIG、JPEG、MMR
等の圧縮アルゴリズムを用いて圧縮され(ステップ2
4)データベース13の画像バッファに保存される。ド
ローとは、ベクトル情報の集合による線図形、面図形を
用いた描画を言う。
【0127】文字を表すGDIコードはRAM(図示せ
ず)内の文字バッファに蓄えられ、文字バッファの処理
(ステップ25)でタイトルであるかどうかの判定を受
けた後、文字に関する各種の情報(文字コード、スタイ
ル、文字色)を保存し、データベース13のキーワード
として登録する。
【0128】ドロー部分のGDIコードは、ドロー情報
の処理ルーチン(ステップ27)に於て表、図形の判定
を受け、また、統計処理を受ける。
【0129】GDIコードが上記のいずれでも無い時
は、制御コードであるから、ステップ26に於て制御コ
ードの処理を行う。制御コードの中身は、例えば紙サイ
ズ指定であり、また、紙方向指定、解像度指定、余白指
定、ページ番号指定、印刷枚数指定、改ページである。
【0130】特徴対抽出処理(ステップ17)であるス
テップ24、または25、26、27の後は、次のGD
Iコードを取得する為の準備(ステップ28)に入る。
もし、制御コードが終了コードだった時は、GDIコー
ドの解析は終了するが、そうでない場合には次のGDI
コードを取得する為に、ステップ20にループする。
【0131】図中、(*2)で示すステップ25の詳細
な処理を、図14のフローチャートを用いて説明する。
【0132】図14のフローチャートは、ファイリング
ドライバーでの動作である。ここでは文字バッファに蓄
えられた文字情報を解析して、タイトル文字かどうかの
判定を行い、キーワードとして登録している。
【0133】GDIコードの場合、文字コードは一連の
ストリング(文章)になって表現されるとは限らない。
ストリングのGDIコードを吐き出すアプリケーション
は、エディターと呼ばれるソフトウエア位で、高級なD
TPアプリケーションになればなるほど、むしろ一文字
一文字描画する場合が多い。高級なDTPアプリケーシ
ョンは、GDIコードの表現能力を越えた高度の文章表
現をするので、一文字一文字の描画になる事が多い。
【0134】電子ファイルの場合それでは検索ができな
いので、文字を連結して単語や文章に変換する必要があ
る。それがステップ30と31であり、文字と文字との
間隔がその文字の高さの1/2以上であれば文字に区切
りと判断し(ステップ32)、それ以上接近している場
合は単語の一部と判断する(ステップ37)。単語の一
部と判断された場合には、単語の区切りを見つける為
に、その時処理したGDIコードの文字情報を文字バッ
ファーに書き込み、次のGDIコードを取得すべくこの
ルーチンを抜け、ステップ28に進む。
【0135】一方、文字と文字の間隔が、文字の高さの
1/2より広い部分は、単語の区切りと判定し(ステッ
プ32)、データベース13にキーワードとして登録す
る。その中でもタイトルと思われる文字はキーワードの
中でも特にタイトルとして特別に保存し、タイトル文字
として検索の用に供する。タイトルと判定するアルゴリ
ズムは、対象とする文字が、原稿の縦寸法の上から1/
4以内にあると判断され(ステップ33)、かつ、原稿
中で最大サイズの文字とステップ34で判断される場合
にその文字をタイトルと判定し、タイトルであることを
識別できる情報を付加する。それ以外の文字はタイトル
以外の文字としてキーワード登録する(ステップ3
6)。タイトル自身もキーワードである事は言うまでも
ない。
【0136】図13の中の(*3)で示した部分(ステ
ップ27)の詳細な処理を、図15のフローチャートを
用いて説明する。
【0137】図15のフローチャートはファイリングド
ライバーでの動作であり、ドロー情報の処理を行なう。
始めに、GDIコードが直線か否かを判別し(ステップ
40)、直線である場合にはさらに表であるかどうかを
判別するルーチン(ステップ41〜ステップ48)に入
るが、直線以外の丸、だ円、四角、ポリゴン、斜目線、
曲線等である場合には、単純にドロー画グループに加え
(ステップ49)データベース13に保存する。
【0138】ステップ40で直線と判別された場合、す
でにデータベース13に登録済の直線グループの中の線
と接するかどうかを判定する(ステップ41)。判定方
法は、その時処理対象となっている直線の持つ2点(始
点、終点)のX座標とY座標のどれかが既に登録済の直
線グループの中の線の持つ2点の座標のどれかと1つで
も一致し、かつ、他の座標が所定範囲内にあれば接して
いると判別する。
【0139】たとえば図16の様に2本の線A、Bが接
している事を証明するには、 X1 =X3 をチェックするだけで良い。
【0140】AもBも斜目線でない事は分かっているか
ら、 X1 =X3 =X4 でもある。BのY座標は、Aの始点と終点の間になけれ
ばならないから、 Y4 ≦Y1 ≦Y3 でなければならない。すなわち、2本の直線の有する各
4種類のX、Y座標の内、3つが一致する成分を調べ、
もし一致する場合には、2つ共一致する成分を持つ直線
の他方の成分の間に他の線分の同じ座標が入っていれ
ば、接していると判別できる。これがX、Y共に成り立
つ時は、2本の線は直角を形成する。
【0141】図15に戻って説明すると、ステップ41
で、どの直線グループとも接しないと判別された直線
は、それ自身が新たな直線グループを形成するものとし
て登録する(ステップ50)。
【0142】一方、接する事が分かった直線について
は、その直線グループの一員として加える(ステップ4
2)。
【0143】ある直線グループの有するX座標Y座標の
各々の最大、最小の4つにより定まる領域を、その直線
グループの矩形領域と定める。この矩形領域は、新たな
直線が加わる毎に再計算する(ステップ43)。
【0144】その直線グループの構成するX座標だけま
たはY座標だけの種類の数を求め、それから1を引いた
数をセル数として算出する(ステップ44)。
【0145】また同様に、X座標の成分と、Y座標の成
分を別々に大きさ順にならべ、互いに接近する座標同士
の差分をセルサイズとして計算する(ステップ45)。
【0146】この直線グループの矩形領域の中に、文字
が入る場合には(ステップ46)、その文字を表中の文
字として表中の文字であることを識別できる情報ととも
に特別に登録し(ステップ47)、かつ、その直線グル
ープを表と判定する(ステップ48)。
【0147】文字を全く含まない直線グループは表とは
見なさず、通常の直線としてデータベース13に登録す
る。
【0148】
【発明の効果】以上説明した様に、本発明を用いれば紙
の文書の電子ファイリングとDTPアプリケーションで
作成したコンピュータファイル文書とが統合的に電子フ
ァイリングできるので、従来やや閉鎖的だった電子ファ
イリングがDTPファイリングと共に効果的に、手軽に
利用できる様になる。
【0149】従来の電子ファイリングでは、特別に訓練
されたオペレーターが必要であったが、本発明による電
子ファイリングシステムによれば、自分の机の上から誰
でも扱える様になり、紙文化は一新することができる。
【0150】従来キーワード検索一辺倒だった電子ファ
イリングも、本発明を用いれば原稿の特徴量によるレイ
アウト検索が可能になり、例えば、タイトルが「野球」
で、絵が2枚入っていて、表が1本入っており、キーワ
ードが「長島茂雄」という検索が実行できるので、目的
の文書が極めてスピーディーに探す事ができる。
【0151】また、ビットマップの全体画像の圧縮方法
は、JBIGという階層符合化理論を用いているので、
サムネール画像(小画像)表示による目視検索も使える
ので、原稿に書かれた内容をチェックしながらの検索も
可能になる。
【図面の簡単な説明】
【図1】本発明による電子ファイリング装置のブロック
ダイヤグラム。
【図2】検索アプリの位置づけを説明する図。
【図3】OCRアクセラレーターを使う場合の実施例を
示す図。
【図4】デバイスドライバーの要部を説明した図。
【図5】対話式会議システムへの応用例を示す図。
【図6】Text−Tab形式による表の情報の表現方
法を示す図。
【図7】図形のグループ化の為の2つの例を示す図。
【図8】ピクチャー部分をコード化する為の基本構文を
示す図。
【図9】テキスト部分をコード化する為の基本構文を示
す図。
【図10】ファイリングドライバーと紙の文書の電子フ
ァイリングとの統合化を示す図。
【図11】ファクシミリ文書の電子ファイリングを示す
図。
【図12】実施例の全体処理のフローチャート。
【図13】GDIコードの解析及び特徴抽出処理のフロ
ーチャート。
【図14】文字バッファの処理のフローチャート。
【図15】ドロー情報の処理のフローチャート。
【図16】直線の解析を説明する図。
【図17】TAB−Text形式表記例示図。
【図18】表のSYLK形式表記例示図。
【図19】ピクチャーのコード化記述例示図。
【図20】図形の分類例を示す図。
【図21】文のコード化記述例示図。

Claims (34)

    【特許請求の範囲】
  1. 【請求項1】 アプリケーションソフトウエアからプリ
    ンタドライバーに伝達される情報をデータベースに蓄積
    する手段を有することを特徴とする電子ファイリング装
    置。
  2. 【請求項2】 前記電子ファイリング装置において、印
    刷用の描画コマンドを文書蓄積に達したフォーマットに
    変換する手段を有することを特徴とする請求項1に記載
    の電子ファイリング装置。
  3. 【請求項3】 前記電子ファイリング装置において、キ
    ーワード検索用の情報を抽出して保存する手段を有する
    ことを特徴とする請求項1に記載の電子ファイリング装
    置。
  4. 【請求項4】 前記電子ファイリング装置において、描
    画コマンドの中にビットマップ画像情報が含まれる場合
    には、該画像データを蓄積する際に圧縮する手段を有す
    ることを特徴とする請求項1に記載の電子ファイリング
    装置。
  5. 【請求項5】 アプリケーションソフトウエアからプリ
    ンタドライバーに伝達される描画情報を、特徴に応じて
    分割する手段と、 該分割された情報毎に最適な圧縮処理を施す手段と、 前記圧縮された情報をデータベースに蓄積することを特
    徴とする電子ファイリング装置。
  6. 【請求項6】 前記分割は、文字部分か、ベクトル描画
    部分か、ビットマップ画像部分かによって行うことを特
    徴とする請求項5に記載の電子ファイリング装置。
  7. 【請求項7】 前記電子ファイリング装置において、プ
    リンタドライバーに伝達される描画情報の内、ビットマ
    ップ画像部分を認識してコード化する手段と、 前記認識して得たコードの内、文字コードは前記文字部
    分と同様に扱うことを特徴とする請求項6に記載の電子
    ファイリング装置。
  8. 【請求項8】 アプリケーションソフトウエアからプリ
    ンタドライバーに伝達される描画情報からタイトル部分
    を抽出する手段と、 前記抽出されたタイトル情報を検索のキー情報として登
    録することを特徴とする電子ファイリング装置。
  9. 【請求項9】 前記タイトル情報は、タイトルの有無と
    することを特徴とする請求項8に記載の電子ファイリン
    グ装置。
  10. 【請求項10】 前記タイトル情報は、タイトルを認識
    して得たコード情報とすることを特徴する請求項8に記
    載の電子ファイリング装置。
  11. 【請求項11】 前記描画情報から特徴に応じて分割す
    る手段を有することを特徴とする請求項8に記載の電子
    ファイリング装置。
  12. 【請求項12】 前記分割は、文字部分か、ベクトル描
    画部分か、ビットマップ画像部分かによって行うことを
    特徴とする請求項8に記載の電子ファイリング装置。
  13. 【請求項13】 アプリケーションソフトウエアからプ
    リンタドライバーに伝達される描画情報から表部分を抽
    出する手段と、前記抽出された表情報を検索のキー情報
    として登録することを特徴とする電子ファイリング装
    置。
  14. 【請求項14】 前記表情報は、表の有無とすることを
    特徴とする請求項13記載の電子ファイリング装置。
  15. 【請求項15】 前記表情報は、表を構成する段数とす
    ることを特徴とする請求項13に記載の電子ファイリン
    グ装置。
  16. 【請求項16】 前記描画情報から特徴に応じて分割す
    る手段を有することを特徴とする請求項13に記載の電
    子ファイリング装置。
  17. 【請求項17】 前記分割は、文字部分か、ベクトル描
    画部分か、ビットマップ画像部分かによって行うことを
    特徴とする請求項13に記載の電子ファイリング装置。
  18. 【請求項18】 アプリケーションソフトウエアからプ
    リンタドライバーに伝達される描画情報からグラフ部分
    を抽出する手段と、 前記抽出されたグラフ情報を検索のキー情報として登録
    することを特徴とする電子ファイリング装置。
  19. 【請求項19】 前記グラフ情報は、グラフの有無とす
    ることを特徴とする請求項18記載の電子ファイリング
    装置。
  20. 【請求項20】 前記描画情報から特徴に応じて分割す
    る手段を有することを特徴とする請求項18に記載の電
    子ファイリング装置。
  21. 【請求項21】 前記分割は、文字部分か、ベクトル描
    画部分か、ビットマップ画像部分かによって行うことを
    特徴とする請求項18に記載の電子ファイリング装置。
  22. 【請求項22】 アプリケーションソフトウエアからプ
    リンタドライバーに伝達される描画情報からビットマッ
    プ画像部分を抽出する手段と、 前記抽出されたビットマップ画像情報を検索のキー情報
    として登録することを特徴とする電子ファイリング装
    置。
  23. 【請求項23】 前記ビットマップ画像情報は、ビット
    マップ画像の有無とすることを特徴とする請求項22記
    載の電子ファイリング装置。
  24. 【請求項24】 前記ビットマップ画像情報は、ビット
    マップ画像の個数とすることを特徴とする請求項22に
    記載の電子ファイリング装置。
  25. 【請求項25】 前記描画情報から特徴に応じて分割す
    る手段を有することを特徴とする請求項22に記載の電
    子ファイリング装置。
  26. 【請求項26】 前記分割は、文字部分か、ベクトル描
    画部分か、ビットマップ画像部分かによって行うことを
    特徴とする請求項22に記載の電子ファイリング装置。
  27. 【請求項27】 原稿を光学的に読み取る手段と、 前記読み取った原稿の画像を圧縮してデータベースに保
    存する手段と、 前記読み取った画像を文字部分と画像部分とに分割する
    手段と、 前記分割された文字部分を認識してコード化し、保存す
    る手段と、 前記保存した文字コードと指定されたキーワードが一致
    するか否か判定する手段と、 前記判定により一致すると判定される場合に、一致する
    画像を伸長して表示する手段とを有することを特徴とす
    る電子ファイリング装置。
  28. 【請求項28】 前記原稿を光学的に読み取る手段に替
    えて、公衆回線により画像を受信する手段を有すること
    を特徴とする請求項27に記載の電子ファイリング装
    置。
  29. 【請求項29】 アプリケーションソフトウエアからプ
    リンタドライバーに伝達された情報を蓄積に適したフォ
    ーマットに変換する手段と、 前記変換された情報を蓄積する手段とを有することを特
    徴とする電子ファイリング装置。
  30. 【請求項30】 前記変換の水準を複数段階設け、アプ
    リケーションソフトウエアの機能の段階によって変換の
    水準を選択することを特徴とする請求項29に記載の電
    子ファイリング装置。
  31. 【請求項31】 前記プリンタドライバーの情報の流れ
    を双方向とすることを特徴とする請求項29に記載の電
    子ファイリング装置。
  32. 【請求項32】 前記アプリケーションソフトウエアと
    のインターフェイスを汎用ドライバーの形式とすること
    を特徴とする請求項29に記載の電子ファイリング装
    置。
  33. 【請求項33】 前記情報の蓄積は、ネットワーク上の
    データベースとすることを特徴とする請求項29に記載
    の電子ファイリング装置。
  34. 【請求項34】 前記データベースに替えて、複数台数
    のクライアントコンピュータ同士で情報を送受信する手
    段を有することを特徴とする請求項33に記載の電子フ
    ァイリング装置。
JP28526094A 1994-11-18 1994-11-18 電子ファイリング装置 Expired - Lifetime JP3683925B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP28526094A JP3683925B2 (ja) 1994-11-18 1994-11-18 電子ファイリング装置
US08/560,496 US5907835A (en) 1994-11-18 1995-11-17 Electronic filing system using different application program for processing drawing commands for printing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28526094A JP3683925B2 (ja) 1994-11-18 1994-11-18 電子ファイリング装置

Publications (2)

Publication Number Publication Date
JPH08147446A true JPH08147446A (ja) 1996-06-07
JP3683925B2 JP3683925B2 (ja) 2005-08-17

Family

ID=17689201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28526094A Expired - Lifetime JP3683925B2 (ja) 1994-11-18 1994-11-18 電子ファイリング装置

Country Status (1)

Country Link
JP (1) JP3683925B2 (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2383153A (en) * 2001-12-17 2003-06-18 Hemera Technologies Inc Search engine for computer graphic images
JP2003531441A (ja) * 2000-04-14 2003-10-21 ピクセル(リサーチ)リミテッド デジタルドキュメント処理のためのシステム及び方法
JP2006119923A (ja) * 2004-10-21 2006-05-11 Takaharu Agari 電子文書管理システム
JP2006252001A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd ドキュメント処理装置
JP2007200014A (ja) * 2006-01-26 2007-08-09 Ricoh Co Ltd 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
US7408668B2 (en) 1999-01-14 2008-08-05 Fujifilm Corporation Image data communication system, server system, method of controlling operation of same, and recording medium storing program for control of server system
JP2009078570A (ja) * 1998-10-09 2009-04-16 Ricoh Co Ltd プリンタ装置
JP2009140127A (ja) * 2007-12-05 2009-06-25 Fujitsu Ltd 印刷データ処理プログラム、方法及び装置
JP2010004531A (ja) * 2008-06-20 2010-01-07 Sharp Corp 複合機及びプリントコンテナを変更する方法
JP2011090691A (ja) * 2010-11-12 2011-05-06 Fuji Xerox Co Ltd ドキュメント処理装置、ドキュメント処理装置の制御方法、及びプログラム
US7990561B2 (en) 2007-07-19 2011-08-02 Canon Kabushiki Kaisha Image processing server, image processing method, and computer readable storage medium
US8169631B2 (en) 2006-03-02 2012-05-01 Canon Kabushiki Kaisha Printing apparatus, information processing apparatus, control method thereof, print management system, and program
US8270717B2 (en) 2007-12-19 2012-09-18 Canon Kabushiki Kaisha Metadata determination method and image forming apparatus
US8320019B2 (en) 2008-07-09 2012-11-27 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program thereof
US8515186B2 (en) 2005-12-26 2013-08-20 Canon Kabushiki Kaisha Image processor, image processing method and storage medium
US9299015B2 (en) 2012-09-28 2016-03-29 Brother Kogyo Kabushiki Kaisha Non-transitory computer-readable recording medium and template processing method
JP2022012657A (ja) * 2020-07-02 2022-01-17 株式会社ダブルスタンダード 情報処理装置、情報処理方法及び情報処理プログラム

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4704508B2 (ja) * 1998-10-09 2011-06-15 株式会社リコー プリンタシステム
JP2009078570A (ja) * 1998-10-09 2009-04-16 Ricoh Co Ltd プリンタ装置
JP2010274658A (ja) * 1998-10-09 2010-12-09 Ricoh Co Ltd プリンタ装置
US7408668B2 (en) 1999-01-14 2008-08-05 Fujifilm Corporation Image data communication system, server system, method of controlling operation of same, and recording medium storing program for control of server system
JP2003531441A (ja) * 2000-04-14 2003-10-21 ピクセル(リサーチ)リミテッド デジタルドキュメント処理のためのシステム及び方法
GB2383153A (en) * 2001-12-17 2003-06-18 Hemera Technologies Inc Search engine for computer graphic images
JP2006119923A (ja) * 2004-10-21 2006-05-11 Takaharu Agari 電子文書管理システム
JP2006252001A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd ドキュメント処理装置
US8515186B2 (en) 2005-12-26 2013-08-20 Canon Kabushiki Kaisha Image processor, image processing method and storage medium
JP2007200014A (ja) * 2006-01-26 2007-08-09 Ricoh Co Ltd 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
US8169631B2 (en) 2006-03-02 2012-05-01 Canon Kabushiki Kaisha Printing apparatus, information processing apparatus, control method thereof, print management system, and program
US7990561B2 (en) 2007-07-19 2011-08-02 Canon Kabushiki Kaisha Image processing server, image processing method, and computer readable storage medium
JP2009140127A (ja) * 2007-12-05 2009-06-25 Fujitsu Ltd 印刷データ処理プログラム、方法及び装置
US8270717B2 (en) 2007-12-19 2012-09-18 Canon Kabushiki Kaisha Metadata determination method and image forming apparatus
JP2010004531A (ja) * 2008-06-20 2010-01-07 Sharp Corp 複合機及びプリントコンテナを変更する方法
US8320019B2 (en) 2008-07-09 2012-11-27 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program thereof
JP2011090691A (ja) * 2010-11-12 2011-05-06 Fuji Xerox Co Ltd ドキュメント処理装置、ドキュメント処理装置の制御方法、及びプログラム
US9299015B2 (en) 2012-09-28 2016-03-29 Brother Kogyo Kabushiki Kaisha Non-transitory computer-readable recording medium and template processing method
JP2022012657A (ja) * 2020-07-02 2022-01-17 株式会社ダブルスタンダード 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP3683925B2 (ja) 2005-08-17

Similar Documents

Publication Publication Date Title
US5907835A (en) Electronic filing system using different application program for processing drawing commands for printing
US8001466B2 (en) Document processing apparatus and method
US8532388B2 (en) Image processing apparatus, image processing method, and computer program
JP5274305B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US5963966A (en) Automated capture of technical documents for electronic review and distribution
US9063953B2 (en) System and methods for creation and use of a mixed media environment
US8112706B2 (en) Information processing apparatus and method
US8521737B2 (en) Method and system for multi-tier image matching in a mixed media environment
US8838591B2 (en) Embedding hot spots in electronic documents
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
CN101441713B (zh) 一种pdf文件的光学字符识别方法及装置
JP5743443B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP3683925B2 (ja) 電子ファイリング装置
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US20060277159A1 (en) Accuracy in searching digital ink
US20070047819A1 (en) Data organization and access for mixed media document system
US20070050712A1 (en) Visibly-Perceptible Hot Spots in Documents
US20070047818A1 (en) Embedding Hot Spots in Imaged Documents
US20060262352A1 (en) Method and system for image matching in a mixed media environment
US20060285172A1 (en) Method And System For Document Fingerprint Matching In A Mixed Media Environment
US20070050411A1 (en) Database for mixed media document system
US20070046983A1 (en) Integration and Use of Mixed Media Documents
KR20080031455A (ko) 혼합 미디어 환경에서의 이미지 정합 방법 및 시스템
KR100960639B1 (ko) 혼합 미디어 문서 시스템용의 데이터 구성 및 액세스
JPH09223240A (ja) 文書電子化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041026

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100603

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

EXPY Cancellation because of completion of term