JP3683925B2 - 電子ファイリング装置 - Google Patents

電子ファイリング装置 Download PDF

Info

Publication number
JP3683925B2
JP3683925B2 JP28526094A JP28526094A JP3683925B2 JP 3683925 B2 JP3683925 B2 JP 3683925B2 JP 28526094 A JP28526094 A JP 28526094A JP 28526094 A JP28526094 A JP 28526094A JP 3683925 B2 JP3683925 B2 JP 3683925B2
Authority
JP
Japan
Prior art keywords
information
filing
driver
computer
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP28526094A
Other languages
English (en)
Other versions
JPH08147446A (ja
Inventor
良和 横溝
杉浦  進
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP28526094A priority Critical patent/JP3683925B2/ja
Priority to US08/560,496 priority patent/US5907835A/en
Publication of JPH08147446A publication Critical patent/JPH08147446A/ja
Application granted granted Critical
Publication of JP3683925B2 publication Critical patent/JP3683925B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、文書を電子的な手段によりファイリング整理する電子ファイリング装置に関する。
【0002】
本発明は、紙の原稿をスキャンした画像と、DTP文書とを統合化し、共通に扱える電子ファイリング装置に関するものである。
【0003】
【従来の技術】
従来の電子ファイリング装置は、大型で高価な専用機であった。また、操作方法も専用のものなので、専門的に教育されたオペレーターが必要であるなど、使いにくい面があった。また、従来の電子ファイリング装置はパーソナルコンピュータとは独立した装置になっており、DTP文書と共通に管理することはできなかった。
【0004】
【発明が解決しようとしている課題】
小型で安価な電子ファイリング装置を実現する為には、市販のパーソナルコンピュータ(以下パソコン)をベースにしたファイリング技術を実現する事が考えられる。電子ファイリング装置に必要な機能要素は、スキャナー、OCR、キーワード検索機能、(光磁気)ディスク装置等であり、「紙」に印刷された文書をスキャナーで読んでOCRで文字情報をコード化し、キーワードを自動的に拾い出してディスク装置に一緒に保存していた。専用機であれば、これだけの機能で十分であるが、パソコンをベースに電子ファイリングを行う際には、対象とする文書は「紙」に印刷された文書だけではなく、キーボードから入力して作成されたDTP文書も統一的に扱う必要性が出てくる。ところが、DTP文書というのは、作成したアプリケーションによってファイルフォーマットが全く異なり、それらをファイルの形で保存すると以下の様な問題が生じる。
【0005】
(1)ネットワーク上にあるサーバーに保存したDTP文書を複数のパソコンからアクセスする場合、全てのパソコンに作成時に用いたアプリケーションと同じアプリケーションが存在するという保証は無い。バージョンが違うだけでも問題である。
【0006】
(2)ネットワーク上にアーキテクチャーの異なるパソコンが存在する場合、たとえ同一アプリケーションの作成したファイルでもファイル形式が異なるのが普通なので、相互にアクセスできない。
【0007】
(3)市販のアプリケーションには、キーワードを抽出する機能など無いのが普通であるから、電子ファイリング装置としては使用できない。
【0008】
(4)専用の検索ソフトを用意し、市販のアプリケーションからは検索ソフトを介して間接的にファイリングをする場合、ファイルを媒介するか、カット&ペースト機能を媒介して文書情報を伝送する訳だが、操作手順が繁雑で時間がかかり、自動化も困難である。
【0009】
(5)従来の電子ファイリング装置はパーソナルコンピュータとは独立した装置になっており、DTP文書と共通に管理する事はできなかった。
【0010】
【課題を解決するための手段】
上記課題を解決する為に、本発明の電子ファイリング装置は、電子ファイリングを行なうためのファイリングドライバーと、前記ファイリングドライバーを実行するコンピュータとを有する電子ファイリング装置であって、前記ファイリングドライバーは、アプリケーションソフトウエアからの印刷指示に応じて起動され、前記コンピュータは、当該起動されたファイリングドライバーを実行することにより、当該アプリケーションソフトウエアから伝達される印刷用の描画情報を受信し、当該受信した印刷用の描画情報を文書蓄積に適したフォーマットに変換し、当該変換された描画情報を電子ファイリング用のデータベースに蓄積することを特徴とする。
【0011】
上記課題を解決する為に、本発明の電子ファイリング方法は、アプリケーションソフトウエアと前記アプリケーションソフトウエアからの指示に応じて起動されるファイリングドライバーと前記ファイリングドライバーを実行するコンピュータとを有する装置において、前記コンピュータにおいて前記ファイリングドライバーを実行させることにより、電子ファイリングを行なうように制御する電子ファイリング方法であって、前記アプリケーションソフトウエアからの印刷指示に応じて起動されたファイリングドライバーを前記コンピュータに実行させることにより、当該アプリケーションソフトウエアから伝達される印刷用の描画情報を受信し、前記受信した印刷用の描画情報を文書蓄積に適したフォーマットに変換し、前記変換された描画情報を電子ファイリング用のデータベースに蓄積することを特徴とする。
【0044】
【目的】
本発明は、従来ハード/ソフト共にスタンドアロンの機械として提供されていた文書蓄積/検索装置を、市販されているコンピュータをベースにし、市販されている幾多のアプリケーションをフロントエンドとする文書蓄積/検索装置を提供する事を目的とする。
【0045】
本発明は、デスクトップのパソコンを介して簡単に文書の蓄積/検索ができる様にすることで、小型で安価な電子ファイリング方法及びその装置を提供することを目的とする。
【0046】
本発明は、従来行われていたキーワード検索に加えて、DTP文書やスキャンされた画像の中に含まれる「表」や「円グラフ」「タイトル」「ビットマップ画像」等の有無や個数等によっても検索時間の短縮あるいは検索精度を上げる事を目的とする。
【0047】
【実施例】
以下、図に基づき本発明の実施例を詳細に説明する。
【0048】
図1は本実施例の電子ファイリング装置のブロックダイヤグラムである。100はホストコンピュータであり、枠で囲まれた機能を実行する。ここでは1つの枠で表したが、この枠内に表した各機能は1つ或いは複数のCPUで実行しても良いし、1つ或いは複数のホストコンピュータで実行しても良い。同図に於て、1、2、3は市販のアプリケーションであり、例えばスキャナーアプリ1、ワープロアプリ2、表計算アプリ3等を示している。これらのアプリケーション間でデータのやり取りをするには、ファイル4、5を介して行うのは非常に困難である。なぜなら、スキャナーアプリ、ワープロアプリ、表計算アプリ等が生成するファイルのフォーマットはそれぞれのベンダーが独自に定めたものなので、互換性は全く無いからである。アプリケーションに依存しないファイルフォーマットとして「TIFF」「PICT」「EPS」「GIF」「TGA」等の業界標準フォーマットは全てのアプリケーションに対して万能ではない。
【0049】
コンピューターがMacintosh(登録商標)やWindows(登録商標)の場合には、「カット&ペースト」の機能を用いてやり取りする仕組みが用意されているが、フォーマットは「PICT」か「GIF」に限定されてしまう。よって、コンピュータが限定された場合であってもカット&ペーストでのデータのやり取りはできない。
【0050】
一方、これらのアプリケーションが印刷する際にプリンタードライバーに引き渡すデータは、Macintoshの場合はQuickDraw(登録商標)、Windowsの場合はGDI(登録商標)に統一されている。図1はMacintoshのアプリケーション1、2、3がプリンタードライバー6に印刷データを渡している時の様子を示している。この時、Postscriptアプリケーションの一部に例外はあるが、ほとんどのアプリケーションがQuickDrawの描画コマンド7、8、9をプリンタードライバー6に渡している。本発明はこの特徴に着目し、プリンタードライバー6の中に文書変換/蓄積機能を備え、QuickDrawを処理対象とした。
【0051】
10−1はQuickDraw−共通文書変換装置である。QuickDrawの描画コマンドはコンピュータに依存した描画コマンドであり、Macintoshのみに限定すれば殆んどのアプリケーションに共通の言語であるが、WindowsではGDIコマンドが用いられており、互換性は無い。従ってこのQuickDraw−共通文書変換装置10−1によりデータベース13にセーブしやすい一般的なドキュメントの形に変換を行う。
【0052】
共通文書12、14はドローであってもペイントであっても、また混在していてもどの場合でも各々処理できる。ドローとは描画の線の太さ、色、座標点を指定する数値で表現する描画方法で、それを受け取った側も画像におとすにはその数値をデコードする機能がなければならない。一方、ペイントとはビットマップ画像の事であり、データのサイズは大きくなるが、受け取った側のデコード機能は不用である。
【0053】
10−2はOCR装置でビットマップ画像を認識してコード化する場合に用いるが、すでにコード状態であるドロー系の情報の場合にはこのOCR装置10−2はバイパスする。
【0054】
10−3はキーワード抽出装置で、QuickDraw−共通文書変換装置10−1により変換して得た共通文書の中から、検索に使えそうな単語を拾いだし、その共通文書とセットでアクセスする為のものである。
【0055】
10−4はデータベースAPIで、ローカルまたはネットワークを介して接続されているリモートのデータベース13に接続する為のものである。
【0056】
プリンタードライバーAPI6は、システムが提供するものに合わせる。このAPIはプリンタが印刷だけを想定している通常の場合はデータの流れは一方通行であり、データベース13から引き出した文書をQuickDrawコマンドに逆変換してアプリケーション1、2、3側に送る事は出来ない。しかしながら、本実施例におけるプリンタードライバーAPIは汎用ドライバーの形式とする。プリンタードライバーを介して双方向の文書交換をする為には、OSやアプリケーションの変更が必要であるが、専用の文書検索ソフトウエアを用いた場合には双方向の文書交換が実現できる。
【0057】
共通文書12はLAN11を介してデータベース13に送られる。
【0058】
この図1における装置を文書のファイリングシステムとして用いるには、通常スキャナー15で原稿を読み取る。その制御はスキャナーアプリ1が行うが、そのアプリがスキャナー15により読み取った原稿を印刷する場合にはやはりQuickDraw7に変換してプリンタードライバー6に伝達する。QuickDrawとは言っても、スキャン画像の場合には中身はビットマップであるから、10−1でビットマップに戻し、必要に応じて圧縮回路(図示せず)によって画像圧縮を行う。
【0059】
プリンタードライバー6は、パソコンのOSがサポートする全てのQuickDrawコマンドをサポートしており、あらゆるアプリケーションからの印刷要求に応える。一方、プリンタードライバー6が一方通行であった時はアプリケーション1、2、3は自分の都合により一部のQuickDrawコマンドしかサポートしなくても何等問題は無かった。ところが、プリンタードライバー6を双方向性にし、QuickDraw−共通文書変換装置10−1が出力するQuickDrawコマンドを各アプリケーションで表示可能にする為には、やはり各アプリケーションが全てのQuickDrawコマンドをサポートする必要がある。なぜなら、その文書は自分より高機能なアプリケーションが作成したものかも知れないからである。その為プリンタードライバー6は、アプリケーションに伝達しようとしたドロー系のコマンドがアプリケーションに理解できないと拒絶された場合には、それをペイント系のデータに変換して再度伝達をしなおす。
【0060】
誤り制御機能の無いアプリケーションの為に、QuickDraw運用に水準を設け、例えばJISの漢字コードの毎く第一、第二、第三水準に分類し、伝達しても理解されない事が分かっている場合には、あらかじめ低水準のQuickDrawコマンドに変換して伝達しても良い。
【0061】
図2は、検索アプリの位置づけを説明する図面である。同図に於て、図1と共通の機能要素には同一の番号を付与してある。図1では市販のアプリケーション1、2、3からデータベース13への文書蓄積を説明したが、市販のアプリケーションはやはり文書蓄積/検索用に設計されている訳ではないから、スピーディーな検索には専用の検索アプリ16が必要となる。このアプリはQuickDraw−共通文書変換装置10−1と直接接続する。データフォーマットはQuickDrawではなく共通文書フォーマット17である。10−1は汎用ドライバーとして構築されている。
【0062】
図3は、OCRアクセラレーターを使う場合の実施例である。10−5がそのアクセラレータである。アクセラレータは通常ハードウエアで実現する。OCRには変換時間がかかるので、専用のハードウエアに処理を代行させる事により高速化が図れる。
【0063】
また、QuickDraw−共通文書変換装置10−1はプリンタードライバー/汎用ドライバーとしてソフトウエアで実現する。一方、OCR10−2、キーワード検索装置10−3、データベースAPI10−4はバックグラウンドで走る汎用ドライバーとしてソフトまたはハードで実現し、これらが処理をしている時でも、オペレーターの他の装置を中断しない。
【0064】
図4はその関係を詳細に説明した図である。10−6はプリントキュー、10−7はバッファーメモリーである。QuickDraw−共通文書変換装置10−1はもっぱらプリンタードライバー6と一体で動作し、プリントキュー10−6への出力はフォアグランドで行う。一方、OCR10−2以下はプリントキュー10−6から文書データーをバックグランドで受取り、アプリケーション1、2、3、16と同時並行的に処理する。バッファーメモリー10−7は、プリントキュー10−6が一時的に文書データーを蓄えておく為のものである。
【0065】
図5は、対話式会議システムへの応用例である。同図に於て、左半分は図1のパソコンと同じ物であり、説明上必要な番号には「a」の枝番を付けてある。一方、右半分は第2のパソコンで、「b」の枝番を付けたものは、「a」の枝番の付いた同じ番号の要素と同じ物である。第1のパソコン(左)にはスキャナー15をそのまま残して説明してあるが、第2のパソコン(右)にはスキャナーが無い場合の状態を説明している。この場合、OCR、キーワード検索、データーベースAPI機能は不用なので斜線で示した様に機能を止めて使う。ネットワーク上を流れるデーターが共通文書である限りは、アプリケーションとのインターフェースは共通文書であっても他のフォーマット、即ち、QuickDrawあっても構わない。スキャナー15からのデータはプリンタードライバー6が共通文書に変換するので、何等問題無く、相互通信が可能である。
【0066】
本実施例においてはプリンタードライバーの、専らファイリングの為に用いられている部分のみ説明するので、ここからは「ファイリングドライバー」と呼ぶ事にする。ファイリングドライバーの機能は以下の通りである。
【0067】
(1)市販のアプリケーションからのファイリングを可能にする。
【0068】
(2)形式はプリンタドライバーの形式で作成する。市販のアプリケーションから一般のプリンターに印刷する時と全く同じ操作により、ファイリングを実現する。すなわち、アプリケーションから発行されるGDI描画コマンドを所定のファイル形式に変換してハードディスクにファイルを保存する。ファイリングに特有のダイアログはファイリングドライバーが表示器(図示せず)に表示する。
【0069】
(3)ネットワーク対応は、データベース自身がネットワーク対応しており、ファイリングドライバーとしては、特にネットワークを意識しなくてもネットワーク上のファイルサーバーにアクセスできる。
【0070】
(4)ファイル形式
例えばマイクロソフト社のWindowsのGDIの描画コマンドは、最終的に以下の情報を含むファイル形式でデータベースに保存される。
【0071】
i)ビットマップ画像
ii)文字情報
iii)レイアウト情報
iv)キーワード情報
ビットマップ画像はファイリングの基本となる情報で、「印刷ダイアログ」で選択した用紙サイズと同じサイズのビットマップ画像を、以下の圧縮方式のいずれかを用いて圧縮する。
【0072】
i)白黒2値画像 JBIG
ii)多値画像 JPEG
文字情報に関しては、本来のファイリングではスキャナーで読んだビットマップ画像にOCRを掛けて文字情報を抽出する。ファイリングドライバーの中でもこの方法を踏襲するが、GDIコードでドライバーに渡されるので、GDIコマンドから直接文字情報を抽出する。すなわち、文字情報については、以下の2種類がある。
【0073】
i)OCRによって得られる文字情報
ii)GDIコマンドを解析して得られる文字情報
レイアウト情報については、上記OCRの前処理プログラムであるブロックセレクション(BS)情報から抽出する。すなわち、レイアウト情報については以下の2種類がある。
【0074】
i)ブロックセレクションで得られるレイアウト情報
ii)GDIコマンドを解析して得られるレイアウト情報
キーワード情報については、キーワード生成ルーチンを用いて文字情報の中から抽出する。
【0075】
レイアウト情報抽出の方法は以下の通りである。
【0076】
GDIコードを解析して、レイアウト情報を抽出する。レイアウト情報はページ情報とブロック情報とから成り、以下の手順でデーターの抽出を行う。
【0077】
i)GDIコード抽出(データ入力)
ii)ブロック分解
iii)ブロック情報抽出
iv)ページ情報抽出
v)DBアクセス(ファイル作成)
ブロック分解/情報抽出の方法は以下の通りである。
【0078】
〈バンディングの結合〉
アプリから渡されるGDIコードバンディングされている場合には、1ページ分全部のGDIコードを取得しまとめる。
【0079】
〈ビットマップ画像である事の判定方法〉
(1)アプリから渡されるGDIコードの中から、ビットマップ画像(Image)として定義されている部分は、MS Windows SDKの記述により、容易にビットマップ画像である事が判定できる。目標1で全体画像をファイルに保存しているので、画像情報そのものは捨ててしまって構わない。ここで保存する情報は以下の通り。
【0080】
i)ビットマップ画像のID
ii)ビットマップ画像の種類のID(二値、ハーフトーン、カラー、フルカラー)
iii)ビットマップ画像のサイズ
iv)印刷画面上での位置情報
v)ビットマップ画像の標準化色(8色)のヒストグラムの上位3種類
(標準化色とは、RGB各色成分の上位3ビットをテーブルルックアップ方式で8色に変換する。)
などである。
【0081】
(2)判定に成功したGDIコードは、次の判定では無視する。
〈表である事の判定方法〉
Windows OSがファイリングドライバーに渡すGDIコードを解析し、その中に表が含まれているかどうかを判別する方法は以下の通り。
【0082】
(1)グループ化:アプリケーションから渡されるGDIコードの中から、斜め線を無視し、縦線/横線のみを選別し、X座標またはY座標が「一致」する直線をグループにしていく。(一致する直線を加える毎にその直線の座標も「一致」の判定基準に加える)
(2)矩形領域算出:グループ化した直線のグループの内、X座標、Y座標の最大値/最小値を「表」全体の矩形領域と推定する。
【0083】
(3)セル数算出:発見したX座標及びY座標の種類の数から1を引いた数をX座標及びY座標のセル数と推定する。セル数がX、Y方向共に2以上の時、それを「表」と推定する。
【0084】
(4)セルサイズ算出:発見したX座標及びY座標の、数字が互いに接近する二点間の差分をセルサイズと推定する。
【0085】
(5)表の判定:矩形領域の内部に文字があれば、そこを「表」と断定する。文字が無ければ図形と推定する。
【0086】
(6)書式:「表」の内部の文字はまとめて、TAB−Text形式で表現する。
【0087】
例えば、図6の様な表は図17の様にTAB−Text形式表記できる。
【0088】
ただし図17において、(T)はタブ、(CR)はキャリッジリターン。
【0089】
あるいは図18の様にSYLK形式で表記しても良い。
〈図形の判定方法〉
(1)矩形領域の拡大:あるGDIコードが矩形領域を持っている場合には、その矩形領域を「拡大された矩形領域」とし、直線の様に矩形領域を持たないGDIコードの場合には、それが持つ2点が構成する矩形領域を「拡大された矩形領域」とする。
【0090】
(2)コードのグループ化:「拡大された矩形領域」同士が重なるGDIコード同士は、一つのグループに属すると判定する。
【0091】
例えば、図7(A)、(B)に示す様な図形があった場合、(A)は直線の矩形領域が大きいので1個のグループと判定されるが、(B)は2個のグループと判定される。
【0092】
(3)グループ化されたGDIコーポネントのX座標およびY座標の最大値/最小値を「図形の矩形領域」とする。グループ化されたGDIコンポーネント群を「ピクチャー」と呼ぶ。
【0093】
(4)「ピクチャー」をコード化する。
【0094】
コード化の基本ルールは図8に示す基本構文に従って図19の様な項目の内容を記述する。
【0095】
(5)図形を分類する
図形は図20のルールに従って分類する。
【0096】
〈テキスト部の判定〉
(1)テキストの連結:1文字単独で文字が現れた場合、フォントサイズから計算される「キャラクタ幅」に単独文字があれば、「単語」として連結する。「単語」はスペースを含まない。
【0097】
(2)「単語」の連結:「単語」同士がスペースのサイズ程度に近接していれば、「行」として連結する。「行」はスペースを含み得る。
【0098】
(3)「文」の連結:「行」同士が「フォント高さ」の3倍以内にあるときは、「文」として連結する。「文」は複数の改行を含み得る。行端の「単語」の連結はやらない。
(日本語の場合、1行の全てが「単語」として認識される場合がある。)
(4)「文」をコード化する:コード化の基本ルールは「ピクチャー」として類似しており、図9に示す基本構文に従って図21の様な項目の内容を記述する。
【0099】
〈ブロック情報抽出の方法〉
ブロック毎にID番号を振る。その順番は、
i)自己ブロックID
ii)自己ブロック位置
iii)ブロックの大きさ
iv)ブロック属性(テキスト、図形、表、イメージ、グラフ、タイトル、文字コード)
v)親ブロックID
vi)子ブロックID
vii)そのページの中での順序
【0100】
〈ページ情報抽出の方法〉
タイトル部の判定方法は以下の通りである。
【0101】
ステップ1:
(1)最大フォントの判定:その文書の中で最もサイズの大きな「ストリング」を判定する。
【0102】
(2)場所の判定:最大サイズの「ストリング」が用紙の1/4より上(または下)にある時、それをタイトルと判定する。
【0103】
ステップ2:
(1)特徴フォントの判定:同一サイズであっても、アンダーライン、〈〉、「」、{}で特徴付けられた「ストリング」が用紙の1/4より上にある時、それをタイトルと判定する。
【0104】
ステップ3:
上記のいずれにも該当しない時、タイトルは無いものと判定する。
【0105】
〈紙の文書の電子ファイリングとの統合〉
図10は、今まで述べてきたファイリングドライバーを用いた市販アプリケーションからのファイリングと、紙の文書の電子ファイリングとの統合化を説明する図である。説明の都合上、市販アプリケーションからのファイリングを「DTPファイリング」、紙の文書の電子ファイリングを「OCRファイリング」と呼ぶ事にする。
【0106】
図の中央にデータベース13があり、それより左側には、今まで述べてきたファイリングドライバーを用いた市販のアプリケーションからのファイリング装置のブロック図が、右側には、紙の文書をスキャンしてファイリングする電子ファイリング装置のブロック図が書いてある。
【0107】
図2と共通の構成要素には同一の番号が付与してある。
【0108】
同図に於て、28はスキャナー、29はそれをドライブする為のスキャナーモジュール、31は電子ファイリングエンジン、30は検索モジュールである。スキャナーモジュール29と電子ファイリングエンジン31は、それぞれスキャナーアプリケーション1と検索アプリケーション16に符合する。点線33で囲んで示す様に、スキャナーモジュール29と電子ファイリングエンジン31は電子ファイリングエンジン31と一体になり、全体で「電子ファイリングアプリケーション」を形成している。
【0109】
電子ファイリングエンジン31には、ブロックセレクション、OCR、キーワード抽出という3つの大きな機能がある。スキャナーモジュール29に指示してスキャナー28から紙の原稿をスキャンして読み込みます。読み込んだビットマップ画像はスキャナーモジュール29で二値化され、電子ファイリングエンジン内でブロックセレクションプログラムにより、レイアウト情報が抽出される。抽出される情報は、テキスト領域及び画像領域のいずれかのプロファイルを持った矩形領域情報である。
【0110】
画像領域を示す情報は、レイアウト検索用にデータベースに保存される。ブロックセレクションの結果に基づき、OCRソフトによってテキスト領域が文字コードに変換される。
【0111】
その後、キーワード抽出プログラムによりテキスト情報からキーワードとして使えそうな情報が抽出され、それぞれデーターベースAPI32を介してデーターベース13に保存される。保存された文書は、検索モジュール30で簡単に見る事ができる。
【0112】
「OCRファイリング」はビットマップ画像からブロックセレクションプログラムによってレイアウト情報を抽出するので、「DTPファイリング」ほどには正確で詳細なレイアウト情報は得られないが、ビットマップ画像の有無、タイトルの有無、と言ったレベルの検索なら、両者共通に行える。OCRによって抽出したキャラクターコードは100%正確ではない。しかし、抽出したキャラクターコードそのものを再利用するのではなく、全文検索用のインデックス構築の為に用いるので、そこそこに正確であれば良く、手で認識誤りを修正する必要はない。
【0113】
データベースAPI32を介して保存される情報は、
i)文書全体のビットマップ画像の圧縮結果
ii)ブロックセレクション結果
iii)OCR結果
iv)候補文字情報
v)OCR結果から抽出したキーワード情報
等である。
【0114】
文書全体のビットマップ画像の圧縮方法はJBIGを用いる。JBIGモノクロの文書の圧縮用であるが、階層符合化方式によりサムネール画像を簡単に作れる。
【0115】
図11は、原稿の入力先としてFaxを取り込んでいるところを示す図である。Fax34で受診したMMR画像情報は、FaxI/F35でビットマップ画像に伸長され、電子ファイリングエンジン31に引き渡される。それ以降は紙の原稿をスキャナーで読んだ場合と全く同じである。
【0116】
〈フローチャートの説明〉
以下、フローチャートを用いて、各部の動作を詳細に説明する。
【0117】
図12は、アプリケーションプログラムと、OS(Windows)、ファイリングドライバーの動作を説明するフローチャートである。図中、左側がアプリケーション、中央がOS、右側がファイリングドライバーの動作を示している。
【0118】
OSがマルチタスクのものならもち論、シングルタスクの場合でも、アプリケーションとOS、ドライバーの動作は見掛け上独立したタスクの様に振る舞う。図中点線の矢印で示してある部分は、実際には関数コールであるが、C++やクラス定義の中では、「メッセージ」という表現を用いる事が一般的であり、本実施例ではその例に習う事にする。
【0119】
アプリケーションがドキュメントを作成してそれを本発明の電子ファイルにファイリングする時、通常の印刷動作と全く同じ操作を行なう。印刷メニューを選択すると(ステップ2)、OSに対して印刷開始メッセージが送られる。OSはこの時種々のOSサービスを実行しながら(ステップ6)イベントループに入り(ステップ7)、アプリケーションからの印刷開始メッセージを受け付けると、ドライバーを起動させる(ステップ8)。
【0120】
OSからのメッセージにより起動したファイリングドライバーは、レジスタセットやメモリ空間の確保等の初期化処理を実行(ステップ14)した後、初期化完了メッセージをOSに返す。この間OSはドライバーからの返事をループで待っている(ステップ9)。
【0121】
そしてアプリケーションに対し、ドライバーの準備が整った事を示すメッセージを送る(ステップ10)。
【0122】
アプリケーションはステップ3のループから抜け出し、プリンターに描画すべきGDIコードを出力する(ステップ4)。GDIコードを受け取ったOSは、プリンター(ドライバー)がGDIプリンターならばGDIコードのままで、またビットマッププリンターならばOSの中でGDIコードをラスタライズしてプリンタードライバーに渡す(ステップ11)。ファイリングドライバーは、プリンタードライバーをエミュレートしており、GDIプリンターかビットマッププリンターのどちらかである事を宣言することにより、そのどちらでも実現可能である。もしGDIプリンターであると宣言すると、OSからはGDIコードがそのままの形で送られて来るので、ドライバーの中では容易にGDIコードの解析ができるし、ビットマップが必要なら、OSのシステムコールを呼んで、ラスタライズする事ができる。
【0123】
もしビットマッププリンターであると宣言すると、OSの中でGDIをビットマップに変換するGDIサービス(ステップ11)が実行され、ファイリングドライバーにはビットマップが渡される。Windowsの場合、たとえビットマップにしても、ビットマップ・コードの片すみに元のGDIコードが記載されているから、本実施例ではビットマツプを宣言する事にする。
【0124】
ファイリングドライバーは受け取ったGDIコードを解析し(ステップ16)、原稿に書かれている内容の特徴を抽出し(ステップ17)、それをデータベース13に保存する(ステップ18)。ドライバーからOSに対し、印刷完了のメッセージが届いたら、ドライバーの処理待ちになっているループ(ステップ12)から抜け出し、印刷完了メッセージをアプリケーションに送る(ステップ13)と共に、ファイリングドライバーを終了させ、メモリー空間からスワップアウトする。アプリケーションは、OSからの印刷完了メッセージを受けて、印刷シーケンスを終了する(ステップ5)。
【0125】
図中、(*1)で示した部分(ステップ16及びステップ17)の詳細な処理を図13のフローチャートを用いて説明する。
【0126】
図13のフローチャートは、ファイリングドライバーでの動作である。ファイリングドライバーは、OS経由でアプリケーションから取得したGDIコードを解析し、画像か(ステップ21)、文字か(ステップ22)、ドローか(ステップ23)を区別する。画像を表すGDIコードは、JBIG、JPEG、MMR等の圧縮アルゴリズムを用いて圧縮され(ステップ24)データベース13の画像バッファに保存される。ドローとは、ベクトル情報の集合による線図形、面図形を用いた描画を言う。
【0127】
文字を表すGDIコードはRAM(図示せず)内の文字バッファに蓄えられ、文字バッファの処理(ステップ25)でタイトルであるかどうかの判定を受けた後、文字に関する各種の情報(文字コード、スタイル、文字色)を保存し、データベース13のキーワードとして登録する。
【0128】
ドロー部分のGDIコードは、ドロー情報の処理ルーチン(ステップ27)に於て表、図形の判定を受け、また、統計処理を受ける。
【0129】
GDIコードが上記のいずれでも無い時は、制御コードであるから、ステップ26に於て制御コードの処理を行う。制御コードの中身は、例えば紙サイズ指定であり、また、紙方向指定、解像度指定、余白指定、ページ番号指定、印刷枚数指定、改ページである。
【0130】
特徴対抽出処理(ステップ17)であるステップ24、または25、26、27の後は、次のGDIコードを取得する為の準備(ステップ28)に入る。もし、制御コードが終了コードだった時は、GDIコードの解析は終了するが、そうでない場合には次のGDIコードを取得する為に、ステップ20にループする。
【0131】
図中、(*2)で示すステップ25の詳細な処理を、図14のフローチャートを用いて説明する。
【0132】
図14のフローチャートは、ファイリングドライバーでの動作である。ここでは文字バッファに蓄えられた文字情報を解析して、タイトル文字かどうかの判定を行い、キーワードとして登録している。
【0133】
GDIコードの場合、文字コードは一連のストリング(文章)になって表現されるとは限らない。ストリングのGDIコードを吐き出すアプリケーションは、エディターと呼ばれるソフトウエア位で、高級なDTPアプリケーションになればなるほど、むしろ一文字一文字描画する場合が多い。高級なDTPアプリケーションは、GDIコードの表現能力を越えた高度の文章表現をするので、一文字一文字の描画になる事が多い。
【0134】
電子ファイルの場合それでは検索ができないので、文字を連結して単語や文章に変換する必要がある。それがステップ30と31であり、文字と文字との間隔がその文字の高さの1/2以上であれば文字に区切りと判断し(ステップ32)、それ以上接近している場合は単語の一部と判断する(ステップ37)。単語の一部と判断された場合には、単語の区切りを見つける為に、その時処理したGDIコードの文字情報を文字バッファーに書き込み、次のGDIコードを取得すべくこのルーチンを抜け、ステップ28に進む。
【0135】
一方、文字と文字の間隔が、文字の高さの1/2より広い部分は、単語の区切りと判定し(ステップ32)、データベース13にキーワードとして登録する。その中でもタイトルと思われる文字はキーワードの中でも特にタイトルとして特別に保存し、タイトル文字として検索の用に供する。タイトルと判定するアルゴリズムは、対象とする文字が、原稿の縦寸法の上から1/4以内にあると判断され(ステップ33)、かつ、原稿中で最大サイズの文字とステップ34で判断される場合にその文字をタイトルと判定し、タイトルであることを識別できる情報を付加する。それ以外の文字はタイトル以外の文字としてキーワード登録する(ステップ36)。タイトル自身もキーワードである事は言うまでもない。
【0136】
図13の中の(*3)で示した部分(ステップ27)の詳細な処理を、図15のフローチャートを用いて説明する。
【0137】
図15のフローチャートはファイリングドライバーでの動作であり、ドロー情報の処理を行なう。始めに、GDIコードが直線か否かを判別し(ステップ40)、直線である場合にはさらに表であるかどうかを判別するルーチン(ステップ41〜ステップ48)に入るが、直線以外の丸、だ円、四角、ポリゴン、斜目線、曲線等である場合には、単純にドロー画グループに加え(ステップ49)データベース13に保存する。
【0138】
ステップ40で直線と判別された場合、すでにデータベース13に登録済の直線グループの中の線と接するかどうかを判定する(ステップ41)。判定方法は、その時処理対象となっている直線の持つ2点(始点、終点)のX座標とY座標のどれかが既に登録済の直線グループの中の線の持つ2点の座標のどれかと1つでも一致し、かつ、他の座標が所定範囲内にあれば接していると判別する。
【0139】
たとえば図16の様に2本の線A、Bが接している事を証明するには、
1 =X3
をチェックするだけで良い。
【0140】
AもBも斜目線でない事は分かっているから、
1 =X3 =X4
でもある。BのY座標は、Aの始点と終点の間になければならないから、
4 ≦Y1 ≦Y3
でなければならない。すなわち、2本の直線の有する各4種類のX、Y座標の内、3つが一致する成分を調べ、もし一致する場合には、2つ共一致する成分を持つ直線の他方の成分の間に他の線分の同じ座標が入っていれば、接していると判別できる。これがX、Y共に成り立つ時は、2本の線は直角を形成する。
【0141】
図15に戻って説明すると、ステップ41で、どの直線グループとも接しないと判別された直線は、それ自身が新たな直線グループを形成するものとして登録する(ステップ50)。
【0142】
一方、接する事が分かった直線については、その直線グループの一員として加える(ステップ42)。
【0143】
ある直線グループの有するX座標Y座標の各々の最大、最小の4つにより定まる領域を、その直線グループの矩形領域と定める。この矩形領域は、新たな直線が加わる毎に再計算する(ステップ43)。
【0144】
その直線グループの構成するX座標だけまたはY座標だけの種類の数を求め、それから1を引いた数をセル数として算出する(ステップ44)。
【0145】
また同様に、X座標の成分と、Y座標の成分を別々に大きさ順にならべ、互いに接近する座標同士の差分をセルサイズとして計算する(ステップ45)。
【0146】
この直線グループの矩形領域の中に、文字が入る場合には(ステップ46)、その文字を表中の文字として表中の文字であることを識別できる情報とともに特別に登録し(ステップ47)、かつ、その直線グループを表と判定する(ステップ48)。
【0147】
文字を全く含まない直線グループは表とは見なさず、通常の直線としてデータベース13に登録する。
【0148】
【発明の効果】
以上説明した様に、本発明を用いれば紙の文書の電子ファイリングとDTPアプリケーションで作成したコンピュータファイル文書とが統合的に電子ファイリングできるので、従来やや閉鎖的だった電子ファイリングがDTPファイリングと共に効果的に、手軽に利用できる様になる。
【0149】
従来の電子ファイリングでは、特別に訓練されたオペレーターが必要であったが、本発明による電子ファイリングシステムによれば、自分の机の上から誰でも扱える様になり、紙文化は一新することができる。
【0150】
従来キーワード検索一辺倒だった電子ファイリングも、本発明を用いれば原稿の特徴量によるレイアウト検索が可能になり、例えば、タイトルが「野球」で、絵が2枚入っていて、表が1本入っており、キーワードが「長島茂雄」という検索が実行できるので、目的の文書が極めてスピーディーに探す事ができる。
【0151】
また、ビットマップの全体画像の圧縮方法は、JBIGという階層符合化理論を用いているので、サムネール画像(小画像)表示による目視検索も使えるので、原稿に書かれた内容をチェックしながらの検索も可能になる。
【図面の簡単な説明】
【図1】本発明による電子ファイリング装置のブロックダイヤグラム。
【図2】検索アプリの位置づけを説明する図。
【図3】OCRアクセラレーターを使う場合の実施例を示す図。
【図4】デバイスドライバーの要部を説明した図。
【図5】対話式会議システムへの応用例を示す図。
【図6】Text−Tab形式による表の情報の表現方法を示す図。
【図7】図形のグループ化の為の2つの例を示す図。
【図8】ピクチャー部分をコード化する為の基本構文を示す図。
【図9】テキスト部分をコード化する為の基本構文を示す図。
【図10】ファイリングドライバーと紙の文書の電子ファイリングとの統合化を示す図。
【図11】ファクシミリ文書の電子ファイリングを示す図。
【図12】実施例の全体処理のフローチャート。
【図13】GDIコードの解析及び特徴抽出処理のフローチャート。
【図14】文字バッファの処理のフローチャート。
【図15】ドロー情報の処理のフローチャート。
【図16】直線の解析を説明する図。
【図17】TAB−Text形式表記例示図。
【図18】表のSYLK形式表記例示図。
【図19】ピクチャーのコード化記述例示図。
【図20】図形の分類例を示す図。
【図21】文のコード化記述例示図。

Claims (26)

  1. 電子ファイリングを行なうためのファイリングドライバーと、前記ファイリングドライバーを実行するコンピュータとを有する電子ファイリング装置であって、
    前記ファイリングドライバーは、アプリケーションソフトウエアからの印刷指示に応じて起動され、
    前記コンピュータは、当該起動されたファイリングドライバーを実行することにより、当該アプリケーションソフトウエアから伝達される印刷用の描画情報を受信し、当該受信した印刷用の描画情報を文書蓄積に適したフォーマットに変換し、当該変換された描画情報を電子ファイリング用のデータベースに蓄積することを特徴とする電子ファイリング装置。
  2. 前記ファイリングドライバーは、プリンタードライバーをエミュレートしたドライバーであって、前記アプリケーションソフトウエアからの印刷指示に応じて起動され、前記コンピュータは、当該起動されたファイリングドライバーを実行することにより、前記変換された描画情報を前記電子ファイリング用のデータベースに蓄積すると、印刷完了メッセージを送ることを特徴とする請求項1に記載の電子ファイリング装置。
  3. 前記コンピュータは、前記ファイリングドライバーを実行することにより、更に、前記描画情報からキーワード検索用の情報を抽出してキーワードとして登録することを特徴とする請求項1に記載の電子ファイリング装置。
  4. 前記コンピュータは、前記ファイリングドライバーを実行することにより、前記描画情報の中にビットマップ画像情報が含まれる場合には、該描画情報を蓄積する際に圧縮して蓄積することを特徴とする請求項1に記載の電子ファイリング装置。
  5. 前記コンピュータは、前記ファイリングドライバーを実行することにより、更に、前記描画情報を、情報の種類に応じて分割し、
    該分割された情報毎に特徴を抽出し、
    当該抽出された特徴を前記データベースに蓄積することを特徴とする請求項1に記載の電子ファイリング装置。
  6. 前記コンピュータは、前記描画情報に含まれる情報の種類が、文字部分か、ベクトル描画部分か、ビットマップ画像部分かに応じて分割することを特徴とする請求項5に記載の電子ファイリング装置。
  7. 前記コンピュータは、前記ファイリングドライバーを実行することにより、更に、前記描画情報のうち、ビットマップ画像部分を文字認識して文字コード化し、
    前記文字認識して得た文字コードは、前記文字部分と同様に扱うことを特徴とする請求項6に記載の電子ファイリング装置。
  8. 前記コンピュータは、前記ファイリングドライバーを実行することにより、更に、前記描画情報からタイトル部分のタイトル情報を抽出し、
    前記抽出されたタイトル情報を、タイトルのキーワード検索用情報として登録することを有することを特徴とする請求項3に記載の電子ファイリング装置。
  9. 前記コンピュータは、前記ファイリングドライバーを実行することにより、更に、前記描画情報から表部分の表情報を抽出し、
    前記抽出された表情報を前記データベースに保存することを特徴とする請求項1に記載の電子ファイリング装置。
  10. 前記コンピュータは、前記ファイリングドライバーを実行することにより、前記表情報に基づいて該表の領域内に文字が入るか判断し、入ると判断された文字を、表中の文字であると識別する情報とともに登録することを特徴とする請求項9に記載の電子ファイリング装置。
  11. 前記コンピュータは、前記ファイリングドライバーを実行することにより、更に、前記描画情報から画像部分の画像情報を抽出し、
    前記抽出された画像情報を圧縮して前記データベースに蓄積することを特徴とする請求項1に記載の電子ファイリング装置。
  12. 前記アプリケーションソフトウエアは、スキャナから画像を読み込むためのスキャナアプリケーションであって、
    前記コンピュータは、前記ファイリングドライバーを実行することにより、前記スキャナから読み込まれた画像が前記スキャナアプリケーションから伝達された場合、当該伝達された画像に対して文字認識処理を行って文字情報を抽出し、当該伝達された画像を当該抽出された文字情報と共に前記データベースに蓄積することを特徴とする請求項1に記載の電子ファイリング装置。
  13. 更に、前記データベースに蓄積された描画情報を検索する検索手段を有することを特徴とする請求項1に記載の電子ファイリング装置。
  14. アプリケーションソフトウエアと前記アプリケーションソフトウエアからの指示に応じて起動されるファイリングドライバーと前記ファイリングドライバーを実行するコンピュータとを有する装置において、前記コンピュータにおいて前記ファイリングドライバーを実行させることにより、電子ファイリングを行なうように制御する電子ファイリング方法であって、
    前記アプリケーションソフトウエアからの印刷指示に応じて起動されたファイリングドライバーを前記コンピュータに実行させることにより、当該アプリケーションソフトウエアから伝達される印刷用の描画情報を受信し、前記受信した印刷用の描画情報を文書蓄積に適したフォーマットに変換し、前記変換された描画情報を電子ファイリング用のデータベースに蓄積することを特徴とする電子ファイリング方法。
  15. 前記ファイリングドライバーは、プリンタードライバーをエミュレートし、前記アプリケーションソフトウエアからの印刷指示に応じて起動されるドライバーであって、
    前記アプリケーションソフトウエアからの指示に応じて起動されたファイリングドライバーを前記コンピュータに実行させることにより、前記変換された描画情報を前記電子ファイリング用のデータベースに蓄積すると、印刷完了メッセージを送ることを特徴とする請求項14に記載の電子ファイリング方法。
  16. 前記ファイリングドライバーを前記コンピュータに実行させることにより、更に、前記描画情報からキーワード検索用の情報を抽出してキーワードとして登録することを特徴とする請求項14に記載の電子ファイリング方法。
  17. 前記ファイリングドライバーを前記コンピュータに実行させることにより、前記描画情報の中にビットマップ画像情報が含まれる場合には、該描画情報を蓄積する際に圧縮して蓄積することを特徴とする請求項14に記載の電子ファイリング方法。
  18. 前記ファイリングドライバーを前記コンピュータに実行させることにより、更に、前記描画情報を、情報の種類に応じて分割し、
    該分割された情報毎に特徴を抽出して、該抽出された特徴を前記データベースに蓄積することを特徴とする請求項14に記載の電子ファイリング方法。
  19. 前記描画情報に含まれる情報の種類が、文字部分か、ベクトル描画部分か、ビットマップ画像部分かに応じて分割することを特徴とする請求項18に記載の電子ファイリング方法。
  20. 前記ファイリングドライバーを前記コンピュータに実行させることにより、更に、前記描画情報のうち、ビットマップ画像部分を文字認識して文字コード化し、
    前記文字認識して得た文字コードは、前記文字部分と同様に扱うことを特徴とする請求項19に記載の電子ファイリング方法。
  21. 前記ファイリングドライバーを前記コンピュータに実行させることにより、更に、前記描画情報からタイトル部分のタイトル情報を抽出し、
    前記抽出されたタイトル情報を、タイトルのキーワード検索用情報として登録することを有することを特徴とする請求項16に記載の電子ファイリング方法。
  22. 前記ファイリングドライバーを前記コンピュータに実行させることにより、更に、前記描画情報から表部分の表情報を抽出し、
    前記抽出された表情報を前記データベースに保存することを特徴とする請求項14に記載の電子ファイリング方法。
  23. 前記ファイリングドライバーを前記コンピュータに実行させることにより、前記表情報に基づいて該表の領域内に文字が入るか判断し、入ると判断された文字を、表中の文字であると識別する情報とともに登録することを特徴とする請求項22に記載の電子ファイリング方法。
  24. 前記ファイリングドライバーを前記コンピュータに実行させることにより、更に、前記描画情報から画像部分の画像情報を抽出し、
    前記抽出された画像情報を圧縮して前記データベースに蓄積することを特徴とする請求項14に記載の電子ファイリング方法。
  25. 前記アプリケーションソフトウエアは、スキャナから画像を読み込むためのスキャナアプリケーションであって、
    前記ファイリングドライバーを前記コンピュータに実行させることにより、前記スキャナアプリケーションから伝達された画像に対して文字認識処理を行って文字情報を抽出し、当該伝達された画像を当該抽出された文字情報と共に前記データベースに蓄積することを特徴とする請求項14に記載の電子ファイリング方法。
  26. 更に、前記データベースに蓄積された描画情報を検索することを特徴とする請求項14に記載の電子ファイリング方法。
JP28526094A 1994-11-18 1994-11-18 電子ファイリング装置 Expired - Lifetime JP3683925B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP28526094A JP3683925B2 (ja) 1994-11-18 1994-11-18 電子ファイリング装置
US08/560,496 US5907835A (en) 1994-11-18 1995-11-17 Electronic filing system using different application program for processing drawing commands for printing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28526094A JP3683925B2 (ja) 1994-11-18 1994-11-18 電子ファイリング装置

Publications (2)

Publication Number Publication Date
JPH08147446A JPH08147446A (ja) 1996-06-07
JP3683925B2 true JP3683925B2 (ja) 2005-08-17

Family

ID=17689201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28526094A Expired - Lifetime JP3683925B2 (ja) 1994-11-18 1994-11-18 電子ファイリング装置

Country Status (1)

Country Link
JP (1) JP3683925B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009078570A (ja) * 1998-10-09 2009-04-16 Ricoh Co Ltd プリンタ装置
JP4144961B2 (ja) 1999-01-14 2008-09-03 富士フイルム株式会社 画像データ通信システム,サーバ・システムおよびその制御方法ならびにサーバ・システムを制御するためのプログラムを格納した記録媒体
AU5049401A (en) * 2000-04-14 2001-10-30 Picsel Technologies Limited Systems and methods for digital document processing
GB2383153A (en) * 2001-12-17 2003-06-18 Hemera Technologies Inc Search engine for computer graphic images
JP2006119923A (ja) * 2004-10-21 2006-05-11 Takaharu Agari 電子文書管理システム
JP2006252001A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd ドキュメント処理装置
JP2007174523A (ja) 2005-12-26 2007-07-05 Canon Inc 画像処理装置、画像処理方法、プログラムコード及び記憶媒体
JP2007200014A (ja) * 2006-01-26 2007-08-09 Ricoh Co Ltd 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
JP4646832B2 (ja) 2006-03-02 2011-03-09 キヤノン株式会社 印刷装置及びそれらの制御方法、印刷管理システム、プログラム
JP4904218B2 (ja) 2007-07-19 2012-03-28 キヤノン株式会社 画像処理サーバ、画像処理方法、コンピュータプログラム、および記憶媒体
JP4915337B2 (ja) * 2007-12-05 2012-04-11 富士通株式会社 印刷データ処理プログラム、方法及び装置
US8270717B2 (en) 2007-12-19 2012-09-18 Canon Kabushiki Kaisha Metadata determination method and image forming apparatus
JP2010004531A (ja) * 2008-06-20 2010-01-07 Sharp Corp 複合機及びプリントコンテナを変更する方法
JP5111268B2 (ja) 2008-07-09 2013-01-09 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP2011090691A (ja) * 2010-11-12 2011-05-06 Fuji Xerox Co Ltd ドキュメント処理装置、ドキュメント処理装置の制御方法、及びプログラム
JP5954691B2 (ja) 2012-09-28 2016-07-20 ブラザー工業株式会社 テンプレート処理プログラム及びテンプレート処理方法
JP6969818B1 (ja) * 2020-07-02 2021-11-24 株式会社ダブルスタンダード 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JPH08147446A (ja) 1996-06-07

Similar Documents

Publication Publication Date Title
US10572725B1 (en) Form image field extraction
US5907835A (en) Electronic filing system using different application program for processing drawing commands for printing
JP3683925B2 (ja) 電子ファイリング装置
US8112706B2 (en) Information processing apparatus and method
US8001466B2 (en) Document processing apparatus and method
US8532388B2 (en) Image processing apparatus, image processing method, and computer program
US5850490A (en) Analyzing an image of a document using alternative positionings of a class of segments
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
US7013309B2 (en) Method and apparatus for extracting anchorable information units from complex PDF documents
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
JP3292388B2 (ja) 文書画像の復号なしに文書を要約するための方法と装置
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP5743443B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US9710524B2 (en) Image processing apparatus, image processing method, and computer-readable storage medium
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
US6351559B1 (en) User-enclosed region extraction from scanned document images
US20040213458A1 (en) Image processing method and system
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JPH01253077A (ja) 文字列検出方法
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3689441B2 (ja) 電子ファイリング装置および電子ファイリング方法
CN112101356A (zh) 一种图片中特定文本的定位方法、装置及存储介质
JPH1021043A (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041026

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100603

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

EXPY Cancellation because of completion of term