JP2004078928A - 文書検索装置及び文書検索方法 - Google Patents

文書検索装置及び文書検索方法 Download PDF

Info

Publication number
JP2004078928A
JP2004078928A JP2003275012A JP2003275012A JP2004078928A JP 2004078928 A JP2004078928 A JP 2004078928A JP 2003275012 A JP2003275012 A JP 2003275012A JP 2003275012 A JP2003275012 A JP 2003275012A JP 2004078928 A JP2004078928 A JP 2004078928A
Authority
JP
Japan
Prior art keywords
document
data
display
image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003275012A
Other languages
English (en)
Inventor
Kanako Teramura
寺村 佳奈子
Hiroyuki Sasaki
佐々木 裕之
Hassan Toorabally
トラバリー ハッサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003275012A priority Critical patent/JP2004078928A/ja
Publication of JP2004078928A publication Critical patent/JP2004078928A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】属性情報などを含む文書であっても、高速のページめくり表示による文書検索を可能とする。
【解決手段】文字属性情報変換手段105は、処理を必要とすることを示す文字属性情報をその処理が少なくなるような文字属性情報に変換する。特徴点座標非可逆圧縮手段106は、特徴点座標情報を非可逆圧縮する。図形属性情報変換手段106は、図形属性情報をその処理が少なくなるような図形属性情報に変換する。ビットマップイメージ生成手段107は、ビットマップイメージデータを用いずに占有領域情報が示す文書上での占有領域にビットマップイメージデータが存在する旨の表示をするように文書データを変換する。表示位置情報非可逆圧縮手段108は、表示位置情報を非可逆圧縮する。イメージ生成手段109は、文書の表示イメージを生成する。
【選択図】 図1

Description

 本発明は、文書をコードデータあるいはイメージデータとして記憶している文書検索装置及び文書検索方法に関する。
 近年、ワードプロセッサなどを用いて作成した文書のコードデータをフレキシブルディスクなどの補助記憶に記憶し、あるいはスキャナ等を用いて電子的に読み込んだ文書のイメージデータを光磁気ディスクなどに記憶し、必要に応じて所望の文書を検索する文書検索装置が発表されている。
 このような文書検索装置における検索方法の1つとして、例えば特許文献1に記載されているように、1ページ正方向めくり、1ページ逆方向めくり、連続正方向めくり、連続逆方向めくり、停止、といった使用者の操作指示に従って順次ディスプレイなどに表示イメージを表示して検索するものが提案されている。
 このような従来の文書検索装置は、例えば図21のように、文書記憶部2101と、検索指示受付部2102と、読み出し部2103と、イメージ生成部2104と、表示部2105とを備えている。文書記憶部2101は、文書を文字、図形、ビットマップイメージ等のコードの集合として、属性情報と共に記憶している。ここでビットマップイメージは、イメージデータで表現される絵、写真等である。検索指示受付部2102は、使用者の操作により入力されたページめくり検索の起動、停止、検索条件などのコマンドに応じた指示を受け付ける。読み出し部2103は、検索指示受付部2102からの指示に基づいて、表示対象文書を文書記憶部2101から読み出す。イメージ生成部2104は、読み出し部2103により読み出された文書の表示イメージを生成する。表示部2105は、イメージ生成部2104により生成された文書イメージを表示する。
 この従来の文書検索装置において、検索の際は、使用者の操作により入力されたページめくり検索起動コマンド、検索条件等のコマンドに応じた指示を、検索指示受付部2102が受け付け、読み出し部2103に通知する。読み出し部2103は、検索指示受付部2102からページめくり検索起動指示及び検索条件が通知されると、文書記憶部2101から検索条件に該当する文書を1文書ずつ順に読み出す。読み出された表示対象文書は、イメージ生成部2104に入力され、文書の表示イメージが生成される。表示の際は、表示部2105によりイメージ生成部2104からの表示イメージが1画面に1ページ分ずつ表示され、使用者はこの表示を目視することにより目的の文書を検索する。
特開昭61−193265号公報
 ところで上記従来の技術では、文書中の文字コード、図形コード、ビットマップイメージ、及び属性情報等を用いてイメージデータを生成している。従って、文書中の文字コード、図形コードにおいて属性情報等が付随している場合は、その属性情報等に基づき各種変換処理も行う必要があり、表示イメージの生成に時間がかかる。また文書中のビットマップイメージは、データ量が膨大であるため表示イメージの生成に時間がかかる。このように表示イメージの生成に時間がかかると、画面に表示される時間も遅れ、迅速なページめくり表示による文書検索が出来ないという問題点がある。
 本発明は上記問題点に鑑み、記憶している文書が属性情報などを含む文書であっても、高速のページめくり表示による文書検索が可能な文書検索装置及び文書検索方法を提供することを目的とする。
 本発明は、上記課題を解決するため、文書データに基づいて表示イメージを生成し、その表示イメージを表示手段によりページめくり表示して検索を行なう文書検索装置であって、ビットマップイメージデータ及び文書上でのビットマップイメージデータの占有領域を示す占有領域情報とを少なくとも有する文書データを記憶する文書記憶手段と、前記文書記憶手段から検索対象の文書データを順次、読み出す読み出し手段と、前記読み出し手段が読み出した文書データのうちの占有領域情報を用い、占有領域情報が示す文書上での占有領域にビットマップデータが存在する旨の表示をするように文書の表示イメージを生成するビットマップイメージ生成手段とを備えたこととしている。
 上記目的は、文書データに基づいて表示イメージを生成し、その表示イメージを表示手段によりページめくり表示して検索を行なう文書検索装置であって、ビットマップイメージデータ及び文書上でのビットマップイメージデータの占有領域を示す占有領域情報とを少なくとも有する文書データを記憶する文書記憶手段と、前記文書記憶手段から検索対象の文書データを順次、読み出す読み出し手段と、前記読み出し手段が読み出した文書データのうちの占有領域情報を用い、占有領域情報が示す文書上での占有領域にビットマップデータが存在する旨の表示をするように文書の表示イメージを生成するビットマップイメージ生成手段とを備えたことで達成することができる。
 このような構成によって、ビットマップイメージ生成手段は、ビットマップイメージデータを用いず、占有領域情報が示す文書上での占有領域ビットマップイメージデータが存在する旨の表示をするように文書の表示イメージを生成するので、高速のページめくり表示による文書検索が可能となる。
 また、前記文書記憶手段は、表示位置情報を有する文書データを記憶し、前記読み出し手段で読み出された文書データの表示位置情報を非可逆圧縮する表示位置情報非可逆圧縮手段を更に備え、前記ビットマップイメージ生成手段は、非可逆圧縮された表示位置情報と文書データを用いて文書の表示イメージを生成することとしている。
 このような構成によって、表示位置情報非可逆圧縮手段は、表示位置情報を非可逆圧縮するので、その非可逆圧縮された表示位置情報を用いて高速に表示イメージを生成でき、高速のページめくり表示による文書検索が可能となる。
 また、前記文書検索装置は、さらに、表示イメージをページめくり表示すべく設定された速度であるページめくり速度が、高速であることを示す所定の基準値よりも大きいか否かを判定するページめくり速度判定手段と、前記ビットマップイメージ生成手段は、前記ページめくり速度判定手段が判定したページめくり速度が所定の基準値よりも小さい場合は、読み出し手段が読み出した文書データを用いて、文書の表示イメージを生成することとしている。
 このような構成によって、ビットマップイメージ生成手段は、ページめくり速度判定手段が判定したページめくり速度が所定の基準値よりも小さい場合には読み出し手段が読み出した文書をそのまま用いて表示イメージを生成するので、高速なページめくりが必要でない場合は、詳細な表示イメージを生成でき、文書検索の効率を向上させることができる。
 また、前記文書検索装置は、さらに、前記読み出し手段が読み出した文書のデータ量を測定するデータ量測定手段と、前記ビットマップイメージ生成手段は、前記データ量測定手段が測定した文書のデータ量がデータ量が多いことを示す所定の基準値よりも小さい場合は、読み出し手段が読み出した文書データを用いて、文書の表示イメージを生成することとしている。
 このような構成によって、ビットマップイメージ生成手段は、データ量測定手段が測定した文書のデータ量が所定の基準値よりも小さい場合には読み出し手段が読み出した文書をそのまま用いて表示イメージを生成するので、データ量が小さい文書は詳細な表示イメージを生成し、データ量が多い文書については表示イメージを簡略化して表示することにより、文書検索の効率を向上させることができる。
 上記目的は、ビットマップイメージデータ及び文書上でのビットマップイメージデータの占有領域を示す占有領域情報とを少なくとも有する文書データを記憶する文書記憶部から検索対象の文書データを順次、読み出し、その読み出した文書データに基づいて表示イメージを生成し、その表示イメージをページめくり表示して検索を行なう文書検索装置における文書検索方法であって、読み出された文書データのうちの占有領域情報を用い、占有領域情報が示す文書上での占有領域にビットマップデータが存在する旨の表示をする占有領域表示情報を生成する占有領域表示情報生成ステップと、生成された占有領域表示情報を用いて文書の表示イメージを生成するビットマップイメージ生成ステップとを有することで達成することができる。
 このような方法によって、ビットマップイメージ生成ステップは、ビットマップイメージデータを用いず、占有領域情報が示す文書上での占有領域にビットマップイメージデータが存在する旨の表示をするように文書の表示イメージを生成するので、高速のページめくり表示による文書検索が可能となる。
 また、前記文書記憶部は、表示位置情報を有する文書データを記憶し、読み出された文書データの表示位置情報を非可逆圧縮する表示位置情報非可逆圧縮ステップを更に有し、前記ビットマップイメージ生成ステップは、非可逆圧縮された表示位置情報と文書データを用いて文書の表示イメージを生成することとしている。
 このような方法によって、表示位置情報非可逆圧縮ステップは、表示位置情報を非可逆圧縮するので、その非可逆圧縮された表示位置情報を用いて高速に表示イメージを生成でき、高速のページめくり表示による文書検索が可能となる。
 以下、本発明に係る文書検索装置の実施の形態について、図面を用いて説明する。
 (実施の形態1)
 図1は、本発明に係る文書検索装置の実施の形態1の構成図である。当該文書検索装置は、文書記憶部101と、検索指示受付部102と、読み出し部103と、データ変換制御部104と、文字属性変換部105と、図形属性変換部106と、ビットマップイメージ変換部107と、相対位置変換部108と、イメージ生成部109と、表示部110とからなる。
 文書記憶部101は、文書を記憶している。この文書は、文字、図形、ビットマップイメージ等で構成される。当該文書記憶部101において文字は、図2に示すように文字コード21と文字コード21が示す文字の表示属性を示す文字属性情報22とで表現される。この文字属性情報22は、書体201、サイズ202、修飾203、網かけ種204、文字間205、行間206等の情報からなる。書体201は、例えば明朝体、ゴシック体、ローマン体、毛筆体等がある。サイズ202は、文字のサイズであり、例えば10×10ドットの大きさや、10×20、20×10、20×20等の大きさがある。修飾203は、文字の修飾の情報である。具体的には、文字の回転、文字の斜体、文字の白抜き等がある。網かけ種204は、文字の網かけの情報である。具体的には、かける網の種類と、網をかける範囲の情報が含まれる。文字間205は、文字と文字の間隔の情報である。行間206は、行と行との間隔の情報である。また、文書記憶部101は、文字列群の先頭位置情報と書式の情報も有する。文字列群の先頭位置情報は、文字列の一群のデータ先頭の位置を示す情報であり、具体的には、そのページの何行目の何列目であるかを示す。書式は、文字に限らずこの文書全体の書式であり、例えば縦書きか横書きであるか、用紙サイズ、用紙方向、余白等の情報である。ここで文書記憶部101に記憶されている文字列の具体例は、図3に示される。本図において、1行目は、サイズは20×20ドット、修飾は斜体、また網かけが数種類がかかっている。2、3行目は、サイズ10×10ドットであり、書体としてゴシック体を用いていることがわかる。
 当該文書記憶部101において図形は、図4に示すように特徴点座標情報41と図形属性情報42等で表現される。特徴点座標情報41は、図形の形状を示す頂点の数と、その頂点の座標である特徴点座標からなる。例えば多角形ならばそれぞれの頂点がその多角形の特徴点座標であり、円ならば中心点と円周上の1点が特徴点座標となる。当該特徴点座標は、例えば文書上の行、列で示される升目及びその升目の真中であるか、隅であるかの情報である。また、文書上でのドット座標や、ミリメートル座標で表現される場合もある。図形属性情報42は、図形の表示属性の情報であり、例えば線種401、線の太さ402、図柄パターン403等の情報からなる。線種401は、線の種類であり、例えば実線、点線等がある。線の太さ402は、線の太さであり、1ドット幅、2ドット幅、3ドット幅等の線の太さがある。図柄パターン403は、図形の内部を埋める模様である。縦縞、横縞、千鳥格子、斜線、灰色、黒、白等がある。文書記憶部101に記憶されている図形は、例えば図5に示すようなものがある。
 当該文書記憶部101においてビットマップイメージは、図6に示すようにイメージデータ61と、占有領域62等で表現される。イメージデータ61は、ビットマップイメージのイメージデータである。記憶されているビットマップイメージは、例えば図7に示すようなものがある。占有領域62は、文書上でのビットマップイメージの占有領域を示す情報である。占有領域は、頂点座標の座標値などで表される。なお、イメージデータ61は、別ファイルとして記憶されていてもよい。
 検索指示受付部102は、使用者から操作指示を受け付ける。操作指示としては、検索開始指示と、検索終了指示などがある。検索開始指示は、文書記憶部101に記憶されている文書を1つずつ画面に表示させてゆく旨の指示である。検索終了指示は、目的とする文書を発見した場合に検索動作を停止させる指示である。また、当然前後1ページ表示指示などを受け付けてもよい。
 読み出し部103は、検索指示受付部102が検索開始指示を受け付けてから検索終了指示を受け付けるまで、順次、検索対象の文書を1文書ずつ文書記憶部101から読み出す。
 データ変換制御部104は、読み出し部103が読み出した検索対象の文書の1ページ目を取り出し、さらに当該1ページ目の中における文字列群、図形群、ビットマップイメージ等の一群のデータを順次、取り出し表示イメージを作成するため文字属性変換部105、図形属性変換部106、ビットマップイメージ変換部107、相対位置変換部108と、イメージ生成部109とを制御する。ここで、1ページ目における一群のデータとは、文字列群、図形群、ビットマップイメージ等、同じ種類のデータが集まっている一塊である。また生成された表示イメージを画面上に表示するため表示部110も制御する。これらの制御は、具体的には、図8、図9に示すフローに従って行う。当該フローの説明は、後述する動作のところで説明する。なお、当該データ変換制御部104が取り出す文書のページは1ページ目に限らず何ページ目であっても構わない。また、複数ページであってもよい。
 文字属性変換部105は、データ変換制御部104が取り出した文字列群の一群のデータにおいて、文字属性情報22を簡略化、統一化する処理を図10に示す処理対応表を用いて行う。図10は、使用者がページめくり検索を行なう時に所望の文書であることを判断する為に重要な内容については残し、ページめくり検索にあまり重要でないと考えられる内容に関しては削除するよう設定されている。従って、検索者が注目する文字コード21(文字内容)については1001に示すようにそのままにしている。書体201やサイズ202は、1002、1003に示すように1種類に固定している。また、斜体、白抜き、回転等の文字修飾203に関しては、1004に示すように修飾なしとしている。網かけ種204に関しては、1005に示すように網かけのパターンを1種類に固定している。文字表示位置に関しては、文字間205を0、行間206を2ドットに固定している。これらの処理は具体的には、図11のフロー図に従って行う。当該フローの説明は、後述する動作のところで説明する。
 図形属性変換部106は、データ変換制御部104の制御下で、図12に示す処理対応表を用い、データ変換制御部104が取り出した図形の一群のデータにおいて、特徴点座標情報の下位ビットを削除し、その下位ビットが削除された特徴点座標情報を用いて座標計算する。例えば特徴点座標情報の下位2ビットを削除することにより座標計算する。また、図形属性変換部106は、図形属性情報42を簡略化、統一化する処理を図12に示す処理対応表を用いて行う。図12の1202に示すように、全て線種401は実線のみに変換する。同様に線の太さ402は1203に示すように、1ドットに変換する。図柄パターン403については、白、又はパターンなしの場合はパターンなしに、黒の場合はそのまま黒に、それ以外の場合、例えば縦縞、横縞、斜線、網かけ、千鳥格子などの場合はすべて網かけに変換する。これらの処理は具体的には、図13のフロー図に従って行う。当該フローの説明は、後述する動作のところで説明する。
 ビットマップイメージ変換部107は、データ変換制御部104が取り出したビットマップイメージのデータの一群のデータをあらかじめ決められた方法で変換する。具体的には、イメージデータ61を削除し、次にビットマップイメージの占有領域62を表示すべく、その領域を示す線、図柄パターンを予め定められた線種、線の太さ、図柄パターンで設定する。例えば、図15(a)に示すようなビットマップイメージを示すデータがあった場合は、図15(b)に示すような図形を表示すべくそのビットマップイメージの占有領域62に線、図柄パターンを設定する。次に、占有領域62示す座標値を単純化する。これらの処理は、後述する動作のところで図14に示すフロー図を用い、詳細に説明する。
 また、設定した図形を図形データの図形と間違わないように、その設定した図形を特殊パターンで塗りつぶしたり、特殊なフォントでその図形の領域内に「ビットマップイメージ」と表示するようにしても良い。
 相対位置変換部108は、入力された文書データの各構成要素、例えば文字列、図形、ビットマップイメージデータ個々の表示位置属性情報を、削除する。ここで表示位置属性情報は、例えば、均等割り付け、センタリング、インデント等がある。
 イメージ生成部109は、文字属性変換部105、図形属性変換部106、ビットマップイメージ変換部107、相対位置変換部108により変換された文書データの表示イメージデータを生成する。
 表示部110は、イメージ生成部109により生成された表示イメージデータを用い文書を画面上に表示する。
 次に図8、9に示すフローチャートを用いて文書検索装置の動作について説明する。
 先ず、使用者から検索開始指示を待つ(ステップS101)。使用者から検索指示があったら、1文書を読み出し(ステップS102)、当該文書の書式の情報である用紙サイズ、余白等の情報に基づき、文書を表示する領域の座標を求め、表示領域を決定する(ステップS103)。なお、表示倍率が予め定められている場合は、その予め定められた表示倍率も考慮して表示領域を決定する。次に、読み出した文書における最初の一群のデータを取り出す(ステップS104)。当該一群のデータが文字列であれば、サブルーチン文字属性変換処理を行う(ステップS106)。
 このサブルーチン文字属性変換処理について、図11に示すフローチャートを用いて説明する。先ず、設定された表示領域内に当該一群の文字列のデータがあれば(ステップS201)、当該一群の文字列のデータから文字コード列を抽出する(ステップS202)。次に、網かけパターンを1種類にする(ステップS203)。例えば、図16(a)の1行目の文字列「Merry Christmas!!」には、3種類の網かけがかかっているが、これを図16(b)に示す網かけ種1種類にする。次に、修飾をなくす(ステップS204)。例えば、図16(a)の1行目の文字列「Merry Christmas!!」には、斜めという修飾がかかっている。これは、斜めでない文字フォントをソフト的な処理によって斜めに変換している。そこで、この斜めという修飾をなくし、図16(b)に示すように文字フォントそのままとする。次に、文字フォント及びサイズ変換を行う(ステップS205)。具体的には、文字フォントは全て明朝体、文字サイズは全て10×10ドットに変換する。例えば、図16(a)の1行目の文字列は、20×20ドットの文字サイズであるのを、図16(b)の1行目の文字列のように、10×10ドットの文字サイズとしている。また、図16(a)の2、3行目の文字列は、ゴシック体であるが、図16(b)の2、3行目の文字列のように、明朝体に変換している。次に、文字配列座標を単純化する(ステップS206)。具体的には、文字間隔を0ドットとし、行間を2ドットとする。例えば、図16(a)に示す1〜3行目の文字列のような文字間隔と行間であっても、図16(b)に示すように予め定められた文字間隔0ドット、行間2ドットとする。また文字列の先頭位置情報の下位2ビットを削除して、座標計算する。これらの変換処理を行った結果は記憶領域に格納する。以上で、サブルーチン文字属性変換処理を終了する。
 次に、次の一群のデータが存在するか否かを判断し(ステップS114)、次の一群のデータが存在すればその一群のデータを取り出す(ステップS115)。その一群のデータが図形のデータであれば(ステップS105、ステップS107)、サブルーチン図形データ変換処理を行う(ステップS108)。このサブルーチン図形データ変換処理について、図13を用いて説明する。先ず、設定された表示領域内に当該図形データが図形を表示するデータであるか否かを判断する(ステップS301)。
 表示領域内に図形を表示するデータであると判断されたらクリッピング処理を行う(ステップS302)。クリッピング処理とは、図形データにより示される図形が一部分表示領域外にある場合、表示領域外にある部分を削除した形に図形データを変換することなどである。次に、線種、線の太さの簡略化を行う(ステップS303)。具体的には、図12に示すように線種は実線のみ、線の太さは1ドットのみとする。次に図柄パターンも簡略化する(ステップS304)。具体的には、白若しくはパターンなしの場合は、パターンなしに変更し、黒の場合はそのまま黒とし、それ以外の図柄パターンの場合は、図柄パターンの網とする。このように処理することにより、図17(a)に示す図形の枠の線が、図17(b)に示すように全て実線となる。また図柄パターンは図17(a)では、白でもなくパターンなしでもなく黒でもないその他の図柄パターンであるので、すべて図17(b)に示すように網の図柄パターンとなる。
 次に、特徴点座標単純化の処理を行う(ステップS305)。具体的には、その図形の一群のデータにおける特徴点座標情報の下位ビットを削除する。例えば、10ビットで表現される特徴点座標情報が存在したとすると、その特徴点座標情報の下位2ビットを削除し、8ビットとする。このよう処理することによって、処理前は10ビット、即ち2バイトで表現されていたデータが処理後は8ビット、即ち1バイトで表現できることとなり、座標計算量が減少することとなる。このように情報量が削減された特徴点座標を用いて座標計算をする。このようにして求められた各特徴点座標の表示座標は、下位2ビット分の情報量が削減されているため、通常の座標計算で求めた表示座標とずれることがある。例えば、通常の座標計算で求めた各特徴点座標の表示座標で形作られる図形が図17(a)に示すような図形であったとする。このとき下位2ビット分の情報量が削減された特徴点座標情報で求められた表示座標では、図17(b)に示すように、図形の形や位置が図17(a)と比べずれる場合がある。但し、この図17(b)は、平行四辺形が正確な長方形に変形しているなど、左右対称の形に変形していることを示しているがこれは希な場合である。これらの変換処理を行った結果は記憶領域に格納する。以上でサブルーチン図形データ変換処理を終了する。
 さらに、次の一群のデータが存在すれば(ステップS114)、その一群のデータを取り出す(ステップS115)。その一群のデータがビットマップイメージのデータであれば(ステップS105、ステップS107、ステップS112)、サブルーチンビットマップイメージ変換処理を行う(ステップS113)。
 このサブルーチンビットマップイメージ変換処理について、図14を用いて説明する。先ず、設定された表示領域内に当該ビットマップイメージデータがビットマップイメージを表示するデータであるか否かを判断する(ステップS401)。表示領域内にビットマップイメージを表示するデータであると判断されたらクリッピング処理を行う(ステップS402)。次にビットマップイメージを形作るイメージデータであるイメージデータ61を削除する(ステップS403)。なお、イメージデータ61が別ファイルになっている場合は当該ステップを実行しない。さらにビットマップイメージの占有領域62を表示すべく、その領域を示す線、図柄パターンを線種、線の太さ、図柄パターンを設定する(ステップS404)。例えば、図15(a)に示すようなビットマップイメージを示すデータがあった場合は、図15(b)に示すような図形を表示すべくそのビットマップイメージの占有領域62に線、図柄パターンを設定する。次に、占有領域62示す座標値を単純化する(ステップS405)。具体的には、占有領域62の示す座標値の下位2ビットを削除して、座標計算する。これらの変換処理を行った結果は記憶領域に格納する。以上でサブルーチンビットマップイメージ変換処理を終了する。
 次の一群のデータが存在しなければ(ステップS114)、記憶領域に記憶された各種変換結果に基づき文書1ページ分の表示イメージデータを作成し、画面に表示する(ステップS116)。ここで座標計算等において下位2ビットを削除して計算を行っていた場合は、表示イメージデータ生成の際に、下位に2ビットを補完して表示イメージデータを生成する。文書記憶部101に次の文書があり(ステップS117)、使用者からの停止指示がなければ(ステップS118)、次の文書を読み出し、上記処理を繰り返す(ステップS102〜ステップS118)。文書記憶部101に次に表示すべき文書がなくなるか(ステップS117)、使用者からの停止指示があれば(ステップS118)、処理を終了する。この様な処理を行うことによって、例えば図18(a)に示すように文字や図形等が入り交じった文書が処理され、図18(b)に示すように簡略化して表示される。
 なお、本実施の形態では、文書データ中に文字データ、図形データ、ビットマップイメージデータがバラバラに混在する場合を想定して各一群のデータの1つ1つについてステップS105〜ステップS110のように処理を行っている。ところが、まず文字データを全て抽出して変換し、次に図形データを全て抽出して変換、最後にビットマップイメージデータを全て抽出して変換というようにデータの種類毎にまとめて処理を行ってもよい。
 また、文字列群の一群のデータの文字表示位置の処理を、文字間、行間を指定することにより行っているが、表示座標計算時の精度を1ドット単位から4ドット単位とする処理を行ってもよい。具体的には、文字表示位置の情報の下位2ビットを削除して座標計算を行う。座標計算精度を落とすことにより、座標計算時間を短縮することができる。
 また、文字属性変換部105や、図形属性変換部106は、あらかじめ処理対応表を保持しているものとしたが、使用者が検索起動毎に毎回指定するように構成してもよい。この場合、例えば検索者の探したい文書がいろいろな文字のサイズを使用しており、1種類に固定すると探しにくいような場合などに、元の文字サイズに応じて2種類の文字サイズに変換するとすれば、一層効率的な検索を行なうことができる。
 また、ビットマップイメージのイメージデータ61が、別ファイルになっており、ビットマップイメージの占有領域を示す情報の内、ビットマップの占有領域の大きさを示す情報がその別ファイルに存在し、表示位置の情報のみが文書データ内に存在するとする。この場合に、ビットマップの占有領域の大きさの情報を得るためには別ファイルから占有領域の大きさを示す情報を読み出す必要があり時間が余計にかかる場合は、ビットマップの表示位置に、ビットマップの占有領域の大きさ、形に関わらず同じサイズの矩形等を表示してもよい。
 また、ビットマップイメージの占有領域に設定する図形には、ビットマップイメージ毎に付けられているIDや、ファイル名などのビットマップに関する情報を表示領域に表示してもよい。
 また、ビットマップイメージ変換部107における変換処理内容は、あらかじめ設定されているものとしたが、使用者が検索起動毎に設定してもよい。
 また、文字属性変換部105、図形属性変換部106、ビットマップイメージ変換部107、相対位置変換部108のうち、一部又は全部を設定により起動しないように設定してもよい。この場合、各部の一部又は全部が起動されずデータの変換処理が行われなかった場合は、イメージ生成部109が読み出し部103の読み出した文書データに基づきイメージデータを生成する。また、このような設定は、あらかじめデータ変換制御部104に保持させてもよいし、検索起動毎に使用者が設定するようにしてもよい。
 また、検索対象とする文書数が予め定められた制限値を超えた場合にのみ、文字属性変換部105、図形属性変換部106、ビットマップイメージ変換部107、相対位置変換部108の処理を実行するか否かを決定する構成であってもよい。
 また、本実施の形態では、文字属性変換部105、図形属性変換部106、ビットマップイメージ変換部107、相対位置変換部108の順にデータ変換処理を行なうよう配置されているが、異なる順序としても良い。
 以上のように本実施の形態によれば、文字データに関しては、検索に大きな影響を持つ文字コードはそのままにしつつ、文字属性情報22を簡略化、統一化し、表示イメージを生成する際の処理を削減できるので、ページめくり検索時のイメージ表示を高速化することができ、文書検索の効率を向上させることができる。特に、文字属性情報22のうち修飾(斜体、白抜き、回転等)ありとなっている場合は、取り出した文字フォントに対してさらにソフト的な処理をする必要があり処理に時間がかかるが、文字属性変換により全て修飾なしとするので、そのソフト的な処理をなくすことができ表示イメージを生成する際の処理を削減できる。
 図形データに関しては、検索に大きな影響を与える特徴点座標情報の情報量を、検索の妨げにならない程度に削減し、表示イメージを生成するために行う表示座標計算量を削減することができるので、ページめくり検索時のイメージ表示を高速化でき、文書検索の効率を向上させることができる。また、図形属性情報42も簡略化、統一化するので、表示イメージを生成する際の処理を削減できる。
 ビットマップイメージデータに関しては、イメージデータに基づいて表示イメージの生成を行わず、ビットマップイメージの占有領域のみを表示するためイメージ生成が高速となり、効率良く文書検索を行なうことができる。
 また、文字、図形、ビットマップイメージの表示位置計算を簡略化することができるためイメージ生成が高速となり、効率良く文書検索を行なうことができる。
 (実施の形態2)
 図19は、本発明に係る文書検索装置の実施の形態2の構成図である。当該文書検索装置は、文書記憶部101と、検索指示受付部102と、読み出し部103と、データ変換制御部104と、文字属性変換部105と、図形属性変換部106と、ビットマップイメージ変換部107と、相対位置変換部108と、イメージ生成部109と、表示部110と、速度判定部1901とを備えている。ここで、実施の形態1と同様の構成要素には、同じ符号を付し、説明を省略する。
 速度判定部1901は、使用者から指定され、設定したページめくりの速度が、所定の基準値よりも大きいか否かを判定する。ここでページめくり速度は、画面に順次、文書を表示させてゆこうとする速度である。次に、判定した結果、所定の基準値よりも大きい場合は、データ変換制御部104に対して、文字属性変換部105と図形属性変換部106とビットマップイメージ変換部107と相対位置変換部108とを起動させるように制御する。判定した結果、所定の基準値よりも小さい場合は、データ変換制御部104に対して、文字属性変換部105と図形属性変換部106とビットマップイメージ変換部107と相対位置変換部108とを起動しないように制御する。
 なお、ページめくりの速度は、使用者から指定されたものを用いるのみならず、予め設定されているものを用いてもよい。
 また、複数の基準値を用い、設定されたページめくり速度がどの基準値の範囲に存在するかによって実行する処理を選択する構成であってもよい。また、速度判定部1901が有する所定の基準値は、検索起動毎に使用者が設定しても良い。
 また、制限値によって実行する処理については、あらかじめデータ変換制御部104に保持してもよいし、検索起動毎に使用者が設定しても良い。
 また、検索対象とする文書数が予め定められた制限値を超えた場合にのみ、文字属性変換部105、図形属性変換部106、ビットマップイメージ変換部107、相対位置変換部108の処理を実行するか否かを決定する構成であってもよい。
 また、文字属性変換部105と、図形属性変換部106と、ビットマップイメージ変換部107と、相対位置変換部108は、この順にデータ変換処理を行うように配置されているが、異なる順序であってもよい。
 以上のように本実施の形態によれば、連続ページめくり検索時のページめくり速度が高速の場合はイメージ生成時間が短くなるよう文書データを変換するので、高速表示が可能となり、効率良く文書検索を行なうことができる。
 (実施の形態3)
 図20は、本発明に係る文書検索装置の実施の形態3の構成図である。当該文書検索装置は、文書記憶部101と、検索指示受付部102と、読み出し部103と、データ変換制御部104と、文字属性変換部105と、図形属性変換部106と、ビットマップイメージ変換部107と、相対位置変換部108と、イメージ生成部109と、表示部110と、データ量測定部2001とを備えている。ここで、実施の形態1と同様の構成要素には、同じ符号を付し、説明を省略する。
 データ量測定部2001は、読み出し部103が読み出した文書のデータ量を測定し、そのデータ量が所定の基準値を超えているか否かを判定する。判定した結果、所定の基準値よりも大きい場合は、データ変換制御部104に対して、文字属性変換部105と図形属性変換部106とビットマップイメージ変換部107と相対位置変換部108とを起動させるように制御する。判定した結果、所定の基準値よりも小さい場合は、データ変換制御部104に対して、文字属性変換部105と図形属性変換部106とビットマップイメージ変換部107と相対位置変換部108とを起動しないように制御する。
 また、データ量測定部2001が有する所定の基準値は、検索起動毎に使用者が設定しても良い。
 また、複数の基準値を設定し、文書データ量がどの基準値の範囲に存在するかによって実行する処理を選択する構成であってもよい。
 また、データ変換制御部104における制御処理内容は、あらかじめデータ変換制御部104に保持してもよいし、検索起動毎に使用者が設定する構成であってもよい。
 また、文字属性変換部105と、図形属性変換部106と、ビットマップイメージ変換部107と、相対位置変換部108は、この順にデータ変換処理を行うように配置されているが、異なる順序であってもよい。
 以上のように本実施の形態によれば、データ量が多い文書については、データ変換処理を行うことによりイメージ生成時間を短縮することができるので、高速表示が可能となり、効率良く文書検索を行なうことができる。
 本発明の活用例としては、ワードプロセッサやパーソナルコンピュータ等において、記憶された文書を検索する文書検索装置及びその方法として利用することができる。
本発明に係る文書検索装置の実施の形態1の構成図である。 文書記憶部101における文字データのデータ構成要素を示す図である。 文書記憶部101における文字データの表示イメージ例を示す図である。 文書記憶部101における図形データのデータ構成要素を示す図である。 文書記憶部101における図形データの表示イメージを示す図である。 文書記憶部101におけるビットマップイメージのデータのデータ構成要素を示す図である。 文書記憶部101におけるビットマップイメージの表示イメージを示す図である。 データ変換制御部104の制御フローを示す図である。 図8の続きの図である。 文字属性変換部105における処理対応表である。 サブルーチン文字属性変換処理の処理内容を示すフロー図である。 図形属性変換部106における処理対応表である。 サブルーチン図形属性変換処理の処理内容を示すフロー図である。 サブルーチンビットマップイメージ変換処理の処理内容を示すフロー図である。 ビットマップイメージの変換結果を示す図である。 文字データの変換結果を示す図である。 図形データの変換結果を示す図である。 文書データの変換結果を示す図である。 本発明に係る文書検索装置の実施の形態2の構成図である。 本発明に係る文書検索装置の実施の形態3の構成図である。 従来技術における文書検索装置の構成図である。
符号の説明
101 文書記憶部
102 検索指示受付部
103 読み出し部
104 データ変換制御部
105 文字属性変換部
106 図形属性変換部
107 ビットマップイメージ変換部
108 相対位置変換部
109 イメージ生成部
110 表示部
1901 速度判定部
2001 データ量測定部

Claims (6)

  1. 文書データに基づいて表示イメージを生成し、その表示イメージを表示手段によりページめくり表示して検索を行なう文書検索装置であって、
     ビットマップイメージデータ及び文書上でのビットマップイメージデータの占有領域を示す占有領域情報とを少なくとも有する文書データを記憶する文書記憶手段と、
     前記文書記憶手段から検索対象の文書データを順次、読み出す読み出し手段と、
     前記読み出し手段が読み出した文書データのうちの占有領域情報を用い、占有領域情報が示す文書上での占有領域にビットマップデータが存在する旨の表示をするように文書の表示イメージを生成するビットマップイメージ生成手段とを備えたことを特徴とする文書検索装置。
  2. 前記文書記憶手段は、表示位置情報を有する文書データを記憶し、
     前記読み出し手段で読み出された文書データの表示位置情報を非可逆圧縮する表示位置情報非可逆圧縮手段を更に備え、
     前記ビットマップイメージ生成手段は、非可逆圧縮された表示位置情報と文書データを用いて文書の表示イメージを生成することを特徴とする請求項1記載の文書検索装置。
  3. 前記文書検索装置は、さらに、
     表示イメージをページめくり表示すべく設定された速度であるページめくり速度が、高速であることを示す所定の基準値よりも大きいか否かを判定するページめくり速度判定手段と、
     前記ビットマップイメージ生成手段は、
     前記ページめくり速度判定手段が判定したページめくり速度が所定の基準値よりも小さい場合は、読み出し手段が読み出した文書データを用いて、文書の表示イメージを生成することを特徴とする請求項2記載の文書検索装置。
  4. 前記文書検索装置は、さらに、
     前記読み出し手段が読み出した文書のデータ量を測定するデータ量測定手段と、
     前記ビットマップイメージ生成手段は、
     前記データ量測定手段が測定した文書のデータ量がデータ量が多いことを示す所定の基準値よりも小さい場合は、読み出し手段が読み出した文書データを用いて、文書の表示イメージを生成することを特徴とする請求項2記載の文書検索装置。
  5. ビットマップイメージデータ及び文書上でのビットマップイメージデータの占有領域を示す占有領域情報とを少なくとも有する文書データを記憶する文書記憶部から検索対象の文書データを順次、読み出し、その読み出した文書データに基づいて表示イメージを生成し、その表示イメージをページめくり表示して検索を行なう文書検索装置における文書検索方法であって、
     読み出された文書データのうちの占有領域情報を用い、占有領域情報が示す文書上での占有領域にビットマップデータが存在する旨の表示をする占有領域表示情報を生成する占有領域表示情報生成ステップと、生成された占有領域表示情報を用いて文書の表示イメージを生成するビットマップイメージ生成ステップとを有することを特徴とする文書検索方法。
  6. 前記文書記憶部は、表示位置情報を有する文書データを記憶し、
     読み出された文書データの表示位置情報を非可逆圧縮する表示位置情報非可逆圧縮ステップを更に有し、
     前記ビットマップイメージ生成ステップは、非可逆圧縮された表示位置情報と文書データを用いて文書の表示イメージを生成することを特徴とする請求項5記載の文書検索方法。
JP2003275012A 1995-04-25 2003-07-15 文書検索装置及び文書検索方法 Pending JP2004078928A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003275012A JP2004078928A (ja) 1995-04-25 2003-07-15 文書検索装置及び文書検索方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP9917795 1995-04-25
JP2003275012A JP2004078928A (ja) 1995-04-25 2003-07-15 文書検索装置及び文書検索方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP7151863A Division JPH0916609A (ja) 1995-04-25 1995-06-19 文書検索装置及び文書検索方法

Publications (1)

Publication Number Publication Date
JP2004078928A true JP2004078928A (ja) 2004-03-11

Family

ID=32031948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003275012A Pending JP2004078928A (ja) 1995-04-25 2003-07-15 文書検索装置及び文書検索方法

Country Status (1)

Country Link
JP (1) JP2004078928A (ja)

Similar Documents

Publication Publication Date Title
EP0864987B1 (en) Document processing method and apparatus, corresponding program and storage unit
US4608662A (en) Method for editing document
JPH08249329A (ja) ポータブル電子文書に記載されている単語を識別する方法及び装置
JPH0352713B2 (ja)
JPH0916609A (ja) 文書検索装置及び文書検索方法
JP2000242258A (ja) フォントメモリおよびフォントデータの読み出し方法
JP2845380B2 (ja) 印刷装置及びその制御方法
JP2004078928A (ja) 文書検索装置及び文書検索方法
JP2854344B2 (ja) ミクストモード文書の表示方法
JP2591021B2 (ja) 文字パターン発生方式
JP2580965B2 (ja) プリンタ装置
JPH0216068A (ja) 像形成装置
JPH0323496A (ja) 文字処理装置及び方法
JPH0371028B2 (ja)
JP2745546B2 (ja) プリンター装置
JPS60109888A (ja) パターン出力方法
JPH0729448B2 (ja) プリンタ制御装置
JPH08161333A (ja) 文字列出力装置
JPH06101028B2 (ja) 文字ドツト・フオント線分化方式
JPH11202849A (ja) 文字処理装置、文字処理方法および文字処理プログラムを記録した記録媒体
JPH03293395A (ja) 文字表示方法
JPH0546151A (ja) 文字パタ−ンの拡大・縮小方法およびそれに用いる制御フアイル
JPH06149208A (ja) 文字発生装置
JPH0439071A (ja) 画像記録装置
JPH0729449B2 (ja) プリンタ制御装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040316

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040517

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040810