JPH11120201A - 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体 - Google Patents

検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体

Info

Publication number
JPH11120201A
JPH11120201A JP9318836A JP31883697A JPH11120201A JP H11120201 A JPH11120201 A JP H11120201A JP 9318836 A JP9318836 A JP 9318836A JP 31883697 A JP31883697 A JP 31883697A JP H11120201 A JPH11120201 A JP H11120201A
Authority
JP
Japan
Prior art keywords
image
data
text
text data
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9318836A
Other languages
English (en)
Inventor
Yoshinari Konuma
良成 小沼
Tetsuzo Sudo
哲造 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BUNSEI SHOIN KK
Original Assignee
BUNSEI SHOIN KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BUNSEI SHOIN KK filed Critical BUNSEI SHOIN KK
Priority to JP9318836A priority Critical patent/JPH11120201A/ja
Publication of JPH11120201A publication Critical patent/JPH11120201A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】文字などがビットマップ形式の画像データとし
て記憶されている場合にも検索を容易にし、検索した文
字を画像上で表示できるようにする。 【解決手段】テキストデータに対応する画像要素を含む
ビットマップ形式の画像データを、テキストデータで検
索可能にするための検索可能な画像データの作成方法で
あって、画像データの画像を表示する工程53と、表示
した画像において、テキストデータに対応する画像要素
を指示する工程54と、指示した画像要素に対応するテ
キストデータを入力する工程55と、指示した画像要素
の画像における位置と入力されたテキストデータを画像
データに付加して、テキストデータ付加画像データを生
成する工程57,58とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、少なくとも一部に
文字や数字などのテキストデータとして扱える画像要素
が記載されているが、画像全体がビットマップ形式で扱
われる場合に、画像要素での検索を可能にする技術に関
し、特に古文書などのテキストデータに置き換えること
が可能な文字や数字などが記載されているが、資料とし
ては元の画像をそのままの形で残した上で文字による検
索を行い、検索した文字を表示した画像上で直接示すこ
とが可能な技術に関する。
【0002】
【従来の技術】歴史の研究においては歴史的文書が研究
対象である。そのような文書としては、例えば、古文
書、写本、絵巻物、版本、瓦版、新聞、雑誌、草稿、地
図などがある。更に、古文書、写本、絵巻物及び地図な
どについては、手書きのものも、謄写版などの活字以外
の印刷物、活字の印刷物などがある。また、新聞や雑誌
には、活字だけのものや写真、挿絵、漫画などが入った
ものもある。このような文書を研究する場合、文字で書
かれている内容は当然のことながら重要であるが、単に
文字で書かれている内容が分かれば良いというものでは
なく、字体や使用されている活字(フォント)も重要で
ある。また、絵巻物、写真やなどが入った新聞や雑誌、
地図などでは、文字以外の画像も重要である。
【0003】一方、このような文書を研究する上では、
膨大な量の文書を効率よく研究することも重要である。
しかし、文書をそのまま扱ったのでは、膨大な量の文書
から所望のものを探し出すのも大変であり、文書自体を
損傷する恐れもある。そのため、このような歴史的な文
書を効率よく、安全に取り扱えることが望まれている。
このための1つの方法は、文書をスキャナなどで読み取
って2値又は多値の画像データ化することが考えられ
る。このような画像データは、文書を画像(イメージ)
として扱い、通常はビットマップ形式で表される。これ
により、文書の画像をディスプレイなどに表示して取り
扱うことができるようになるが、語の検索などは行なえ
ない。
【0004】上記のような文書を研究する場合、ある事
柄に関係する記載内容を各文書から探し出し、それらの
関連性を検討するのが一般的であるが、従来はこの作業
に多くの時間を費やしており、それが研究を効率化する
上での妨げになっていた。そのため、このような文書の
研究効率を向上させる1つの方策は、所望の事柄に関係
する文書及びその記載箇所を検索する効率を向上させる
ことである。ある事柄に関係する記載内容を各文書から
探し出す方法には、それに関係する単語が記載された部
分を探し出す方法がある。文書がJIS規格などに規定
されたコードで表されたテキストデータ化されていれ
ば、コンピュータ処理により、字、記号、単語及び文節
などが検索することが可能である。テキストデータ化さ
れた文書における検索方法としては、例えば、あらかじ
め定めた検索キーワードを基に検索対象を探す方式や、
テキストデータ内に検索用マークを埋め込む方式、ある
いはテキストデータ全文をスキャンして検索対象を定め
る方式などがある。いずれの方式であっても単語や文節
を検索できる。
【0005】文書を上記のビットマップ形式の画像デー
タとしただけでは、検索は行なえない。文書の各画像を
検索するためには、画像内に記載された語のテキストコ
ードをインデックスとして付加して、このインデックス
で関連する画像を検索することが考えられる。しかし、
この方法では検索できるのは画像毎であり、画像内の語
毎の検索は行なえず、文書の内容の詳しい研究などには
不十分である。
【0006】既に存在する文書で検索を行なえるように
するには、文書をテキストデータ化する必要がある。文
書をテキストデータ化する1つの方法としては、人間が
文書を読み取りながらワードプロセッサなどで文書を再
入力するか、原稿をスキャナで読み取って画像データ化
した上で、OCR技術でテキストデータ化することが考
えられる。OCR技術によるテキストデータ化は、欧文
や比較的新しい印刷物の場合には非常に有効であるが、
手書きや古い活字を使用した印刷物ではテキストコード
化できないものも多い。いずれにしろ、上記のようにし
てテキストコード化された場合、作成されたテキストデ
ータは元の文書から独立したものであり、単に記載内容
が同一のテキストデータがあるというだけである。
【0007】近年、データベースシステムの発展形であ
るハイパーテキストやオブジェクトベースなどの技術が
開発されており、電子化された文書などに対して各種の
処理が容易に行なえるようになっている。ハイパーテキ
ストは、文書、図及びイメージスキャナで取り込んだ画
像などを扱うカードをテキストとして、各カードの間を
リンクで結んだもので、関連したカードをリンクを介し
て検索できる。オブジェクトはデータとそれに対する操
作をまとめて扱うもので、オブジェクトベースはオブジ
ェクトを蓄えて利用するためのもので、複雑なデータを
扱うために有用なものである。ハイパーテキストやオブ
ジェクトを構成するデータの多くは、ハイパーテキスト
マーク付け言語(HTML:Hypertext Ma
rkupLanguage)の形式になっている。この
HTMLは、ISO規格やJIS規格などに規定された
標準化マーク付け言語(SGML:StandardG
eneralized Markup Languag
e)に基づいており、HTMLを用いれば、レベルの異
なる見出し語、箇条書きによる単純な文書構造の表現や
ハイパーテキストのリンクの表現が可能である。以下の
説明ではこの技術を使用するものとして説明を行なう
が、本発明はこれに限られるものではない。ハイパーテ
キストやオブジェクトベースは、広く知られ使用されて
いる技術であり、ここではこれ以上の説明は省略する。
【0008】ハイパーテキストは、各種の形式のデータ
を扱え、テキストコード形式のデータはテキストデータ
として、ビットマップ形式のデータはビットマップデー
タとして別々のカードとし、それらをリンクさせること
ができる。そこで、上記のような文書を、文字や数字な
どはテキストコード化してテキストデータのカードと
し、全体の画像はページ、段落などを一単位としてビッ
トマップデータのカードとして、合わせてハイパーテキ
ストとすることが考えられる。これにより、文書を画像
としてもテキストデータとしても取り扱えるようにな
り、語の検索なども行なえるようになる。
【0009】
【発明が解決しようとする課題】しかし、このようなハ
イパーテキストを作成しても、テキストデータの各コー
ドはビットマップデータの画像として表示される元の文
書の各字とは直接的には対応していない。そのため、語
の検索を行なう場合、テキストデータの文字列の表示に
おいては、検索した語を表示することも可能であるが、
ビットマップデータの画像における語を示すことはでき
ず、単に検索した語が含まれる画像全体が表示できるだ
けである。そのため、表示された元の文書の画像におい
て、検索した語を探して記載箇所を調べるなどの作業が
必要になる。本発明は、ビットマップデータの画像にお
ける語の検索をより一層効率的に行なえるようにする技
術を実現することを目的とする。
【0010】
【課題を解決するための手段】本発明は、テキストデー
タに対応する文字などの画像要素を含むビットマップ形
式の画像データを対象とする処理であり、上記目的を実
現するため、ビットマップ形式の画像データに、画像要
素に対応するテキストデータを、画像要素の画像上での
位置データと一緒に付加してテキストデータ付加画像デ
ータとする。これにより、画像要素はテキストコードと
直接対応するので、検索したテキストコードに対応する
画像要素を、ビットマップ形式の元の画像上で識別可能
に表示できる。従って、対応する画像要素を画像上で探
す必要がなくなり、作業が効率的に行なえるようにな
る。
【0011】上記のようなテキストデータ付加画像を作
成する方法は、表示されたビットマップ形式の画像デー
タの画像において、指示された画像要素に対応するテキ
ストデータを入力し、画像要素の画像における位置と入
力されたテキストデータを画像データに付加してテキス
トデータ付加画像データを生成する工程とを備えること
を特徴とする。また、テキストデータ付加画像を作成す
る装置は、ビットマップ形式の画像データの画像を表示
する表示装置と、表示した画像においてテキストデータ
に対応する画像要素を指示する指示手段と、指示した画
像要素に対応するテキストデータを入力するテキストデ
ータ入力手段と、指示した画像要素の画像における位置
と入力されたテキストデータを画像データに付加して、
テキストデータ付加画像データを生成するテキストデー
タ付加画像データ生成手段とを備えることを特徴とす
る。
【0012】テキストデータ付加画像データ生成手段
は、入力されたテキストデータ及び画像要素の画像にお
ける位置データを対応させて記憶したテキストファイル
を作成し、画像データのファイルとテキストファイルを
リンクさせる。画像要素の指示は、画像要素の画像にお
ける表示範囲を指示することで行い、テキストデータに
対応する文字などを表示範囲内で表示するのに適したフ
ォントサイズを算出し、算出したフォントサイズを前記
テキストデータ付加画像データに付加する。
【0013】上記のようにして作成されたテキストデー
タ付加画像データで検索を行なう方法では、画像要素に
対応するテキストデータを検索し、画像データの表示画
像において、検索したテキストデータに対応する画像要
素を識別可能に表示することを特徴とする。テキストデ
ータ付加画像データにおける画像要素を検索する画像デ
ータの検索装置は、テキストデータを検索する検索手段
と、画像において検索したテキストデータに対応する画
像要素を識別可能に表示する表示手段とを備えることを
特徴とする。テキストデータ付加画像エータを作成及び
そこで画像要素を検索する装置は、コンピュータによっ
て実現される。
【0014】
【発明の実施の形態】図1は本発明の実施例で使用する
コンピュータの基本構成を示すブロック図である。図示
のように、このコンピュータは、CPU11と、ROM
12と、RAM13と、磁気ディスク装置14と、CD
−ROMドライブ15と、スキャナ16と、表示インタ
ーフェース17と、ビットマップ形式の表示メモリ18
と、ディスプレイ19と、入力インターフェース20
と、キーボード21と、マウス22とを備え、公知のコ
ンピュータと同じ構成を有する。
【0015】まず、図1のコンピュータを使用してテキ
ストデータ付加画像データを作成する場合について説明
する。図2は、この場合の処理手順を示したフローチャ
ートである。ステップ51で、スキャナ16で文書を読
み取らせてビットマップデータカードを作成する。この
データは、磁気ディスク装置14に記憶される。ステッ
プ52で、テキストデータカードを開き、ビットマップ
データカードとリンクさせる。ステップ53で、ビット
マップデータカードの画像を表示する。オペレータは、
表示された画像を見ながらテキストデータ化することが
必要な語などを選択する。ここでは、テキストコードで
表される文字、数字及び記号であれば基本的にはどのよ
うなものでも選択することが可能であるが、単に1文字
ずつ選択するのではなく、単語の形のものを選択するこ
とが望ましい。例えば、「国勢調査」の場合には、
「国」、「勢」、「調」、「査」を別々に選択するので
はなく、「国勢調査」とう単語を選択する。なお、ここ
では、テキストコード化でき、1つのまとまりとしてテ
キストコードで表すように選択される部分を、画像要素
と称することとする。
【0016】ステップ54では、画像要素の範囲を指示
する。この操作を図3の(1)で説明する参照番号20
で示したのはビットマップデータの1ページ分の画像で
ある。例えば、参照番号21で示した部分が右側に示し
たような表示であり、そのうちの「国勢調査」という単
語を画像要素としてテキストデータにする場合には、
「国勢調査」という単語が入る長方形の枠の対角線の両
端の2点aとbをマウス22などで指示する。ステップ
55では、画像要素に対応するテキストコード、この場
合は「国勢調査」の「国」、「勢」、「調」、「査」の
各JISコードを連続して入力する。実際には、ワード
プロセッサのソフトウエアを使用して、単に「国勢調
査」と入力する。
【0017】ステップ56では、入力されたテキストコ
ードが既にテキストデータに存在するかが調べられる。
これは、テキストデータとしては1つのテキストコード
のみを登録し、同じテキストコードが複数回テキストデ
ータとして登録するように指示された場合には、位置デ
ータを増やすことにより、テキストデータを効率的に管
理できるようにするためである。入力されたテキストコ
ードが登録されていなければ、ステップ57で新たなテ
キストコードとしてテキストデータに登録する。すでに
登録されているテキストコードであれば、ステップ58
に進む。ステップ58では、画像要素の位置を示す点a
とbの座標を、テキストコードと関連させて登録する。
ステップ59では、テキストコードに対応するフォント
が、点aとbで指示された長方形の内部で最適な大きさ
に表示されるようなフォントサイズが算出されて登録さ
れる。文書が印刷物であれば、フォントサイズは文書の
ものと同一であることが望ましいが、手書きの文書の場
合には、若干異なったフォントサイズになる。
【0018】ステップ60では、表示されたページのテ
キストデータ化する画像要素すべてについて処理が終了
したかが判定され、終了するまで行なわれる。ステップ
61では、更に全ページについて上記の処理が終了した
かが判定され、文書を構成する全ページについて処理が
終了するまで行なわれる。なお、ページを変えた場合に
は、テキストデータの画像要素の位置データのページを
変える。以上のような処理を行なうことにより、図3の
(2)に示すようなテキストデータカードが作成され
る。なお、本実施例では、図3の(2)に示すように、
テキストコードについては、入力した日本語に対応する
英語のテキストコードなども対応付けて登録できるよう
になっている。このようなテキストコードに対応する他
のテキストコードの入力は、ステップ55におけるテキ
ストコードの入力時に行なったり、すべての作業が終了
した後、テキストデータに登録されたテキストコードを
指示した上で、対応する別のテキストコードを入力する
形で行なわれる。
【0019】また、図2の処理では、ステップ55でオ
ペレータがテキストコードを入力したが、活字の印刷物
の場合などは、ステップ54で指示された画像要素の範
囲のビットマップデータを公知のOCR技術を使用して
画像要素のテキストデータを自動的に認識してテキスト
データを生成するようにしてもよい。そして、OCR技
術で自動認識できない時にのみ、オペレータがテキスト
データを入力する。これであれば、オペレータがテキス
トコードを入力する手間が大幅に削減されるため、処理
能率が向上する。更に、図3の(1)では、画像要素の
範囲を長方形とし、長方形の対向する2点の座標を位置
データとして入力した。しかし、長方形は画面に垂直及
び水平な線で規定される長方形でなくてもよく、斜めの
長方形又は長方形以外の形状でもよい。斜めの長方形の
場合には、3個の頂点の座標を位置データとして記録す
る。長方形以外の形状の場合には、すべての頂点の座標
を位置データとして記録する。
【0020】完成したテキストデータ付加画像データ
は、そのまま磁気ディスク装置14に記憶しておき、研
究に使用する。また、関連する文書を収集してテキスト
データ付加画像データに加工し、それを各研究者にCD
−ROM,DVD,ハードディスクなどのランダムアク
セス可能な記録媒体に記憶した形で供給することも考え
られる。そのような場合には、CD−ROMに収納する
文書毎に上記の処理を行い、各文書のテキストデータ付
加画像データを作成し、磁気ディスク装置14に記憶す
る。その上で、磁気ディスク装置14に記憶された各文
書のテキストデータ付加画像データをCD−ROMの原
盤を作成する装置に供給してCD−ROMを作成する。
この場合、文書のスキャナで読み取って作成したビット
マップデータは、データ量が膨大であり、そのままの形
ではCD−ROMに収納できる文書の量が少ないという
問題がある。そこで、公知の圧縮技術を使用して、ビッ
トマップデータをページ毎に圧縮してからCD−ROM
に記録することが望ましい。
【0021】図4は、上記のようにして作成したテキス
トデータ付加画像データを使用して、検索処理を行なう
場合の処理を示すフローチャートである。ここでは、C
D−ROMに記録された形でテキストデータ付加画像デ
ータが供給され、ビットマップデータはページ毎に圧縮
されているものとする。従って、CD−ROMから読み
出されたビットマップデータは、圧縮方式に対応する再
生方式で伸長された上で表示される。磁気ディスク装置
14にテキストデータ付加画像データが記憶されている
場合も同様である。
【0022】まず、テキストデータ付加画像データが記
録されたCD−ROMをCD−ROMドライブ15にセ
ットし、対象とする文書を指示する。次に、ステップ7
1で、検索するテキストコードを入力する。入力するテ
キストコードは、対応する複数のテキストコードが記録
されている場合には、いずれのテキストコードを入力し
てもよい。例えば、日本語の文書であるが、図3の
(2)で示したように日本語のテキストコードと対応し
て英語のテキストコードが記録されている場合には、外
国人などが英語などで検索を行なうことも可能である。
これに応じて、ステップ72で、テキストデータにおい
て入力されたテキストコードを検索する。この検索は、
図3の(2)に示したテキストコードの項を順に検索す
るだけの非常に簡単な処理であり、高速で行なえる。ス
テップ73では、検索の結果入力されたテキストコード
があるかを判定し、ない場合にはステップ78に進ん
で、入力されたテキストコード、すなわちテキストコー
ドに対応する画像要素がないことを表示する。ある場合
には、ステップ74に進む。
【0023】ステップ74では、検索したテキストコー
ドの位置データを調べ、最初の位置のページと座標を読
み出す。そして、ステップ75で、ビットマップデータ
からそのページの画像を読み出してディスプレイ19に
表示すると共に、座標で指示された長方形の範囲の表示
を点滅させる。点滅させる代わりに、表示を反転させた
りマークを表示してもよく、要するにオペレータが検索
したテキストコードの画像要素の位置が分かればよい。
なお、オペレータがビットマップデータの画像の代わり
に対応するテキストコードを表示するように指示した時
には、対応するテキストコードとサイズデータを読み出
して、コンピュータの指定されたフォントの画像をサイ
ズデータに対応する大きさで表示する。なお、図3の
(2)のように、複数の対応するテキストデータが記録
されている場合には、いずれのテキストデータを表示す
ることも可能である。ステップ76は、次の検索が指示
されたかを判定する工程で、指示があるまで上記の表示
を維持する。
【0024】次の検索の指示があった場合には、ステッ
プ77で、次の位置データがあるかを判定する。次の位
置データがあれば、ステップ74に戻り、次の位置デー
タを読み出して、同様の処理を行なう。このような処理
をすべての位置データが終了するまで行ない、それ以上
位置データがない場合には、ステップ78に進んで、そ
れ以上テキストデータに対応する画像要素がないことを
表示した後、ステップ71に戻り次に検索するテキスト
データの入力を待つ。なお、フローチャートには示して
いないが、いずれの処理の途中でも処理を中断して最初
のテキストデータの入力を待つ状態にもどったり、処理
を中止することができる。以上のような処理により、文
書に使用されている語を検索する場合、文書のどの部分
に記載されているかが即座に示されるので、文書の解析
作業が非常に容易になる。
【0025】本発明には、上記のような利点以外に従来
技術にない利点がいくつかある。例えば、画像要素に対
応するテキストデータを入力する場合に、従来は記載さ
れているすべての文字や数字を入力する必要があり、一
部を入力しないといったことはできなかった。これに対
して、本発明であれば任意の画像要素についてのみテキ
ストデータ化することも可能である。文書の研究を行な
う場合、その文書で検索する必要のある語は比較的限ら
れており、実際に検索のためのテキストデータにする必
要のある画像要素は少ない。そのため、本発明を適用し
た場合には、ページ当りのテキストデータ化される画像
要素の個数は、従来の記載されているすべての文字や数
字の個数に比べてはるかに少なく、その分テキストデー
タの入力作業量が低減される。
【0026】また、テキストデータの量が少ないため検
索する場合にも検索速度は非常に高速である。その上、
テキストデータ化されているのは単語の形のテキストコ
ードの組であり、図3の(2)に示すようにテキストコ
ード毎に分類されているため、文字や数字のテキストコ
ードが連続したものから対応するテキストコードの組を
検索するのに比べて検索は容易であり、検索速度がこの
点からも向上する。この効果は、文書のデータ量が増大
するほど大きくなる。検索速度が向上すれば、その分解
析に要する作業時間を短縮させることが可能であり、作
業を効率的に行なうことが可能になる。
【0027】
【発明の効果】以上説明したように、本発明によれば、
文字などがビットマップ形式の画像データとして記憶さ
れている場合でも、文字などを検索して画像上での位置
を示すことができるようになるため、古文書などの研究
がきわめて効率よく行なえるようになる。
【図面の簡単な説明】
【図1】本発明の実施例で使用するコンピュータの基本
構成を示す図である。
【図2】実施例においてテキストデータ付加画像データ
を作成す処理手順を示したフローチャートである。
【図3】テキストデータ付加画像データを作成す時の画
像要素の範囲の指定方法と作成されたテキストデータ付
加画像データの構造を説明する図である。
【図4】実施例においてテキストデータ付加画像データ
に対して検索処理を行なう時の処理手順を示したフロー
チャートである。
【符号の説明】 53…画像表示工程 54…画像要素を指示する工程 55…画像要素に対応するテキストコードを入力する工
程 57、58…テキストコードと画像要素の位置を入力す
る工程
───────────────────────────────────────────────────── フロントページの続き (54)【発明の名称】 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像デ ータの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画 像データを記録した記憶媒体

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 テキストデータに対応する画像要素を含
    むビットマップ形式の画像データを、前記テキストデー
    タで検索可能にするための検索可能な画像データの作成
    方法であって、 前記画像データの画像を表示する工程と、 表示した画像において、前記テキストデータに対応する
    画像要素を指示する工程と、 指示した画像要素に対応するテキストデータを入力する
    工程と、 前記指示した画像要素の前記画像における位置と前記入
    力したテキストデータを前記画像データに付加して、テ
    キストデータ付加画像データを生成する工程とを備える
    ことを特徴とする検索可能な画像データの作成方法。
  2. 【請求項2】 請求項1に記載の検索可能な画像データ
    の作成方法であって、 前記テキストデータ付加画像データを生成する工程で
    は、前記テキストデータを記憶するテキストファイル
    と、前記画像要素の画像における位置データを記憶する
    位置データファイルを作成し、前記画像データのファイ
    ルと、前記テキストファイル及び前記位置データファイ
    ルをリンクさせる検索可能な画像データの作成方法。
  3. 【請求項3】 テキストデータに対応する画像要素を含
    むビットマップ形式の画像データを、前記テキストデー
    タで検索可能にするための検索可能な画像データの作成
    装置であって、 前記画像データの画像を表示する表示装置と、 表示した画像において、前記テキストデータに対応する
    画像要素を指示する指示手段と、 指示した画像要素に対応するテキストデータを入力する
    テキストデータ入力手段と、 前記指示した画像要素の前記画像における位置と前記入
    力手段から入力されたテキストデータを前記画像データ
    に付加して、テキストデータ付加画像データを生成する
    テキストデータ付加画像データ生成手段とを備えること
    を特徴とする検索可能な画像データの作成装置。
  4. 【請求項4】 請求項3に記載の検索可能な画像データ
    の作成装置であって、 前記テキストデータ付加画像データ生成手段は、前記テ
    キストデータ及び前記画像要素の画像における位置デー
    タを対応させて記憶したテキストファイルを作成し、前
    記画像データのファイルと前記テキストファイルをリン
    クさせる検索可能な画像データの作成装置。
  5. 【請求項5】 請求項3又は4に記載の検索可能な画像
    データの作成装置であって、 前記指示手段は、前記画像要素の前記画像における表示
    範囲を指示する手段であり、 前記テキストデータ付加画像データ生成手段は、前記テ
    キストデータを前記表示範囲内で表示するのに適したフ
    ォントサイズを算出し、算出した前記フォントサイズを
    前記テキストデータ付加画像データに付加する検索可能
    な画像データの作成装置。
  6. 【請求項6】 テキストデータに対応する画像要素を含
    むビットマップ形式の画像データに、前記画像要素の画
    像における位置データ及び前記テキストデータを付加し
    たテキストデータ付加画像データにおける前記画像要素
    の検索方法であって、 検索する前記画像要素に対応する前記テキストデータを
    検索する工程と、 表示した前記画像データに対応する画像において、検索
    した前記テキストデータに対応する前記画像要素を識別
    可能に表示する工程とを備えることを特徴とする画像デ
    ータの検索方法。
  7. 【請求項7】 テキストデータに対応する画像要素を含
    むビットマップ形式の画像データに、前記画像要素の画
    像における位置データ及び前記テキストデータを付加し
    たテキストデータ付加画像データにおける前記画像要素
    を検索する画像データの検索装置であって、 検索する前記画像要素に対応する前記テキストデータを
    検索する検索手段と、 検索した前記テキストデータに対応する前記画像データ
    の画像表示において、検索した前記テキストデータに対
    応する前記画像要素を識別可能に表示する表示手段とを
    備えることを特徴とする画像データの検索装置。
  8. 【請求項8】 コンピュータによって、テキストデータ
    に対応する画像要素を含むビットマップ形式の画像デー
    タを、前記テキストデータで検索可能にするためのプロ
    グラムを記録した媒体であって、 該プログラムは、コンピュータに前記画像データの画像
    を表示させ、 表示した画像において、前記ビットマップ形式の画像デ
    ータとしてのテキストに対応する画像要素を入力するよ
    うに指示させ、 前記指示された画像要素の前記画像における位置と前記
    入力されたテキストデータを前記画像データに付加し
    て、テキストデータ付加画像データを生成させることを
    特徴とする検索可能な画像データの作成プログラムを記
    録した媒体。
  9. 【請求項9】 コンピュータによって、テキストデータ
    に対応する画像要素を含むビットマップ形式の画像デー
    タに、前記画像要素の画像における位置データ及び前記
    テキストデータを付加したテキストデータ付加画像デー
    タにおいて前記画像要素を検索するためのプログラムを
    記録した媒体であって、 該プログラムは、検索する前記画像要素に対応する前記
    テキストデータを検索させ、 表示した前記画像データに対応する画像において、検索
    した前記テキストデータに対応する前記画像要素を識別
    可能に表示させることを特徴とする画像データの検索プ
    ログラムを記録した媒体。
  10. 【請求項10】 検索可能な画像データを記録したコン
    ピュータ読み取り可能な記録媒体であって、 前記画像データは、前記記録媒体に、 テキストデータに対応する画像要素を含むビットマップ
    形式の画像データファイル、及び前記画像要素の画像に
    おける位置と該画像要素に対応する前記テキストデータ
    を関連付けたテキストファイルに記録され、 前記画像データファイルと前記テキストファイルがリン
    クされていることを特徴とする検索可能な画像データを
    記録したコンピュータ読み取り可能な記録媒体。
JP9318836A 1997-10-16 1997-10-16 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体 Pending JPH11120201A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9318836A JPH11120201A (ja) 1997-10-16 1997-10-16 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9318836A JPH11120201A (ja) 1997-10-16 1997-10-16 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体

Publications (1)

Publication Number Publication Date
JPH11120201A true JPH11120201A (ja) 1999-04-30

Family

ID=18103504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9318836A Pending JPH11120201A (ja) 1997-10-16 1997-10-16 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体

Country Status (1)

Country Link
JP (1) JPH11120201A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176188A (ja) * 1992-12-03 1994-06-24 Ibm Japan Ltd 認識文字の情報作成方法及び装置
JPH07210576A (ja) * 1994-01-27 1995-08-11 Matsushita Electric Ind Co Ltd 画像検索装置、画像記憶装置及び検索方法
JPH08180068A (ja) * 1994-12-26 1996-07-12 Canon Inc 電子ファイリング装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176188A (ja) * 1992-12-03 1994-06-24 Ibm Japan Ltd 認識文字の情報作成方法及び装置
JPH07210576A (ja) * 1994-01-27 1995-08-11 Matsushita Electric Ind Co Ltd 画像検索装置、画像記憶装置及び検索方法
JPH08180068A (ja) * 1994-12-26 1996-07-12 Canon Inc 電子ファイリング装置

Similar Documents

Publication Publication Date Title
JP3289968B2 (ja) 電子的文書処理のための装置および方法
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
JP3491962B2 (ja) 文書検索方法及びシステム
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
US6353840B2 (en) User-defined search template for extracting information from documents
CA2077274C (en) Method and apparatus for summarizing a document without document image decoding
JP3232144B2 (ja) 文章中の単語文節の出現頻度を求めるための装置
US5396588A (en) Data processing using digitized images
JPH06111056A (ja) 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法
JPH1055371A (ja) 文書探索および検索システム
JPH05282488A (ja) 文書画像の復号なしに文書の意味的に重要な部分の自動変更のための方法
JP4261988B2 (ja) 画像処理装置及び方法
JPH08147446A (ja) 電子ファイリング装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
CN113806472B (zh) 一种对文字图片和图像型扫描件实现全文检索的方法及设备
JPH08180068A (ja) 電子ファイリング装置
JPH0934903A (ja) ファイル検索装置
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
Setlur et al. Creation of data resources and design of an evaluation test bed for Devanagari script recognition
JPH11120201A (ja) 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体
JP4480109B2 (ja) 画像管理装置および画像管理方法
JPH08161350A (ja) 電子ファイリング方法および装置
JP2007048057A (ja) 画像処理装置
JP2000148763A (ja) 画像記憶方法及びその装置
Youssef et al. The Million Book Project at Bibliotheca Alexandrina