JPH11296525A - データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置 - Google Patents

データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置

Info

Publication number
JPH11296525A
JPH11296525A JP10094261A JP9426198A JPH11296525A JP H11296525 A JPH11296525 A JP H11296525A JP 10094261 A JP10094261 A JP 10094261A JP 9426198 A JP9426198 A JP 9426198A JP H11296525 A JPH11296525 A JP H11296525A
Authority
JP
Japan
Prior art keywords
information
search
database
word
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10094261A
Other languages
English (en)
Inventor
Kazuyo Kuroda
和代 黒田
Yasuo Tanosaki
康雄 田野崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10094261A priority Critical patent/JPH11296525A/ja
Publication of JPH11296525A publication Critical patent/JPH11296525A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 従来、HTML文書中の画像情報や音声情報
にキーワードを付加してデータベースを作成出来なかっ
た。 【解決手段】 マルチメディア情報を要素として含む構
造化文書、すなわちマルチメディア情報データの中か
ら、自動的に画像情報や音声情報に対応するキーワード
を抽出して外部記憶装置101にデータベースを作成す
る。検索部105はユーザが入力したキーワードに従
い、予めデータベースに格納されているマルチメディア
情報に付与されていたキーワードを用いてキーワード検
索を行う。ユーザが入力したキーワードとデータベース
に格納されたキーワードが一致したならば、制御装置1
03は出力装置107からその一致したキーワードを持
つ画像情報や音声情報を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、画像情報や音声
情報といったマルチメディア情報の管理に係わり、特
に、マルチメディア情報を検索するためのデータベース
作成技術とそのデータベースを用いた検索技術に関す
る。
【0002】
【従来の技術】近年、コンピュータ及びコンピュータネ
ットワークの普及や、画像情報の処理技術の向上に伴
い、画像情報や音声情報といったいわゆるマルチメディ
ア情報を取り扱う機会が増えている。このようなマルチ
メディア情報の量は過去に比べて、爆発的な増加を示し
ており、必要な情報を的確に入手することの重要性が高
まっている。また、WWW(World Wide W
eb)が普及するにつれて、情報の入手手段としてHT
ML(HyperText Markup Langu
age)文書を利用することが多くなってきた。HTM
L文書で表された情報を検索するための検索方法が特開
平10―21255号公報に開示される。
【0003】まずHTML文書について図11、図12
を参照して以下の通り説明する。画像情報や音声情報な
どを含むマルチメディア情報データは構造化文書、すな
わちSGML(Standard Generaliz
ed Markup Language)文書の形で表
される。SGML文書の具体例を図11に示す。図11
はSGML文書の一つであるHTML文書である。この
SGML文書の中には図11に示すように画像情報が画
像ファイル名の形で含まれる。HTML文書についての
情報はインターネットのウェブ上でその規格が公開され
ている(http://www.w3.org/MarkUp/MarkUp.html)。図
11のHTML文書により表される画面は図12のよう
になる。WWWにアクセスし、マルチメディア情報を閲
覧したり、ネットワーク上のアドレス、URL(Uni
form Resource Locators)アド
レスを指定してダウンロードすることによって、HTM
L文書に代表されるSGML文書を受信したりする。
【0004】特開平10―21255号公報に開示され
た方法は、まず、アクセスしたHTML文書から、その
HTML文書の内容を反映するようなキーワードを抽出
し、データベース化する。このキーワードの抽出は単語
切りにより行う。検索時はキーワードを入力して、この
データベースを用いた検索を行う、というものである。
HTML文書を用いる以前の、人の手によるキーワード
入力に比べると手間がかからず、便利である。
【0005】しかしこの方法では、HTML文書内の画
像ファイルや音声ファイルに対してはキーワードを付加
しないので、検索対象がHTML文書ファイルになる。
そのため、検索結果はHTML文書ファイルで表される
こととなり、サイズの大きなHTML文書が検索結果と
してヒットした場合、その中からまた所望の画像情報や
音声情報を見つけ出すのは手間がかかる。
【0006】
【発明が解決しようとする課題】従来の、HTML文書
からキーワードを抽出してデータベース化する方法は、
キーワードの付加は自動的に行われ、検索も文字列どう
しで行われるので時間もかからないが、検索対象がHT
ML文書であり、その中からまた画像情報や音声情報を
自分で探さなければならないという問題があった。
【0007】そこで、本発明は上記の問題を解決するた
めになされたものであり、構造化文書中の画像情報や音
声情報といったマルチメディア情報にキーワードを付加
する、マルチメディア情報の検索方法及び検索装置を提
供することを目的とする。
【0008】
【課題を解決するための手段】本発明は、構造化文書で
表された画像情報や音声情報といったマルチメディア情
報を入力し、解析するステップと、前記マルチメディア
情報にキーワードを付加するステップと、前記キーワー
ドをデータベースに格納するステップとを具備したこと
を特徴とする。
【0009】このような構成によれば、構造化文書中の
画像情報や音声情報といったマルチメディア情報にキー
ワードを付加して、データベースを作成することができ
る。また、本発明は、構造化文書で表された画像情報や
音声情報といったマルチメディア情報を入力し、解析す
るステップと、前記マルチメディア情報にキーワードを
付加するステップと、前記キーワードをデータベースに
格納するステップと、検索キーを入力するステップと、
前記検索キーに対応する文字列と前記データベース内に
格納されたキーワードを用いて前記マルチメディア情報
を検索するステップとを具備したことを特徴とする。
【0010】このような構成によれば、構造化文書中の
画像情報や音声情報といったマルチメディア情報にキー
ワードを付加して、データベースを作成し、検索を行う
ことが可能となる。
【0011】また、本発明は、構造化文書で表された画
像情報や音声情報といったマルチメディア情報を入力
し、解析するステップと、前記マルチメディア情報にキ
ーワードを付加するステップと、前記キーワードをデー
タベースに格納するステップとをコンピュータに実行さ
せるプログラムを記憶した記憶媒体である。
【0012】このような構成によれば、構造化文書中の
画像情報や音声情報といったマルチメディア情報にキー
ワードを付加して、データベースを作成することができ
る。また、本発明は、検索データベースを作成する手段
と、前記検索データベースと、構造化文書の形で画像情
報や音声情報といったマルチメディア情報を記憶する記
憶手段とを具備し、前記検索データベースを作成する手
段は、前記マルチメディア情報を含む構造化文書から文
字列又は単語を抽出してデータベースを作成することを
特徴とする。
【0013】このような構成によれば、構造化文書中の
画像情報や音声情報といったマルチメディア情報にキー
ワードを付加して、データベースを作成することができ
る。また、本発明は、検索データベースを作成する手段
と、前記検索データベースと、構造化文書の形で画像情
報や音声情報といったマルチメディア情報を記憶する記
憶手段と、検索キーを入力する入力手段と、検索キーに
対応する文字列とデータベース内のキーワードとの間で
検索を行う制御手段と、検索結果を出力する出力手段と
を具備し、前記検索データベースを作成する手段は、前
記マルチメディア情報を含む構造化文書から文字列又は
単語を抽出してデータベースを作成することを特徴とす
る。
【0014】このような構成によれば、構造化文書中の
画像情報や音声情報といったマルチメディア情報にキー
ワードを付加して、データベースを作成し、検索を行う
ことが可能となる。
【0015】
【発明の実施の形態】以下、図面を参照してこの発明の
実施形態を説明する。マルチメディア情報の中でも使用
頻度の高い画像情報を例に説明する。図1は本発明の一
実施形態の構成を示す図である。101は外部記憶装置
であり、検索データベースやマルチメディア情報、後述
する構造化文書の形をとるマルチメディア情報データを
格納する。この外部記憶装置101にはハードディスク
等を用いることができる。102は入力装置であり、ユ
ーザがマルチメディア情報データや各種指示を入力する
ために用いる。キーボードやタッチパネル、その他にス
キャナ、デジタルカメラといった画像入力装置や、音声
入力装置等を用いることができる。また構造化文書で表
現されるマルチメディア情報データを入力するためにフ
ロッピーディスクドライブや、光磁気ディスクドライブ
などのリムーバブルメディアドライブを備えていてもよ
い。103は制御装置であり、検索を制御する。制御装
置103はキーワード付加部104、検索部105、検
索結果表示部106からなる。キーワード付加部104
は画像情報や音声情報といったマルチメディア情報デー
タに後述する方法でキーワードを付加する。検索部10
5は後述する方法により、キーワードを用いて検索を実
行する。検索結果表示部106は検索部105により検
索された情報を制御装置103の内部で展開する。10
7は出力装置である。ユーザが入力装置102から入力
したデータや、制御装置103が検索を行った検索結果
を出力する。CRTや液晶ディスプレイ、プリンタ等を
用いることができる。音声データの出力にはスピーカー
を用いる。108は通信装置であり、電話回線やLAN
といった通信手段で、WWWや他のコンピュータなどと
情報をやり取りするために用いる。この通信装置108
を介してマルチメディア情報データを入力することも可
能である。109は時計装置であり、このシステムを制
御するために用いる。
【0016】本発明の一実施形態においては、通信装置
108や入力装置102からマルチメディア情報データ
を入力する。このマルチメディア情報データは前述した
構造化文書、すなわちSGML文書の形で入力されるこ
とを想定している。本発明の一実施形態の装置は、通信
装置108を用いて、WWWにアクセスし、マルチメデ
ィア情報を閲覧したり、ネットワーク上のアドレス、U
RLアドレスを指定してダウンロードすることによっ
て、HTML文書に代表されるSGML文書を受信した
りする。受信したSGML文書ファイルや画像ファイル
は全てマルチメディア情報データとして記憶装置101
に格納する。
【0017】まずデータベースの作成について図2を参
照して以下の通り説明する。本実施形態においてはSG
ML文書の一つであるHTML文書を例に説明する。ま
ずユーザは、通信装置108や入力装置102から画像
ファイルを要素として含むHTML文書ファイルの形で
マルチメディア情報データを入力する(ステップ2
1)。制御装置103は、入力されたマルチメディア情
報データを図3に示される通り、HTML文書ファイル
ごとに、1から昇順に付与した番号、HTML文書ファ
イル名、情報本体をそれぞれ、外部記憶装置101中の
マルチメディア情報データの情報ID番号項目、ファイ
ル名項目、情報本体項目に格納する(ステップ22)。
次に制御装置103内のキーワード付加部104が、マ
ルチメディア情報データであるHTML文書参照し、解
析を始め画像ファイルの場所を探す(ステップ23)。
画像ファイルの場所がわかったら、キーワード付加部1
04は後述する方法で画像表示部分の解析を行う(ステ
ップ24)。次にキーワード付加部104はHTML文
書ファイルにキーワードを付加する(ステップ25)。
ここまでがデータベース作成の処理になる。本実施形態
ではHTML文書のダウンロードが終了してからHTM
L文書の解析を行っているが、ダウンロードと並行して
HTML文書ファイルの解析を行っても構わない。装置
の処理能力に応じて、いつ解析するかを選択できるが、
ダウンロードと並行してHTML文書ファイルの解析を
行う場合でも、単語の出現頻度の解析については、HT
ML文書ファイル全体のダウンロードが終了してから行
うことになる。
【0018】検索用のデータベースの作成方法を図4
と、図5、図6を参照して以下の通り説明する。図4
は、図2のステップ24に対応した、画像表示部分の解
析部を示すフローチャート図である。図5は、図2のス
テップ25に対応した、HTML文書ファイルキーワー
ド自動付加部を示すフローチャート図である。図6は検
索データベース格納例を示す図である。データベースを
作成するにあたって、キーワード付加部104がHTM
L文書ファイルを一ファイルずつ解析する。キーワード
付加部104は対象としたHTML文書ファイル名を検
索データベース内のHTML文書ファイル名項目にその
ファイル名を格納する。また、検索データベース内の情
報ID番号項目に、何番目に解析したファイルである
か、その番号を格納する。
【0019】キーワード付加部104による、HTML
文書ファイルの解析について図4のフローチャートを参
照して以下の通り説明する。まずHTML文書ファイル
を頭から読む(ステップ41)。HTML文書中で、画
像ファイル表示を表現する「<IMG SRC=」から
始まる文字列を抽出し(ステップ42)、その直後
で「" 」に囲まれた文字列を画像ファイル名として抽出
する(ステップ43)。HTML言語において、「<I
MG SRC=」から始まる部分は、「=」の後に指示
した画像ファイルを表示するという意味がある。抽出し
た画像ファイル名はデータベースに格納される。次に画
像ファイル表示を表現する文字列の終了である「>」の
前で、「ALT=」から始まる文字列を抽出し、その後
に続く「" 」に囲まれた文字列を画像キーワードとして
抽出する(ステップ44)。HTML言語において、
「ALT=」から始まる部分は、画像表示能力のないデ
ィスプレイなどで、画像表示の代わりに表示する文字列
を示す。文書作成者が画像を表示するかわりに、その画
像を文字で表現するために記入しているので、画像ファ
イルの内容を反映していると考えられ、キーワードとし
て有効である。この「ALT=」から始まる文字列が構
造化文書中にない場合は次に進む。
【0020】続いてHTML文書の一部である「<IM
G SRC= …>」の前後のそれぞれ50文字ずつを
抽出する。抽出した文字列を解析して単語ごとに切る
(ステップ45)。この文字列を単語ごとに切る方法は
日本語ワードプロセッサーなどで実用化されているもの
を使用する。文字列を単語ごとに切った後、単語の出現
頻度を調べ、出現頻度に差があるかどうか比べる(ステ
ップ46)。出現頻度に差がある場合は、出現頻度の高
い順に10個の単語をキーワードとする(ステップ46
のYesからステップ47)。抽出した文字列の中に単
語が10個以下しかない場合は、抽出する範囲を前後5
0字ずつから前後100字ずつに変更して同様に単語ご
とに切ってキーワードを抽出する作業を行う。出現頻度
に差がない場合は、画像ファイル表示を表現する文字列
に近い位置にある単語から順に画像キーワードとして抽
出する(ステップ46のNoからステップ48)。この
ようにして抽出した画像ファイル名と、画像キーワード
を検索データベースの画像ファイル名項目、画像キーワ
ード項目に格納する。単語切りを行うときに本実施形態
では前後50文字としていたが、要求される検索の精度
に応じて、適宜文字数を変更することが可能である。同
様に抽出するキーワードの数も適宜変更することが可能
である。
【0021】続いて、キーワード付加部104による、
HTML文書ファイルからのキーワード抽出について図
5を参照して以下の通り説明する。先ほど行った画像フ
ァイル表示を表現する文字列周辺からのキーワード抽出
と異なり、今回はこのHTML文書をもとに画面表示を
行ったときに画面に現れる文字からキーワードを抽出す
ることになる。まず、ファイルを頭から読む(ステップ
51)。続いてHTML文書ファイルの単語切りを行う
(ステップ52)。単語切りを行った後、単語ごとの出
現頻度を調べる(ステップ53)。出現頻度の高い単語
から順に10個をHTML文書キーワードとし、HTM
L文書ファイル名と対応づけて検索データベース内のH
TML文書キーワード項目に格納する(ステップ5
4)。本実施形態では単語を10個だけHTML文書キ
ーワードとして抽出しているが、適宜個数を変更するこ
とも可能である。このようにして検索データベースを作
成する。図6は検索データベース格納例を示す図であ
る。これまで説明した方法で抽出したキーワードを図6
に示すように格納する。なお、この例においては、HT
ML文書ファイル中の単語の数が10個に満たない場合
を示している。
【0022】これらの方法でデータベースを作成すれ
ば、マルチメディア情報データを入力するだけで、装置
が自動的にキーワードを抽出するので、ユーザがキーワ
ードを入力する必要がない。また、画像マッチングなど
の複雑な処理をする必要が無いので、高速にデータベー
スを作成することができる。多量の情報を処理する場
合、特に便利である。
【0023】次に、このデータベースを用いて実際にユ
ーザが検索を行う方法を図7と、図8、図9、図10を
参照して以下の通り説明する。図7は検索実行のフロー
チャート図である。ユーザの検索キー入力を受けて、前
述した方法で作成したデータベースを用いて検索部10
5が文字列を用いた検索を行う(ステップ71)。検索
結果表示部106が検索結果を表示して(ステップ7
2)、終了する。図8はユーザが検索キーとして文字列
又は単語を入力する場合、出力装置107に表示される
検索用の画面の例である。まずユーザが検索キーとして
文字列又は単語を入力する。マウスで検索ボタンをクリ
ックしたり、リターンキーを押したりすることにより、
検索部105が検索を行う。
【0024】図9はユーザが検索キーとして画像情報を
選択して入力する場合、出力装置107に表示される検
索用の画面の例である。データベース内の画像ファイル
の画像を表示して、ユーザが画像をその中から選択する
ことにより、検索キーの入力が行われる。ユーザが選択
した画像ファイルはデータベース内にあったものなの
で、すでにキーワードが付加されている。検索はこの画
像ファイルに付加されたキーワードを用いて実行され
る。ユーザが画像ファイルを選ぶことにより、間接的に
キーワードを入力したことになる。本実施形態では一画
面につき画像を6種類表示している中から、ユーザは所
望のマルチメディア情報に関連のあると思われる画像情
報を選択する。マウスで検索ボタンをクリックしたり、
リターンキーを押したりすることにより、検索を行う。
検索部105は選択された画像情報に対応するキーワー
ドを外部記憶装置101内の検索データベースから読み
出し、検索はこのキーワードで行う。
【0025】画像の表示についてはデータベース中の画
像ファイルの画像を表示するが、データベース中の画像
ファイルの数が多すぎるような場合は、ダウンロードを
行った順に、新しいものから優先的に表示するようにも
できる。また、画像ファイルの中でも、ボタンやロゴマ
ークなどのファイルサイズも小さく、重要性の低いと考
えられる画像ファイルは表示しないようにすることがで
きる。
【0026】画面中の画像付近に、その画像ファイルに
付加されたキーワードを表示するようにすることもでき
る。このようにするとユーザは画像とその画像に付加さ
れたキーワードを見ることで、どのようなキーワードで
検索しているのかがわかるので、より精度の高い検索を
行うことが可能となる。
【0027】また、ユーザがダウンロードした画像情報
ファイルに、ダウンロードした段階で前述した方法でキ
ーワードを付加しておけば、ダウンロードした画像情報
ファイルをそのままペーストして検索キーとすることも
可能である。ユーザが思い付いたときに、すぐに画像情
報を検索キーとして用いることができるので、使い勝手
がよい。
【0028】検索結果の表示の例を図10に示す。検索
キーワードとして、「ニュース」と「ミカン」の二つの
単語を入力して検索を行った場合の結果を表示してい
る。左の方に表示される文は検索にヒットしたHTML
文書のタイトルを表示する。画像キーワードでヒットし
た画像ファイルは、ヒットした画像ファイルをそのまま
示してもよいし、ヒットした画像ファイルを含むHTM
L文書により表される画面を示してもよい。これらはユ
ーザの希望に応じて設定することも可能である。また、
HTML文書キーワードでヒットしたHTML文書ファ
イルについてはそのHTML文書により表される画面を
示せばよい。本発明の主旨を逸脱しない範囲においてユ
ーザインタフェースを適宜変更することが可能である。
このように、ユーザが入力した文字列又は単語に関連し
たマルチメディア情報、又は、ユーザが選択して入力し
た画像情報に関連したマルチメディア情報を得ることが
できる。
【0029】本願発明の実施形態では、検索対象として
画像情報ファイルを中心に説明したが、音声情報ファイ
ルについても、その音声情報ファイルを要素として含む
構造化文書から同様にキーワードを抽出してデータベー
スを作成したり、検索を行うことができる。また、画像
を選択入力して音声情報を検索することも同様に可能で
ある。例えば動物の写真を選択入力して、その動物に対
応した音声情報(鳴声など)を出力することや、作曲家
の肖像画を選択入力することで、その作曲家の作品を音
声情報として出力することや、風景や季節の画像を選択
入力することで、その風景や季節をイメージした音声情
報を出力する、といったことが可能である。
【0030】尚、本願発明の実施形態においては、構造
化文書の一つであるHTML文書を用いた方法を説明し
たが、HTML文書のバージョンが変わったり、他の種
類の構造化文書においても、同様の方法により検索を実
行することができる。
【0031】
【発明の効果】以上説明したように、この発明によれ
ば、画像情報や音声情報といったマルチメディア情報に
キーワードを付加して、データベースを作成し、検索を
行うことが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係わるコンピュータシス
テムのシステム構成を示すブロック図。
【図2】本発明の実施形態における、データベース作成
のフローチャート図。
【図3】マルチメディア情報データ格納例を示す図。
【図4】本発明の実施形態における、画像表示部分の解
析部を示すフローチャート図。
【図5】本発明の実施形態における、テキストファイル
キーワード自動付加部を示すフローチャート図。
【図6】検索データベース格納例を示す図。
【図7】本発明の実施形態における、検索のフローチャ
ート図。
【図8】文字による検索キー入力を行う、検索インタフ
ェースの例を示す図。
【図9】画像選択による検索キー入力を行う、検索イン
タフェースの例を示す図。
【図10】検索結果の表示例を示す図。
【図11】HTML文書の例を示す図。
【図12】HTML文書をブラウザで表示した例を示す
図。
【符号の説明】
101…外部記憶装置、102…入力装置、103…制
御装置、104…キーワード付加部、105…検索部、
106…検索結果表示部、107…出力装置、108…
通信装置、109…時計装置

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 構造化文書で表された画像情報や音声情
    報といったマルチメディア情報を入力し、解析するステ
    ップと、 前記マルチメディア情報にキーワードを付加するステッ
    プと、 前記キーワードをデータベースに格納するステップとを
    具備したことを特徴とするデータベース作成方法。
  2. 【請求項2】 前記マルチメディア情報にキーワードを
    付加するステップは、キーワードとして前記構造化文書
    から単語を抽出し、この抽出は単語の出現頻度の高い順
    に行われることを特徴とする請求項1記載のデータベー
    ス作成方法。
  3. 【請求項3】 前記マルチメディア情報にキーワードを
    付加するステップは、キーワードとして前記構造化文書
    から単語を抽出し、この抽出は、前記構造化文書中のマ
    ルチメディア情報を示す文字列に近い位置にある単語か
    ら順に抽出されることを特徴とする請求項1記載のデー
    タベース作成方法。
  4. 【請求項4】 前記単語の抽出において、この抽出は、
    前記構造化文書中のマルチメディア情報を示す文字列の
    前後に、所定の文字数だけ抽出範囲を定めて、行われる
    ことを特徴とする請求項2乃至3記載のデータベース作
    成方法。
  5. 【請求項5】 前記単語の抽出において、所定の数だけ
    単語が抽出できない場合、前記抽出範囲を広げて抽出を
    行うことを特徴とする請求項4記載のデータベース作成
    方法。
  6. 【請求項6】 前記マルチメディア情報にキーワードを
    付加するステップは、前記構造化文書中の「ALT=」
    から始まる文字列を抽出し、その後に続く「"」に囲ま
    れた文字列をキーワードとして抽出するステップを具備
    することを特徴とする請求項1記載のデータベース作成
    方法。
  7. 【請求項7】 前記マルチメディア情報にキーワードを
    付加するステップは、前記構造化文書にキーワードを付
    加するステップを具備することを特徴とする請求項1記
    載のデータベース作成方法。
  8. 【請求項8】 構造化文書で表された画像情報や音声情
    報といったマルチメディア情報を入力し、解析するステ
    ップと、 前記マルチメディア情報にキーワードを付加するステッ
    プと、 前記キーワードをデータベースに格納するステップと、 検索キーを入力するステップと、 前記検索キーに対応する文字列と前記データベース内に
    格納されたキーワードを用いて前記マルチメディア情報
    を検索するステップとを具備したことを特徴とする情報
    検索方法。
  9. 【請求項9】 前記検索キーの入力は、文字列又は単語
    を入力することを特徴とする請求項8記載の情報検索方
    法。
  10. 【請求項10】 前記検索キーの入力は、画像情報を入
    力することを特徴とする請求項8記載の情報検索方法。
  11. 【請求項11】 前記検索キーの入力で、画像情報を検
    索キーとして入力する場合、その画像情報から文字列又
    は単語を抽出し、又は予めその画像情報から文字列又は
    単語を抽出し、抽出された文字列又は単語を検索キーと
    して検索を行うことを特徴とする請求項10記載の情報
    検索方法。
  12. 【請求項12】 前記検索キーの入力で、画像情報を検
    索キーとして入力する場合、その画像情報を含む構造化
    文書から文字列又は単語を抽出し、文字列又は単語を検
    索キーとして検索を行うことを特徴とする請求項10記
    載の情報検索方法。
  13. 【請求項13】 構造化文書で表された画像情報や音声
    情報といったマルチメディア情報を入力し、解析するス
    テップと、 前記マルチメディア情報にキーワードを付加するステッ
    プと、 前記キーワードをデータベースに格納するステップとを
    コンピュータに実行させるプログラムを記憶した記憶媒
    体。
  14. 【請求項14】 検索データベースを作成する手段と、 前記検索データベースと、構造化文書の形で画像情報や
    音声情報といったマルチメディア情報を記憶する記憶手
    段とを具備し、 前記検索データベースを作成する手段は、前記マルチメ
    ディア情報を含む構造化文書から文字列又は単語を抽出
    してデータベースを作成することを特徴とするデータベ
    ース作成装置。
  15. 【請求項15】 前記データベースを作成する手段は、
    前記構造化文書から単語を抽出し、この抽出は単語の出
    現頻度の高い順に単語を抽出することを特徴とする請求
    項14記載のデータベース作成装置。
  16. 【請求項16】 前記データベースを作成する手段は、
    前記構造化文書から単語を抽出し、この抽出は前記構造
    化文書中のマルチメディア情報を示す文字列に近い位置
    にある単語から順に抽出することを特徴とする請求項1
    4記載のデータベース作成装置。
  17. 【請求項17】 前記単語の抽出において、この抽出
    は、前記構造化文書中のマルチメディア情報を示す文字
    列の、前後所定の文字数だけ抽出範囲を定めて、行われ
    ることを特徴とする請求項15乃至16記載のデータベ
    ース作成装置。
  18. 【請求項18】 前記単語の抽出において、所定の数だ
    け単語が抽出できない場合、前記抽出範囲を広げて抽出
    を行うことを特徴とする請求項17記載のデータベース
    作成装置。
  19. 【請求項19】 前記データベースの作成手段は、前記
    構造化文書中の「ALT=」から始まる文字列を抽出
    し、その後に続く「" 」に囲まれた文字列をキーワード
    として抽出するステップを具備することを特徴とする請
    求項14記載のデータベース作成装置。
  20. 【請求項20】 前記データベースの作成手段は、前記
    構造化文書にキーワードを付加するステップを具備する
    ことを特徴とする請求項14記載のデータベース作成装
    置。
  21. 【請求項21】 検索データベースを作成する手段と、 前記検索データベースと、構造化文書の形で画像情報や
    音声情報といったマルチメディア情報を記憶する記憶手
    段と、 検索キーを入力する入力手段と、 検索キーに対応する文字列とデータベース内のキーワー
    ドとの間で検索を行う制御手段と、 検索結果を出力する出力手段とを具備し、 前記検索データベースを作成する手段は、前記マルチメ
    ディア情報を含む構造化文書から文字列又は単語を抽出
    してデータベースを作成することを特徴とするたことを
    特徴とする情報検索装置。
  22. 【請求項22】 前記検索キーの入力で、画像情報を検
    索キーとして入力する場合、その画像情報から文字列又
    は単語を抽出し、又は予めその画像情報から文字列又は
    単語を抽出し、抽出された文字列又は単語を検索キーと
    して検索を行うことを特徴とする請求項21記載の情報
    検索装置。
  23. 【請求項23】 前記検索キーの入力で、画像情報を検
    索キーとして入力する場合、その画像情報を含む構造化
    文書から文字列又は単語を抽出し、文字列又は単語を検
    索キーとして検索を行うことを特徴とする請求項21記
    載の情報検索装置。
JP10094261A 1998-04-07 1998-04-07 データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置 Pending JPH11296525A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10094261A JPH11296525A (ja) 1998-04-07 1998-04-07 データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10094261A JPH11296525A (ja) 1998-04-07 1998-04-07 データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置

Publications (1)

Publication Number Publication Date
JPH11296525A true JPH11296525A (ja) 1999-10-29

Family

ID=14105351

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10094261A Pending JPH11296525A (ja) 1998-04-07 1998-04-07 データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置

Country Status (1)

Country Link
JP (1) JPH11296525A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005108013A (ja) * 2003-09-30 2005-04-21 Ricoh Co Ltd 情報提供方法及び情報提供プログラム
WO2010077457A1 (en) * 2008-12-08 2010-07-08 Motorola, Inc. Method and apparatus for generating a multimedia-based query
JP5549224B2 (ja) * 2007-10-29 2014-07-16 日本電気株式会社 携帯端末、携帯端末システム、携帯端末の制御方法、プログラム、及び記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005108013A (ja) * 2003-09-30 2005-04-21 Ricoh Co Ltd 情報提供方法及び情報提供プログラム
JP5549224B2 (ja) * 2007-10-29 2014-07-16 日本電気株式会社 携帯端末、携帯端末システム、携帯端末の制御方法、プログラム、及び記録媒体
WO2010077457A1 (en) * 2008-12-08 2010-07-08 Motorola, Inc. Method and apparatus for generating a multimedia-based query

Similar Documents

Publication Publication Date Title
US6697838B1 (en) Method and system for annotating information resources in connection with browsing, in both connected and disconnected states
US9135341B2 (en) Method and arrangement for paginating and previewing XHTML/HTML formatted information content
JP3703080B2 (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
US8204950B2 (en) Webpage search
US20010049700A1 (en) Information processing apparatus, information processing method and storage medium
US7240281B2 (en) System, method and program for printing an electronic document
JP2000029906A (ja) 文書情報管理システム
JP4094777B2 (ja) 画像通信システム
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
JP3143345B2 (ja) 文字列検索装置
JP4745726B2 (ja) ファイル管理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2003281093A (ja) ブラウザにおけるリンク先情報の閲覧方法及び装置
JP4469432B2 (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3186960B2 (ja) 情報検索方法およびその装置
JPH1145261A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11296525A (ja) データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JP2005128955A (ja) 情報処理方法および記憶媒体、プログラム
JP3237619B2 (ja) 文書表示装置および文書表示方法並びに文書表示プログラムを記録した記録媒体
JP2000231569A (ja) インターネット情報検索装置、インターネット情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3734101B2 (ja) ハイパーメディア構築支援装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050414

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606