JP3880235B2 - 情報検索装置及びその方法、及びそのプログラムを記憶した記憶媒体 - Google Patents
情報検索装置及びその方法、及びそのプログラムを記憶した記憶媒体 Download PDFInfo
- Publication number
- JP3880235B2 JP3880235B2 JP02167199A JP2167199A JP3880235B2 JP 3880235 B2 JP3880235 B2 JP 3880235B2 JP 02167199 A JP02167199 A JP 02167199A JP 2167199 A JP2167199 A JP 2167199A JP 3880235 B2 JP3880235 B2 JP 3880235B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- output
- information
- matching
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、入力された検索条件に基づいて、データベースから情報を検索する情報検索装置及びその方法、ならびにそのプログラムを記憶した記憶媒体に関するものである。
【0002】
【従来の技術】
近年、インターネットが普及するに連れて、テキスト、画像、音声などの様々なメディアデータが、ネット上で流通しやすい形にデジタル化されてインターネット上に公開されている。これらのメディアデータは現在もなお増え続ける一方である。
【0003】
このような状況において、膨大なメディアデータの中から必要なデータを検索するメディア検索技術は、ますます重要視されており、より使いやすいインターフェースを持つメディア検索システムが登場している。
【0004】
例えば、自然言語を入力とする画像検索システムがある。
【0005】
このシステムは、画像データベースにおいて、各画像データとその内容を示す言語情報とを一対―に対応付けて格納しておき、ユーザが日常使っている自然言語を用いて簡単な質問文を入力すると、この質問文を言語解析して、画像データベース中の言語情報とマッチングをとることによって、ユーザが探している画像データを自然なインターフェースで検索しようというものである。
【0006】
このような画像検索システムでは、検索結果として得られた複数の画像をディスプレイ上に縦横に均一に並べて出力するのが一般的である。
【0007】
【発明が解決しようとする課題】
しかしながら、上記のようなメディア検索システムでは、得られた複数のメディアを均一に並べて出力してしまうために、各メディアに対応づけられた言語情報と質問文とのマッチングの度合が分かりづらいという問題があった。
【0008】
本発明は上述した課題を解決するためになされたものであり、各メディアに対する言語情報と質問文とのマッチングの度合が直感的に分かるようにメディアを出力することが可能なメディア検索システムを提供することを目的とする。
【0009】
【課題を解決するための手段】
上述した目的を達成するための一手段として、本発明によれば、情報検索装置に、検索対象情報を格納したデータベースと、検索条件を入力する入力手段と、前記検索条件と前記データベースの各検索対象情報との一致の度合を計算する計算手段と、一致の度合が所定値以上である検索対象情報の各々に対する検索結果につき、それぞれの一致の度合に応じて検索結果を出力する出力サイズと出力領域の中心からの距離とを決定する決定手段と、前記一致の度合に応じて前記決定手段で決定した出力サイズと出力領域の中心からの距離とで検索結果を第1の出力位置に出力すると検索結果同士の重なりが生じる場合に、検索結果同士の重なりがより少なくなる第2の出力位置を探索する探索手段と、前記各検索結果を前記決定した出力サイズで、検索結果同士の重なりが生じない場合には前記第1の出力位置に、検索結果同士の重なりが生じる場合にはそれぞれの前記探索した第2の出力位置に、出力する出力手段とを備える。
【0010】
また、本発明の他の態様によれば、情報検索方法に、検索条件を入力する入力工程と、前記検索条件と検索対象情報を格納したデータベースの各検索対象情報との一致の度合を計算する計算工程と、一致の度合が所定値以上である検索対象情報の各々に対する検索結果につき、それぞれの一致の度合に応じて検索結果を出力する出力サイズと出力領域の中心からの距離とを決定する決定工程と、前記一致の度合に応じて前記決定工程で決定した出力サイズと出力領域の中心からの距離とで検索結果を第1の出力位置に出力すると検索結果同士の重なりが生じる場合に、検索結果同士の重なりがより少なくなる第2の出力位置を探索する探索工程と、前記各検索結果を前記決定した出力サイズで、検索結果同士の重なりが生じない場合には前記第1の出力位置に、検索結果同士の重なりが生じる場合にはそれぞれの前記探索した第2の出力位置に、出力する出力工程とを備える。
【0011】
更に、本発明の他の態様によれば、記憶媒体に、検索条件を入力する入力工程と、前記検索条件と検索対象情報を格納したデータベースの各検索対象情報との一致の度合を計算する計算工程と、一致の度合が所定値以上である検索対象情報の各々に対する検索結果につき、それぞれの一致の度合に応じて検索結果を出力する出力サイズと出力領域の中心からの距離とを決定する決定工程と、前記一致の度合に応じて前記決定工程で決定した出力サイズと出力領域の中心からの距離とで検索結果を第1の出力位置に出力すると検索結果同士の重なりが生じる場合に、検索結果同士の重なりがより少なくなる第2の出力位置を探索する探索工程と、前記各検索結果を前記決定した出力サイズで、検索結果同士の重なりが生じない場合には前記第1の出力位置に、検索結果同士の重なりが生じる場合にはそれぞれの前記探索した第2の出力位置に、出力する出力工程とをコンピュータに実行させるための情報検索プログラムを記憶する。
【0012】
【発明の実施の形態】
<第1の実施形態>
以下、図面を用いて本発明の1実施形態を詳細に説明する。
【0013】
図1は、本実施形態に係る情報検索装置のシステムブロック図である。
【0014】
図示の構成において、CPUは、マイクロプロセッサであり、メディア検索処理のための演算、論理判断等を行ない、PCIバスPCIを介して、バスに接続された各構成要素を制御する。
【0015】
PCIバスPCIはマイクロプロセッサCPUの制御の対象とする構成要素を指示するアドレス信号を転送し、マイクロプロセッサCPUの制御の対象とする各構成要素のコントロール信号を転送し、各構成機器相互間のデータ転送を行なう。
【0016】
次にROMは、読出し専用の固定メモリである。ROMには本実施形態の構成例における基本1/Oプログラムが格納される。
【0017】
また、RAMは、書込み可能のランダムアクセスメモリであって、各構成要素からの各種データの一時記憶と、本実施形態における各種処理が記述されたプログラムを読み込み、このプログラムに基づいてCPUが各種処理を行うために用いられる。
【0018】
CDDはCD−ROMドライブである。CD−ROMに記録されているプログラムやデータはこのCD−ROMドライブを通じて本システムにロードされる。
【0019】
INPUTCは入カコントローラーである。KBやPDから送られてくる入力信号はこのコントローラによって適宜変換された後、PCIバスPCIを経由してCPUに送信される。
【0020】
KBはキーボードであって、アルファベットキー、ひらがなキー、力夕カナキー等の文字記号入カキー、及び、カーソル移動を指示するカーソル移動キー等のような各種のファンクションキーを備えている。
【0021】
PDはマウスやトラックボールなどのポインティングデバイスであり、表示画面上のカーソルやボタンなどを指摘するために使用される。
【0022】
DISKはデータやプログラム等を記憶するための外部メモリである。デ―夕やプログラム等は必要に応じて保管され、また、保管されたデータやプログラムはキーボードの指示により、必要な時に呼び出される。本実施形態におけるメディアデータベースは主にこのDISK上に実装される。
【0023】
VIDEOはビデオコントローラである。PCIバスPCIを介して表示用のデータがここに蓄えられるとともに、表示用の信号に変換されて表示装置DISPに出力される。
【0024】
DISPは表示装置であり、陰極線官や液晶などが用いられ、各種処理の結果や装置の状態、ユーザに対するメッセージなどを表示する。
【0025】
DEVCはデバイスコントローラである。PCIバスPCIを介して伝達されるCPUの指示によって、このコントローラに接続されている機器を制御し、また、接続されている機器が出力する信号やデータをPCIバスPCIを介してCPUやDISKに適宣伝達する。
【0026】
SCANはスキャナーである。DEVCからの指示によって、ここにセットされた原稿を光学的な方法でスキャンし、原稿画像を読み取り、DEVCに出力する。
【0027】
NIはネットワークインターフェースであり、本実施形態のメディア検索システムをLANやインターネットなどを経由して外部のシステムと接続するための機器である。本実施形態のメディア検索システムは、この接続を経由して、信号やデータを外部のシステムと送受信することが可能である。
【0028】
MIXはミキサーである。PCIバスPCIを介して音声出力用のデータがここに送られると、MIXはこれらの信号を合成しかつ音声出力用の信号に変換してスピーカーSPKに出力する。
【0029】
SPKはスピーカーであり、処理結果や装置の状態、ユーザに対するメッセージ、音楽などを音声で出力する。
【0030】
かかる各構成要素からなる本実施形態のメディア検索装置においては、キーボードKBやポインティングデバイスPDからの各種の入力に応じて作動するものであって、キーボードKBやポインティングデバイスPDからの入力が供給されると、入カコントローラINPUTCを経由して、インタラプト信号がマイクロプロセッサCPUに送られ、そのマイクロプロセッサCPUがROM内に記憶してある各種の制御信号を読出し、それらの制御信号に従つて、各種の制御が行なわれる。
【0031】
本実施形態のシステムは、基本I/Oプログラム、OS,および本文字認識処理プログラムをCPUが実行することによって動作する。基本I/OプログラムはROM中に書き込まれており、OSはDISKに書き込まれている。そして、本システムの電源がONにされると、基本I/Oプログラム中のIPL(イニシャルプログラムローディング)機能によりDISKからOSがRAMに読み込まれ、OSの動作が開始される。
【0032】
本メディア検索処理プログラムは、図8〜図12のフローチャートに示される各処理手順に対応するプログラムコードを含むものである。
【0033】
図2は、本メディア検索処理プログラムおよび関連データをCD−ROMに記録したときのCD−ROMの内容の構成図である。
【0034】
本実施形態において、本メディア検索処理プログラムおよび関連データはCD−ROMに記録されている。図2に示したようにCD−ROMの先頭領域には、このCD−ROMのボリューム情報とディレクトリ情報が記録されており、その後にこのCD−ROMのコンテンツである本メディア検索処理プログラムと、メディア検索処理関連データが記録されている。
【0035】
図3は、本システムと本メディア検索処理プログラムが記録されたCD−ROMの模式図である。CD−ROMに記録されたメディア検索処理プログラムおよび関連データは、図3に示したようにCD−ROMドライブCDDを通じて本システムにロードすることができる。このCD−ROMをCD−ROMドライブCDDにセットすると、OS及び基本I/Oプログラムの制御のもとに本メディア検索処理プログラムおよび関連データがCD−ROMから読み出され、RAMにロードされて動作可能となる。
【0036】
図4は、本メディア検索処理プログラムがRAMにロードされ実行可能となった状態のメモリマップを示す。
【0037】
このとき、RAMのワークエリアには、マッチング結果バッファRBUF、結果出力数COUNT、メディア表示データVDATA、表示基準サイズVBASEが存在している。
【0038】
図5は、本実施形態におけるマッチング結果バッファRBUFの構成例を説明した図である。
【0039】
本実施形態におけるマッチング結果バッファRBUFには、言語マッチング探索処理において探索されたデータのうち、マッチングの度合が高いデータから順に結果出力数COUNTの数だけ格納される。図5は、結果出力数COUNT=10の場合のマッチング結果バッファRBUFの構成例である。
【0040】
図5に示したように、一つのマッチング結果データは、順位と、マッチングの度合と、メディアIDとによって構成される。このうち、順位とは、マッチング結果バッファRBUFに格納されたデ―夕の中におけるマッチングの度合が大きい順番である。また、マッチングの度合とは、各メディアデータに対応付けられた言語情報とクエリの解析結果とのマッチングを取ったときの度合であり、ここではパーセントで格納される。また、データIDとは、本実施形態のメディアデータベースに格納されているデータのIDであり、このIDを利用して実際のメディアデータや、対応する言語情報などを読み出すことが可能である。
【0041】
図6は、本実施形態におけるメディア表示データVDATAの構成例を説明した図である。
【0042】
本実施形態におけるメディア表示データVDATAには、表示装置DSPのメディア表示部に表示済みのメディアデータに関して、データIDと表示座標と表示サイズとが格納される。ここで、表示座標は、本実施形態におけるメディア表示部の縦横の中心を原点として、横にX轍、縦にY軸をとり、X軸は右、Y軸は上を正方向とみなす座標系における座標であり、単位はドットである。また、表示サイズの単位もドットであり、図6中ではX軸方向の長さ×Y軸方向の長さという形式で表現している。メディア表示データVDATAは、後述するように、メディア表示時にできるだけメディア同士の重なりをなくすために使用される。
【0043】
図7は、本実施形態におけるメディアデータベースに格納されている一つのデータ構造の構成例を説明した図である。
【0044】
図示したように、本実施形態におけるメディアデータベース中のデータは、データID、メディアポインタ、言語情報によって構成される。ここで、デ―夕IDとはこのデータ構造そのもののインデックス番号である。また、メディアポインタは実際のメディアデータを指すポインタであり、このポインタを利用することにより実際のメディアデータにアクセスすることができる。また、言語情報は、メディアデータの内容を示す言語情報であり、本実施形態においては後述する言語マッチング処理において利用しやすい形式で格納される。このようなデータ構造を取ることによって、実際のメディアデータにアクセスすることなく検索を高速に行うことが可能となる。
【0045】
上述したメディア検索プログラムの動作をフローチャートに従って説明する。
【0046】
図8は、本実施形態におけるメディア探索プログラム全体のフローチャートである。
【0047】
ステップS1は、メディアを探索するためのクエリ(質問文)をユーザに入力してもらうクエリ入力処理である。クエリは、ユーザが探しているメディアの内容を表現する簡単な文であり、例えば、「赤いスポーツカー」のように入力する。このような処理は一般の検索処理においては公知であるので、ここでは詳細な説明は行わない。処理を終えると、ステップS2に進む。
【0048】
ステップS2は、ステップS1で入力されたクエリを言語解析するクエリ解析処理である。この処理では、ステップS1で入力されたクエリに、形態素解析、構文解析、意味解析等の言語処理を行い、後の処理で利用しやすい形式である言語情報に変換する。このような処理は一般の言語処理において公知であり、ここでは詳細な説明は行わない。処理を終えると、ステップS3に進む。
【0049】
ステップS3は、ステップS2において得られたクエリの言語情報と、メディアデータベース中の言語情報とのマッチングを行って、ユーザが探しているメディアを検索する言語マッチング処理である。この処理の結果として、マッチング結果バッファRBUFには、データベース中のデータの中で、マッチングの度合が上位のものから順に、結果出力数COUNTの数だけマッチング結果データが格納される。このような処理は一般のデータベース検索処理において公知であり、ここでは詳細な説明は行わない。言語マッチング処理を終えるとステップS4に進む。
【0050】
ステップS4は、ステップS3によって出力されたマッチング結果バッファRBUF中のマッチング結果データに基づいて、検索結果としてディスプレイにメディアを出力する結果表示処理である。この処理は図9を用いて後述する。処理を終えると、ステップS1に進む。
【0051】
図9は、本実施形態におけるステップS4の結果表示処理の詳細手順を示すフローチャートである。
【0052】
まず、ステップS11では、マッチング結果バッファRBUFに格納されているマッチング結果のうち、最も低いマッチングの度合から表示部上の表示距離のゲージを決定する処理である。本実施形態においては、表示座標の原点は表示部の縦横の中心にあるので、表示部の縦横どちらかである長辺を二分したドット数に、100から最も低いマッチングの度合−10までのゲージを割り当てるように決定する。ここで、最も低いマッチングの度合を−10とするのは、実際に最も低いマッチングの度合を持つデータのメディアを表示するためのスペースを確保するためである。処理を終えると、ステップS12に進む。
【0053】
次に、ステップS12では、マッチング結果バッファRBUFに格納されているマッチング結果を一つ選択する。本実施形態では結果データの選択はマッチング結果バッファRBUFの先頭から順次行われる。このような処理は公知であるので、ここでは詳細な説明は行わない。この処理を終えると、ステップS13へ進む。
【0054】
次に、ステップS13では、ステップS12で選択された結果データが存在するかどうかチェックする。結果データがもう存在しない場合は、結果表示処理を終える。存在する場合は、ステップS14へ進む。
【0055】
ステップS14は、選択された結果データに基づいてメディアをディスプレイに表示するメディア表示処理である。この処理は図10を用いて後述する。処理を終えると、ステップS12に進む。
【0056】
図10は、本実施形態におけるステップS14のメディア表示処理の詳細手順を示すフローチャートである。
【0057】
ステップS21は、選択した結果データのメディアポインタを利用してデータベースからRAM上にメディアデータの実体を読み込むメディアデータ読込み処理である。処理を終えると、ステップS22へ進む。
【0058】
ステップS22は、基準表示サイズVBASEと、結果データのマッチング度合から、ステップS21で読み込んだメディアデータのディスプレイ上の表示サイズを算出する表示サイズ算出処理である。この処理の詳細は、図11を用いて後述する。処理を終えるとステップS23へ進む。
【0059】
ステップS23は、ステップS22で求めた表示サイズと、メディア表示データVDATAの内容からこのメディアの表示座標を求める表示座標算出処理である。この処理の詳細は、図12を用いて後述する。処理を終えるとステップS24へ進む。
【0060】
ステップS24は、ステップS22で求めた表示サイズでステップS23で求めた表示座標にメディアデータを表示する表示処理である。この処理は公知であり、一般的な表示システムで通常行われているのでここでは詳細な説明はしない。処理を終えるとステップS25へ進む。
【0061】
ステップS25は、ステップS22で求めた表示サイズと、ステップS23で求めた表示座標をメディア表示データVDATAに格納する表示データ格納処理である。処理を終えると、メディア表示処理を終了する。
【0062】
図11は、本実施形態におけるステップS22の表示サイズ算出処理の詳細手順を示すフローチャートである。
【0063】
ステップS31は、表示基準サイズVBASEに表示するメディアデータの言語マッチングの度合との積を求める処理である。なお、表示基準サイズVBASEは画素数(ドット)で予め適宜設定されている。マッチング結果バッファRBUFに格納されているマッチングの度合はパーセントであるので、実際の計算は、VBASE×マッチングの度合/100となり、この値はこのメディアデータを表示する時の長辺のドットサイズとなる。例えば、表示基準サイズVBASEが400に設定されている場合、図5のマッチング結果バッファRBUFの順位1のデータは、マッチングの度合が80であるので、400×80/100=320となる。処理を終えると、ステップS32に進む。
【0064】
ステップS32は、表示するメディアデータの元のサイズを読み出すメディア元サイズ読み出し処理である。処理を終えるとステップS33に進む。
【0065】
ステップS33は、ステップS32で読み出した表示するメディアデータの元サイズの長辺を用いて、表示時の縮尺比を計算する処理である。この計算は、縮尺比=(ステップS31で求めたドット数/元サイズの長辺のドット数)となる。例えば前述の例の場合、メディアデータの長辺の元サイズが640であるとすると、320/640=0.5というように計算される。処理を終えると、ステップS34に進む。
【0066】
ステップS34は、ステップS33で計算された縮尺比によって、表示するメディアデータの縦横を等倍で縮尺して、表示用のデータを作成する処理である。このような処理は画像処理において公知であり、一般的に広く用いられているのでここでは詳細な説明は行わない。処理を終えると、表示サイズ算出処理を終了する。
【0067】
図12は、本実施形態におけるステップS23の表示座標算出処理の詳細手順を示すフローチャートである。
【0068】
ステップS41は、ステップS11で決定されたゲージより表示座標系の原点からこのデータの表示座標までの距離(ドット数)を求める表示距離算出処理である。処理を終えると、ステップS42に進む。
【0069】
ステップS42は、座標系原点を中心とし、ステップS41で求められた表示距離を半径に持つ円上の点の座標を算出する表示座標円計算処理である。この処理は公知であり、一般的な描画処理において普通に用いられているのでここでは詳細な説明は行わない。処理を終えると、ステップS43へ進む。
【0070】
ステップS43は、ステップS42で求めた表示座標円を数等分して、その分割点をサンプル点として抽出する処理である。本実施形態においては、ステップS42で求めた座標円を8もしくは12等分して、その分割点となる8個ないし12個の点をサンプル点として抽出する。処理を終えると、表示座標算出処理を終了する。
【0071】
ステップS44は、表示データVDATAを参照しながら、ステップS48で抽出されたサンプル点全てに対して、仮にこれらの点を表示座標としてメディアを表示した場合に、既に表示済みのメディアデータとどのくらい重なりが生じるかを計算する重なり計算処理である。この処理では、全てのサンプル点に対して重なり計算をした結果、最も重なりの少ないサンプル点を仮の表示座標に決定する。処理を終えると、ステップS45へ進む。
【0072】
ステップS45は、ステップS44で決定された仮の表示座標を選択した場合、他のメディアデータと重なりがあるかどうかをチェックする。重なりが生じる場合は、ステップS46へ進む。重なりが生じない場合は、ステップS47へ進む。
【0073】
ステップS46は、ステップS42で計算された表示座標円周上の点のうち、ステップS44で決定された仮座標の近傍に対して、表示済みのメディアデータとの重なりが最も少なくなる点を探索する仮座標近傍探索処理である。処理を終えると、ステップS47へ進む。
【0074】
ステップS47は、ステップS44、もしくはステップS46で決定された座標を表示座標として決定する処理である。処理を終えると、表示座標算出処理を終了する。
【0075】
図13は、本実施形態における検索結果表示部のイメージである。
【0076】
同図において、130は検索結果表示部、131〜135が各メディアデータである。図示したように、本実施形態の検索結果表示部130では、マッチングの度合が大きなデータが大きく、かつ、表示部130の中心136の近くに表示されるため、ユーザにマッチングの度合を直接視覚的に把握させることが可能である。更に、データ表示領域の重なりがなるべく少なくなるように表示されるので、各探索結果が見易い。
【0077】
以上説明したように、本実施形態においては、言語マッチングの度合を直接メディアの大きさや表示部中心からの距離に換算して出力することで、マッチングの度合を直接視覚的に把握することが可能となり、なるべく重ならないように配置することで見やすくしている。よって、従来のインターフェースよりもより直感的で分かりやすいインターフェースを実現することができる。
【0078】
〔他の実施形態〕
なお、本実施形態は上述した実施形態に限定されるものではない。
【0079】
上述の実施形態では、表示処理においてマッチングの度合を各メディアデータの表示の大きさと中心からの距離の双方に反映させているが、これらのいずれか一方に反映させるだけでも、マッチングの度合を直感的に把握できるようになる。
【0080】
また、上述の実施形態では、メディアデータが画像の場合について説明したが、その画像は静止画でも動画でもよく、テキストであってもよいことは明らかである。テキストの場合は、テキスト画像の表示サイズに代えてフォントサイズによってマッチングの度合を表わすようにしてもよい。更に、音声など目に見える形式で出力できないメディアの場合は、そのメディアを表わすアイコンなどのシンボルを定義することによって、画像の場合と同様の処理が可能である。また、マッチングの度合によって直接スピーカーSPKに出力される音声信号の大きさを変更しても同様の効果を得ることができる。
【0081】
また、上述の実施形態では、質問文と各メディアデータに対応する言語情報とにおけるマッチングの度合を反映させたが、画像や音声のパターンマッチングによる検索におけるマッチングの度合や、文書検索におけるキーワードの含有数など、他の検索条件におけるマッチングの度合をあらわすようにしてもよい。
【0082】
また、上述の実施形態では、言語情報はメディアデータと別個に与えられているが、検索するメディアがテキストや音声の場合は、これらのデータそのものを言語情報として直接アクセスして検索することも可能である。
【0083】
また、上述の実施形態では、メディア検索装置のバスとしてPCIバスを採用しているが、ISAバスやVLバスなどでもまったく同様なメディア検索装置を構成することが可能である。
【0084】
また、上述の実施形態では、OSはDISKに格納されているが、OSをROMに格納しても同様な処理を行うことが可能である。
【0085】
また、上述の実施形態では、CD−ROMからメディア検索処理プログラムおよび関連データを直接RAMにロードして実行させる例を示したが、このほかにCD−ROMからメディア検索処理プログラムおよび関連データをー旦DISKに格納(インストール)しておき、本メディア検索処理プログラムを動作させるときにDISKからRAMにロードするようにすることも可能である。
【0086】
また、上述の実施形態では、本メディア検索処理プログラムを記録する媒体としてCD−ROMを用いているが、それ以外にDVD,MO,FD,ICメモリカード、光磁気カードなどを用いても良い。更にメディア検索処理プログラムをROMに記録しておき、これをメモリマップの一部となすように構成し、直接CPUで実行することも可能である。
【0087】
尚、本発明は、単一の機器からなる装置に適用しても、複数の機器から構成されるシステムに適用してもよい。また、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記憶した記憶媒体を、装置あるいはシステムに供給し、装置あるいはシステム内のコンピュータが記憶媒体に格納されたプログラムコードを読み出して実行することによって達成してもよい。
【0088】
更に、装置あるいはシステム内のコンピュータが記憶媒体に格納されたプログラムコードを読み出して実行することによって、上述した実施形態の機能を直接実現するばかりでなく、そのプログラムコードの指示に基づいて、コンピュータ上で稼動しているOSなどの処理により、上述の機能を実現される場合も含まれる。
【0089】
これらの場合、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0090】
その他、本発明はその要旨を逸脱しない範囲で種々変形して実施することができる。
【0091】
【発明の効果】
以上説明したように、本発明によれば、各検索結果をそれぞれのマッチングの度合に応じた出力特徴量に基づいて出力する事により、ユーザがマッチングの度合を直感的に把握できるという効果がある。
【0092】
また、出力が表示による場合、各検索結果の重なりが少なくなるように配置することで、見やすくなるという効果がある。
【図面の簡単な説明】
【図1】本発明に係る一実施形態の情報検索システムの構成を示すブロック図である。
【図2】 CD−ROMの内容の構成例を表わす図である。
【図3】メディア検索装置とそのプログラム媒体の模式図である。
【図4】プログラム実行中のRAMのメモリマップを示す図である。
【図5】マッチング結果バッファRBUFの構成例を示す図である。
【図6】表示データVDATAの構成例を示す図である。
【図7】メディアデータベース中の1データの構成例を示す図である。
【図8】メディア検索処理の手順を示すフローチャートである。
【図9】結果表示処理の手順を示すフローチャートである。
【図10】メディア表示処理の手順を示すフローチャートである。
【図11】表示サイズ算出処理の手順を示すフローチャートである。
【図12】表示座標算出処理の手順を示すフローチャートである。
【図13】メディア検索結果表示部のイメージを示す図である。
Claims (13)
- 検索対象情報を格納したデータベースと、
検索条件を入力する入力手段と、
前記検索条件と前記データベースの各検索対象情報との一致の度合を計算する計算手段と、
一致の度合が所定値以上である検索対象情報の各々に対する検索結果につき、それぞれの一致の度合に応じて検索結果を出力する出力サイズと出力領域の中心からの距離とを決定する決定手段と、
前記一致の度合に応じて前記決定手段で決定した出力サイズと出力領域の中心からの距離とで検索結果を第1の出力位置に出力すると検索結果同士の重なりが生じる場合に、検索結果同士の重なりがより少なくなる第2の出力位置を探索する探索手段と、
前記各検索結果を前記決定した出力サイズで、検索結果同士の重なりが生じない場合には前記第1の出力位置に、検索結果同士の重なりが生じる場合にはそれぞれの前記探索した第2の出力位置に、出力する出力手段とを有することを特徴とする情報検索装置。 - 前記データベースが、前記検索対象情報のそれぞれと対応づけて言語情報を格納しており、
前記入力手段は前記検索条件を自然言語により入力する手段であり、
前記計算手段は、自然言語により入力された前記検索条件を言語解析して、当該言語解析の結果と各検索対象情報に対応づけられている言語情報との言語的な一致度を計算することを特徴とする請求項1に記載の情報検索装置。 - 前記決定手段は、一致の度合の高い検索結果ほど大きな出力サイズに決定することを特徴とする請求項1に記載の情報検索装置。
- 前記検索結果は画像であり、前記出力サイズは画像サイズであることを特徴とする請求項3に記載の情報検索装置。
- 前記検索結果はテキストであり、前記出力サイズは文字サイズであることを特徴とする請求項3に記載の情報検索装置。
- 前記検索結果は音声であり、前記出力サイズは音量であることを特徴とする請求項3に記載の情報検索装置。
- 検索条件を入力する入力工程と、
前記検索条件と検索対象情報を格納したデータベースの各検索対象情報との一致の度合を計算する計算工程と、
一致の度合が所定値以上である検索対象情報の各々に対する検索結果につき、それぞれの一致の度合に応じて検索結果を出力する出力サイズと出力領域の中心からの距離とを決定する決定工程と、
前記一致の度合に応じて前記決定手段で決定した出力サイズと出力領域の中心からの距離とで検索結果を第1の出力位置に出力すると検索結果同士の重なりが生じる場合に、検索結果同士の重なりがより少なくなる第2の出力位置を探索する探索工程と、
前記各検索結果を前記決定した出力サイズで、検索結果同士の重なりが生じない場合には前記第1の出力位置に、検索結果同士の重なりが生じる場合にはそれぞれの前記探索した第2の出力位置に、出力する出力工程とを有することを特徴とする情報検索方法。 - 前記データベースが、前記検索対象情報のそれぞれと対応づけて言語情報を格納しており、
前記入力工程は前記検索条件を自然言語により入力する工程であり、
前記計算工程では、自然言語により入力された前記検索条件を言語解析して、当該言語解析の結果と各検索対象情報に対応づけられている言語情報との言語的な一致度を計算することを特徴とする請求項7に記載の情報検索方法。 - 前記決定工程では、一致の度合の高い検索結果ほど大きな出力サイズに決定することを特徴とする請求項7に記載の情報検索方法。
- 前記検索結果は画像であり、前記出力サイズは画像サイズであることを特徴とする請求項9に記載の情報処理装置。
- 前記検索結果はテキストであり、前記出力サイズは文字サイズであることを特徴とする請求項9に記載の情報検索方法。
- 前記検索結果は音声であり、前記出力サイズは音量であることを特徴とする請求項9に記載の情報検索方法。
- 検索条件を入力する入力工程と、
前記検索条件と検索対象情報を格納したデータベースの各検索対象情報との一致の度合を計算する計算工程と、
一致の度合が所定値以上である検索対象情報の各々に対する検索結果につき、それぞれの一致の度合に応じて検索結果を出力する出力サイズと出力領域の中心からの距離とを決定する決定工程と、
前記一致の度合に応じて前記決定工程で決定した出力サイズと出力領域の中心からの距離とで検索結果を第1の出力位置に出力すると検索結果同士の重なりが生じる場合に、検索結果同士の重なりがより少なくなる第2の出力位置を探索する探索工程と、
前記各検索結果を前記決定した出力サイズで、検索結果同士の重なりが生じない場合には前記第1の出力位置に、検索結果同士の重なりが生じる場合にはそれぞれの前記探索した第2の出力位置に、出力する出力工程とをコンピュータに実行させるための情報検索プログラムを記憶したことを特徴とする記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02167199A JP3880235B2 (ja) | 1999-01-29 | 1999-01-29 | 情報検索装置及びその方法、及びそのプログラムを記憶した記憶媒体 |
US09/491,867 US7003505B1 (en) | 1999-01-29 | 2000-01-27 | Information retrieving apparatus and method therefor, and memory medium storing program therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02167199A JP3880235B2 (ja) | 1999-01-29 | 1999-01-29 | 情報検索装置及びその方法、及びそのプログラムを記憶した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000222416A JP2000222416A (ja) | 2000-08-11 |
JP3880235B2 true JP3880235B2 (ja) | 2007-02-14 |
Family
ID=12061523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02167199A Expired - Fee Related JP3880235B2 (ja) | 1999-01-29 | 1999-01-29 | 情報検索装置及びその方法、及びそのプログラムを記憶した記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7003505B1 (ja) |
JP (1) | JP3880235B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003167918A (ja) * | 2001-11-30 | 2003-06-13 | Sony Corp | データ表示装置及びデータ表示方法 |
JP4116325B2 (ja) * | 2002-05-09 | 2008-07-09 | 富士フイルム株式会社 | 画像表示制御装置 |
US20060074883A1 (en) * | 2004-10-05 | 2006-04-06 | Microsoft Corporation | Systems, methods, and interfaces for providing personalized search and information access |
GB2458490A (en) * | 2008-03-20 | 2009-09-23 | Triad Group Plc | Displaying the summary of a text file |
JP5354981B2 (ja) * | 2008-07-14 | 2013-11-27 | キヤノン株式会社 | 文書管理装置、文書管理方法及びプログラム |
US20100058173A1 (en) * | 2008-08-28 | 2010-03-04 | Kabushiki Kaisha Toshiba | Display processing apparatus, display processing method, and computer program product |
JP5268595B2 (ja) | 2008-11-28 | 2013-08-21 | ソニー株式会社 | 画像処理装置、画像表示方法及び画像表示プログラム |
JP4735995B2 (ja) * | 2008-12-04 | 2011-07-27 | ソニー株式会社 | 画像処理装置、画像表示方法および画像表示プログラム |
US8630485B2 (en) * | 2010-03-04 | 2014-01-14 | Intellectual Ventures Fund 83 Llc | Method for combining image and imaging product |
JP2010250842A (ja) * | 2010-06-02 | 2010-11-04 | Toshiba Corp | 表示処理装置、表示処理方法、およびプログラム |
JP2012022711A (ja) * | 2011-10-03 | 2012-02-02 | Seiko Epson Corp | ダウンロード装置、プログラム、画像データ提供装置、及び検索方法 |
JP6996742B2 (ja) | 2015-08-10 | 2022-01-17 | 日本電気株式会社 | 表示処理装置及び表示処理方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5761655A (en) * | 1990-06-06 | 1998-06-02 | Alphatronix, Inc. | Image file storage and retrieval system |
US5787414A (en) * | 1993-06-03 | 1998-07-28 | Kabushiki Kaisha Toshiba | Data retrieval system using secondary information of primary data to be retrieved as retrieval key |
JP2960340B2 (ja) * | 1995-10-20 | 1999-10-06 | 富士ゼロックス株式会社 | データ検索方法及び装置 |
JPH1049549A (ja) * | 1996-05-29 | 1998-02-20 | Matsushita Electric Ind Co Ltd | 文書検索装置 |
US5987460A (en) * | 1996-07-05 | 1999-11-16 | Hitachi, Ltd. | Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency |
JP3598742B2 (ja) * | 1996-11-25 | 2004-12-08 | 富士ゼロックス株式会社 | 文書検索装置及び文書検索方法 |
JPH10307816A (ja) * | 1997-05-08 | 1998-11-17 | Just Syst Corp | 構造化文書処理装置、構造化文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2000105772A (ja) * | 1998-07-28 | 2000-04-11 | Sharp Corp | 情報管理装置 |
US6233367B1 (en) * | 1998-09-09 | 2001-05-15 | Intel Corporation | Multi-linearization data structure for image browsing |
US6243093B1 (en) * | 1998-09-14 | 2001-06-05 | Microsoft Corporation | Methods, apparatus and data structures for providing a user interface, which exploits spatial memory in three-dimensions, to objects and which visually groups matching objects |
US6564206B1 (en) * | 1998-10-05 | 2003-05-13 | Canon Kabushiki Kaisha | Information search apparatus and method, and storage medium |
US6292164B2 (en) * | 1998-11-13 | 2001-09-18 | Planetweb, Inc. | System and method for character display and entry in character processing system |
JP3938456B2 (ja) * | 2000-03-16 | 2007-06-27 | パイオニア株式会社 | 映像信号の輝度階調補正装置 |
-
1999
- 1999-01-29 JP JP02167199A patent/JP3880235B2/ja not_active Expired - Fee Related
-
2000
- 2000-01-27 US US09/491,867 patent/US7003505B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7003505B1 (en) | 2006-02-21 |
JP2000222416A (ja) | 2000-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4890851B2 (ja) | 意味論的文書スマートネール | |
JP3880235B2 (ja) | 情報検索装置及びその方法、及びそのプログラムを記憶した記憶媒体 | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
JP2001175375A (ja) | 携帯情報端末装置、及び記憶媒体 | |
JP2005135041A (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
JP3674377B2 (ja) | 情報検索処理装置および方法。 | |
JPH11224258A (ja) | 画像検索装置及びその方法、コンピュータ可読メモリ | |
JPH10289240A (ja) | 画像処理装置及びその制御方法 | |
JP2005182460A (ja) | 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体 | |
JP2000122774A (ja) | データ引き渡し装置、方法、及び記録媒体 | |
JPH10289241A (ja) | 画像処理装置及びその制御方法 | |
JP2003150639A (ja) | メディア検索装置及び記憶媒体 | |
JPH11191159A (ja) | 画像出力装置およびそのプログラム記録媒体 | |
JP4693167B2 (ja) | 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体 | |
CN116185413B (zh) | 基于三维引擎生成指定菜单的方法、系统、装置及介质 | |
JPH05342265A (ja) | マルチメディア管理装置およびそのメディア提示方法 | |
JP2003150612A (ja) | メディア検索装置及び記憶媒体 | |
JPH09160908A (ja) | 文書処理装置及びその方法、記憶媒体 | |
JP2824256B2 (ja) | 文字表示システム | |
JP4990023B2 (ja) | 検索方法、検索プログラム、および検索装置 | |
JP4294386B2 (ja) | 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体 | |
JPS61262884A (ja) | 要素上の特定点への線引き方法 | |
JP2005128978A (ja) | 情報解析報告書自動作成装置、情報解析報告書自動作成プログラム、及び情報解析報告書自動作成方法 | |
JP4765831B2 (ja) | 画像処理システムおよび画像処理プログラム | |
JPH10134059A (ja) | Html文書処理装置及びhtml文書処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20031211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061107 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101117 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101117 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111117 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121117 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131117 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |