JP3195752B2 - 検索装置 - Google Patents

検索装置

Info

Publication number
JP3195752B2
JP3195752B2 JP04503997A JP4503997A JP3195752B2 JP 3195752 B2 JP3195752 B2 JP 3195752B2 JP 04503997 A JP04503997 A JP 04503997A JP 4503997 A JP4503997 A JP 4503997A JP 3195752 B2 JP3195752 B2 JP 3195752B2
Authority
JP
Japan
Prior art keywords
search
data
word
vector
request sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP04503997A
Other languages
English (en)
Other versions
JPH10240759A (ja
Inventor
健一 黒武者
育雄 芥子
洋 池内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP04503997A priority Critical patent/JP3195752B2/ja
Priority to DE69739889T priority patent/DE69739889D1/de
Priority to EP97310397A priority patent/EP0862122B1/en
Priority to US09/002,781 priority patent/US6175828B1/en
Publication of JPH10240759A publication Critical patent/JPH10240759A/ja
Application granted granted Critical
Publication of JP3195752B2 publication Critical patent/JP3195752B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子ブック、電子
辞書等のテキストデータベース、テキストによる説明文
のつけられた写真や動画等の画像データベース、あるい
はテキストデータが複合されたマルチメディアデータベ
ースの検索装置に関するものである。
【0002】
【従来の技術】従来、テキストデータベースの検索方法
としてキーワードを用いた検索が広く使われている。検
索したいキーワードを入力し、そのキーワードを含むデ
ータを探し出すという方法である。画像データベース等
については、各画像にその画像の説明文をつけておき、
その説明文に対してキーワード検索を行うことによって
画像の検索を行うことができる。しかし、キーワード検
索では意味的に近い言葉であってもキーワードが一致し
なければ検索できないという問題があった。
【0003】それに対して、意味的な検索を行う方法と
して、特徴ベクトルを用いた連想検索がある。特徴ベク
トルとは、(社)電子情報通信学会発行の信学技法A1
92−99(1993)「大規模データベースからの連
想検索」で提案された文脈ベクトルのことである。つま
り、本発明中の「特徴ベクトル」は上記の「文脈ベクト
ル」にそのまま対応する。この特徴ベクトルを用いた検
索として特開平6ー195388号公報がある。
【0004】特徴ベクトルとは、文章中の単語が持つ概
念と文脈との関係の程度を示したものであり、多数の特
徴単語との意味的な結合関係の程度をベクトル表現した
ものである。N個の概念分類を特徴単語とすると、N次
元ベクトルの各要素の値を一つ一つの特徴単語に対応さ
せることになる。単語iの特徴ベクトルXi=(xi
1,xi2,…,xiN)の各要素の値は、0≦xij
≦Emとなる。Emは、正の定数である。単語iと特徴
単語jとの間に関係がない場合には、xij=0にな
り、関係がある場合には、その関係の程度に応じて大き
い値をとる。例えば、特徴ベクトルが5つの特徴単語
(自然、都会、騒音、動物、緑)から成り立っていると
し、それぞれの要素の値が0か1の2値である場合に
は、単語「山」の特徴ベクトルを、(1,0,0,1,
1)のように表すことができる。
【0005】図4は、特徴ベクトルを用いた従来の検索
装置の概略構成図である。この検索装置は検索の要求文
を入力するための入力手段21、検索結果を出力するた
めの出力手段22、検索装置を制御するための制御手段
23、単語辞書24、データベース25からなる。制御
手段23は、単語抽出手段26、ベクトル生成手段2
7、ベクトル検索手段28の各機能を実現するものであ
る。単語辞書24には、単語とその単語に対応する特徴
ベクトル(以下、単語ベクトルという)が対になって記
憶されている。また、データベース25には、データと
そのデータに対応する特徴ベクトル(以下、データベク
トルという)が対になって記憶されている。データベク
トルの大きさは一定の値になるように正規化されてい
る。
【0006】検索は入力手段21から検索の要求文を入
力することによって行われる。単語抽出手段26は、単
語辞書24を参照しながら入力手段21から入力された
要求文中の単語を抽出する。ベクトル生成手段27は、
単語抽出手段26によって抽出された要求文の単語に対
応する単語ベクトルを単語辞書24から読み出し、要求
文を特徴ベクトル空間内のベクトル(以下、要求文ベク
トルという)に変換する。この変換は、単語抽出手段2
6で抽出された単語の単語ベクトルの和を計算し、その
ベクトルの和の大きさが一定の値になるように正規化す
ることで行われる。ベクトル検索手段28は、この要求
文ベクトルとデータベース25中のデータベクトルとの
距離を計算し、最も距離の近いデータベクトルを持つデ
ータから順に順位をつけて検索結果として出力手段22
から出力する。
【0007】
【発明が解決しようとする課題】しかしながら、このよ
うな特徴ベクトルを用いた検索では、要求文ベクトルと
データベクトルとの距離にだけ基づいて検索を行ってい
るため、キーワード検索のように要求文に含まれている
単語を含んでいるデータを上位にして検索できるとは限
らない。この検索では、キーワードを持つデータの検索
が行えない、あるいはキーワードが一致するデータを検
索しながら、同時に意味的な検索を行うことができない
という問題点がある。
【0008】一方、キーワード検索においては、特開平
6ー208588号公報のように検索の要求文を形態素
解析して品詞情報によってキーワードの重要度を決定し
て要求文とデータのキーワードが完全に一致していなく
ても検索が行えるというものもある。しかし、この検索
も基本的にはキーワード検索であり、検索の要求文をい
くつかの単語に区切って検索を行うが、意味的に近くて
も要求文に含まれていない単語だけからなるデータを検
索することはできないという問題点がある。
【0009】本発明の目的は、上記問題点に鑑み、キー
ワード検索と特徴ベクトルを用いた検索を同時に行い、
両者の結果をうまく組み合わせることによって検索結果
の順位づけを行い、両者の検索結果の改善を行う検索装
置を提供することにある。
【0010】
【課題を解決するための手段】本発明は、検索の要求文
を入力する入力手段と、単語を単語ベクトルに対応づけ
て格納する単語辞書と、少なくとも単語を含むデータを
データベクトルに対応付けて格納するデータベースと、
前記単語辞書を用いて前記要求文に含まれている単語を
抽出する単語抽出手段と、前記単語辞書と前記単語抽出
手段とを用いて前記要求文から要求文ベクトルを生成す
るベクトル生成手段と、前記要求文ベクトルと前記デー
タベクトルとの意味的類似度を前記データごとに求める
ベクトル検索手段と、前記単語抽出手段を用いて前記要
求文に含まれている単語と共通の単語を含む前記データ
を求めるキーワード検索手段と、前記意味的類似度と前
記キーワード検索手段で求められたデータ中の単語と前
記要求文中に含まれる単語との一致度とに基づいて前記
要求文に適合するデータの検索を行う拡張検索手段と、
を備え、前記拡張検索手段は、前記意味的類似度と前記
一致度の総合得点を重み付けして計算し、総合得点の高
いデータから順に検索結果として出力することを特徴と
する検索装置を提供する。
【0011】また、本発明は、検索の要求文を入力する
入力手段と、単語を単語ベクトルに対応づけて格納する
単語辞書と、少なくとも単語を含むデータを格納するデ
ータベースと、前記単語辞書を用いて前記要求文に含ま
れている単語を抽出する単語抽出手段と、前記単語辞書
と前記単語抽出手段とを用いて前記要求文から要求文ベ
クトルを生成すると共に前記データからデータベクトル
を生成するベクトル生成手段と、前記要求文ベクトルと
前記データベクトルとの意味的類似度を前記データごと
に求めるベクトル検索手段と、前記単語抽出手段を用い
て前記要求文に含まれている単語と共通の単語を含む前
記データを求めるキーワード検索手段と、前記意味的類
似度と前記キーワード検索手段で求められたデータ中の
単語と前記要求文中に含まれる単語との一致度とに基づ
いて前記要求文に適合するデータの検索を行う拡張検索
手段と、を備え、前記拡張検索手段は、前記意味的類似
度と前記一致度の総合得点を重み付けして計算し、総合
得点の高いデータから順に検索結果として出力すること
を特徴とする検索装置を提供する。
【0012】また、本発明は、上記検索装置において、
前記データベースのデータとそのデータに含まれる単語
との関係を記憶したインデックステーブルを備え、前記
キーワード検索手段は、前記単語抽出手段のかわりに前
記インデックテーブルを用いて前記要求文に含まれて
いる単語と共通の単語を含む前記データを求めることを
特徴とする検索装置を提供する。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1に、本発明に係る検索装置の
概略構成を示す。この検索装置は、検索の要求文を入力
するキーボード、手書き入力するためのタブレット、あ
るいは音声入力するためのマイク等からなる入力手段1
1、検索結果を得点順に出力するディスプレイやプリン
タ等からなる出力手段12、検索プログラムに従って検
索動作を制御するための制御手段13、単語とその単語
の特徴を表す単語ベクトルを保持する単語辞書14、デ
ータとそのデータの特徴を表すデータベクトルを複数保
持するデータベース15、データベース中のデータが含
んでいる単語とそのデータとの関係を記憶しているイン
デックステーブル10からなる。制御手段13、単語辞
書14、データベース15、インデックステーブル10
は、CPUやメモリや外部記憶装置からなるコンピュー
タシステムである。
【0014】本検索装置は、後述する検索動作を行う
が、この動作は検索プログラムに従って行われ、この検
索プログラムは記憶媒体に保持され、制御手段13のメ
モリ上にロードされて用いられる。制御手段13は、検
索の要求文あるいはデータから単語を抽出する単語抽出
手段16、要求文から要求文ベクトルを生成するベクト
ル生成手段17、本発明の検索を行う拡張検索手段20
の各機能を実現するものである。また、拡張検索手段2
0は、特徴ベクトルを用いた検索を行うベクトル検索手
段18、キーワード検索を行うキーワード検索手段19
を備える。
【0015】データベース15中のデータとしては、テ
キストデータ、テキストによる説明文の付けられた写真
や動画の画像データ、テキストによる説明文が音声出力
されるようにされた音声データ、あるいはこれらの複合
的な組み合わせデータであり、各データには少なくとも
一部に単語を含んでいることが必要である。また、デー
タベクトルの大きさは一定の値になるように正規化され
ているが、この例では、ベクトルの大きさはベクトルの
各要素の2乗和の平方根で計算され、大きさが10にな
るように正規化されている。データベクトルは、単語辞
書14を用いてデータごとに予め求めて格納しておけ
ば、検索のたびにデータベース15からデータベクトル
を生成しなくてよく、検索動作が高速になる。また、デ
ータベクトルは、データべース15中に含まれている必
要はなく、データベース15中の各データとの対応関係
さえ明確であれば、制御手段13に接続された記憶装置
(図示せず)に格納されていてもよい。また、データベ
クトルは、予め保持しておくのではなく、検索を行う時
に、データベース15中のテキストデータからベクトル
生成手段17によって生成してもよい。こうすることに
より、データベース15の記憶容量を節約できる。
【0016】次に、本検索装置による検索動作について
説明する。検索は入力手段11から検索の要求文を入力
することによって開始される。単語抽出手段16は、単
語辞書14を参照しながら入力手段11から入力された
要求文中の単語を抽出する。ベクトル生成手段17は、
単語抽出手段16によって抽出された要求文の単語に対
応する単語ベクトルを単語辞書14から読み出し、入力
された要求文を要求文ベクトルに変換する。この変換
は、抽出された単語ベクトルの和を計算し、そのベクト
ルの和の大きさが一定の値になるように正規化すること
で行われる。この例では、要求文ベクトルの大きさは1
0になるように正規化されている。
【0017】ベクトル検索手段18では、この要求文ベ
クトルとデータベース15中の各データに対応するデー
タベクトルとの距離を計算する。この例では距離計算
は、2つのベクトルの内積計算を行うことによって行わ
れる。要求文ベクトルもデータベクトルも大きさが10
になるように正規化されているので、最も距離が近い場
合には内積値は100になり、最も距離が離れている場
合には内積値は0になる。つまり、2つのベクトルの内
積値は0から100の間の値になり、内積値が大きいほ
ど2つのベクトルの距離が近く意味的に近いことにな
る。ここでは、この内積値を検索の得点にして、それぞ
れのデータには要求文ベクトルとの内積値がベクトル検
索の得点として計算される。例えば、特徴ベクトルが5
次元ベクトルであったとして、要求文ベクトルVが、 V=(3,4,7,5,1) で、データベクトルUが、 U=(1,5,3,8,1) の場合、2つのベクトルの内積値Pは、 P=3×1+4×5+7×3+5×8+1×1=85 となる。つまり、この要求文に対するこのデータの得点
は85点ということになる。
【0018】キーワード検索手段19では、単語抽出手
段16で抽出された要求文に含まれる単語を含んでいる
データを、データベース15から探し出す。データベー
ス15中のデータについて単語抽出手段16を用いて、
各データに含まれている単語を抽出し、各データに含ま
れている単語が1つでも要求文に含まれている単語と一
致するデータを検索結果として出力する。例えば、要求
文が「都会の秋の西の空」で、「都会」「秋」「西」
「空」が単語として抽出された場合には、「都会」
「秋」「西」「空」のいずれかの単語を含んでいるデー
タを検索して出力することになる。
【0019】キーワード検索手段19でキーワード検索
を行う際に、データベース15中の各データが含んでい
る単語を記憶しているインデックステーブル10を保持
している場合には、データに含まれている単語を抽出す
るために単語抽出手段16をキーワード検索を行うたび
に用いる必要がなくなり、検索動作が高速になる。デー
タベース15中の各データにデータ番号をつけておき、
インデックステーブル10に、各単語毎にその単語が含
まれているデータのデータ番号を記憶させるか、各デー
タ毎にそのデータを含んでいる単語を記憶させておく。
つまり、各単語毎にインデックステーブル10を作成し
た場合には図2のようになり、各データ毎にインデック
ステーブル10を作成した場合には図3のようになる。
【0020】そして、拡張検索手段20では、このベク
トル検索手段18とキーワード検索手段19の結果に基
づいて各データごとに得点づけを行う。この得点付けと
しては、ベクトル検索手段18では0点から100点の
間で要求文との意味的な類似度の高さに応じて各データ
が得点づけされ、キーワード検索手段19では要求文に
含まれている単語と同じ単語を含んでいるデータを検索
し、一致する単語の数に基づいて、次式のように得点づ
けされる。 (得点)=(一致する単語数)/(要求文の単語数)×
100 ただし、要求文中やデータ中に同一の単語が2回以上現
れる時は、その単語は1つだけ存在するものとして扱
う。このように得点づけすることによって、キーワード
検索についても各データについて0点から100点の間
で得点を与えることができる。つまり、要求文中の単語
を全て含んでいるデータは100点に、1つも含んでい
ないデータは0点になる。例えば、要求文が「都会の秋
の西の空」で、「都会」「秋」「西」「空」の4つの単
語が抽出されていて、データ「都会の街」が「都会」と
「街」を単語として抽出している場合には、「都会」が
両者で一致しているので、このデータの得点Sは、 S=1/4×100=25 のように、25点と計算される。このようにしてベクト
ル検索の得点Pとキーワード検索の得点Sが計算される
と、拡張検索手段20は両者の検索結果の得点を各デー
タごとに加算して、総合得点の高いデータから順に検索
結果として出力手段12に出力する。この検索結果に
は、検索結果のデータと共に総合得点と両方の検索結果
の各得点とを出力してもよい。
【0021】この総合得点Stの計算法は、例えば次式
による。 St=P+α×S ここで、αは0以上の実数であり、ベクトル検索とキー
ワード検索の重み付けを変化させるようにしておく。α
=1の時は両者の検索結果の得点が1:1で加算され、
0点から200点の間の得点が与えられることになる。
例えば、ベクトル検索の得点が85点で、キーワード検
索の得点が25点の場合には、総合得点は110点にな
る。α=0の場合にはベクトル検索に、α≫1の場合に
はキーワード検索を行うのと同じになる。
【0022】αの設定は、出力手段12の検索結果を見
ながらユーザが決定しても良く、また、検索を行って得
られた所定順位までのベクトル検索結果の総得点とキー
ワード検索結果の総得点に応じて(例えば両検索結果の
総得点が均等になるように)、αを自動設定してもよ
い。このようにαの大きさを調整することによって、ベ
クトル検索とキーワード検索の度合を調整することがで
きる。このように、両者の検索結果を組み合わせること
によって、両者の検索の不備を補い、検索結果の改善を
行うことができる。
【0023】
【発明の効果】本発明によれば、キーワード検索と特徴
ベクトルを使った検索の両方の特徴を加味した検索結果
を得ることができ、検索結果の改善を行うことができ
る。
【図面の簡単な説明】
【図1】本実施の形態に係る検索装置のブロック構成を
示す図である。
【図2】各単語毎に作成したインデックステーブルの例
である。
【図3】各データ毎に作成したインデックステーブルの
例である。
【図4】従来の検索装置のブロック構成を示す図であ
る。
【符号の説明】
10 インデックステーブル 11 入力手段 12 出力手段 13 制御手段 14 単語辞書 15 データベース 16 単語抽出手段 17 ベクトル生成手段 18 ベクトル検索手段 19 キーワード検索手段 20 拡張検索手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−96134(JP,A) 特開 平6−195388(JP,A) 特開 平6−208588(JP,A) 特開 平7−110818(JP,A) 特開 平7−121549(JP,A) 特開 平7−192002(JP,A) 特開 平8−16611(JP,A) 特開 平9−6799(JP,A) 芥子,乾,石鞍「大規模文書データベ ースからの連想検索」電子情報通信学会 技術研究報告(AI92−99),Vol. 92,No.426,pp.73−80(平5− 1−22) 芥子,「ベクトル空間モデルに基づく フルテキストサーチシステム」1992年度 人工知能学会(第6回)全国大会論文集 (▲I▼)pp.343−346(平4−6− 24) 芥子,乾,石鞍「大規模文書データベ ースからの連想検索」第23回人工知能学 会知識データベースシステム研究会資 料,pp.105−112,1993(平5−1− 21) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 検索の要求文を入力する入力手段と、 単語を単語ベクトルに対応づけて格納する単語辞書と、 少なくとも単語を含むデータをデータベクトルに対応付
    けて格納するデータベースと、 前記単語辞書を用いて前記要求文に含まれている単語を
    抽出する単語抽出手段と、 前記単語辞書と前記単語抽出手段とを用いて前記要求文
    から要求文ベクトルを生成するベクトル生成手段と、 前記要求文ベクトルと前記データベクトルとの意味的類
    似度を前記データごとに求めるベクトル検索手段と、 前記単語抽出手段を用いて前記要求文に含まれている単
    語と共通の単語を含む前記データを求めるキーワード検
    索手段と、 前記意味的類似度と前記キーワード検索手段で求められ
    たデータ中の単語と前記要求文中に含まれる単語との一
    致度とに基づいて前記要求文に適合するデータの検索を
    行う拡張検索手段と、を備え 前記拡張検索手段は、前記意味的類似度と前記一致度の
    総合得点を重み付けして計算し、総合得点の高いデータ
    から順に検索結果として出力する ことを特徴とする検索
    装置。
  2. 【請求項2】 検索の要求文を入力する入力手段と、 単語を単語ベクトルに対応づけて格納する単語辞書と、 少なくとも単語を含むデータを格納するデータベース
    と、 前記単語辞書を用いて前記要求文に含まれている単語を
    抽出する単語抽出手段と、 前記単語辞書と前記単語抽出手段とを用いて前記要求文
    から要求文ベクトルを生成すると共に前記データからデ
    ータベクトルを生成するベクトル生成手段と、 前記要求文ベクトルと前記データベクトルとの意味的類
    似度を前記データごとに求めるベクトル検索手段と、 前記単語抽出手段を用いて前記要求文に含まれている単
    語と共通の単語を含む前記データを求めるキーワード検
    索手段と、 前記意味的類似度と前記キーワード検索手段で求められ
    たデータ中の単語と前記要求文中に含まれる単語との一
    致度とに基づいて前記要求文に適合するデータの検索を
    行う拡張検索手段と、を備え 前記拡張検索手段は、前記意味的類似度と前記一致度の
    総合得点を重み付けして計算し、総合得点の高いデータ
    から順に検索結果として出力する ことを特徴とする検索
    装置。
  3. 【請求項3】 請求項1または請求項2に記載の検索装
    置において、 前記データベースのデータとそのデータに含まれる単語
    との関係を記憶したインデックステーブルを備え、 前記キーワード検索手段は、前記単語抽出手段のかわり
    に前記インデックテーブルを用いて前記要求文に含ま
    れている単語と共通の単語を含む前記データを求めるこ
    とを特徴とする検索装置。
JP04503997A 1997-02-28 1997-02-28 検索装置 Expired - Lifetime JP3195752B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP04503997A JP3195752B2 (ja) 1997-02-28 1997-02-28 検索装置
DE69739889T DE69739889D1 (de) 1997-02-28 1997-12-18 Wiederauffindungsvorrichtung
EP97310397A EP0862122B1 (en) 1997-02-28 1997-12-18 Retrieval apparatus
US09/002,781 US6175828B1 (en) 1997-02-28 1998-01-05 Retrieval apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04503997A JP3195752B2 (ja) 1997-02-28 1997-02-28 検索装置

Publications (2)

Publication Number Publication Date
JPH10240759A JPH10240759A (ja) 1998-09-11
JP3195752B2 true JP3195752B2 (ja) 2001-08-06

Family

ID=12708227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04503997A Expired - Lifetime JP3195752B2 (ja) 1997-02-28 1997-02-28 検索装置

Country Status (4)

Country Link
US (1) US6175828B1 (ja)
EP (1) EP0862122B1 (ja)
JP (1) JP3195752B2 (ja)
DE (1) DE69739889D1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10326286A (ja) * 1997-05-27 1998-12-08 Mitsubishi Electric Corp 類似検索装置及び類似検索プログラムを記録した記録媒体
EP0990998A3 (en) 1998-09-30 2005-04-20 Canon Kabushiki Kaisha Information search apparatus and method
US6493705B1 (en) 1998-09-30 2002-12-10 Canon Kabushiki Kaisha Information search apparatus and method, and computer readable memory
JP3578651B2 (ja) * 1998-12-04 2004-10-20 株式会社リコー 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US6424969B1 (en) * 1999-07-20 2002-07-23 Inmentia, Inc. System and method for organizing data
JP3725373B2 (ja) * 1999-08-04 2005-12-07 富士通株式会社 単語重要度計算装置、文書検索装置、単語重要度計算プログラムを記録したコンピュータ読み取り可能な記録媒体および文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3730451B2 (ja) * 1999-08-24 2006-01-05 シャープ株式会社 情報提供装置
US6751621B1 (en) 2000-01-27 2004-06-15 Manning & Napier Information Services, Llc. Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors
US7912868B2 (en) * 2000-05-02 2011-03-22 Textwise Llc Advertisement placement method and system using semantic analysis
US6687689B1 (en) * 2000-06-16 2004-02-03 Nusuara Technologies Sdn. Bhd. System and methods for document retrieval using natural language-based queries
JP4188543B2 (ja) * 2000-06-22 2008-11-26 株式会社メディアクリエイト 情報提供システム
US20020120651A1 (en) * 2000-09-12 2002-08-29 Lingomotors, Inc. Natural language search method and system for electronic books
US20030028564A1 (en) * 2000-12-19 2003-02-06 Lingomotors, Inc. Natural language method and system for matching and ranking documents in terms of semantic relatedness
US6944619B2 (en) 2001-04-12 2005-09-13 Primentia, Inc. System and method for organizing data
US20040158561A1 (en) * 2003-02-04 2004-08-12 Gruenwald Bjorn J. System and method for translating languages using an intermediate content space
US7383257B2 (en) * 2003-05-30 2008-06-03 International Business Machines Corporation Text explanation for on-line analytic processing events
US7502779B2 (en) * 2003-06-05 2009-03-10 International Business Machines Corporation Semantics-based searching for information in a distributed data processing system
US7577682B2 (en) * 2003-07-31 2009-08-18 Sap Ag Semantic objects
WO2006133050A2 (en) * 2005-06-06 2006-12-14 The Regents Of The University Of California Relationship networks
JP4878477B2 (ja) * 2006-01-18 2012-02-15 富士通株式会社 情報検索適切度判定処理プログラムおよびオペレータスキル判定処理プログラム
JP4922692B2 (ja) * 2006-07-28 2012-04-25 富士通株式会社 検索クエリー作成装置
EP2307951A4 (en) * 2008-07-29 2012-12-19 Textwise Llc METHOD AND APPARATUS FOR ASSOCIATING DATA SETS USING SEMANTIC VECTORS AND KEYWORD ANALYSIS
EP2287749A4 (en) * 2009-01-23 2011-08-03 Nec Corp DATA DEVICE RECALL
CN104375984A (zh) * 2014-11-21 2015-02-25 无锡科思电子科技有限公司 一种检测网络上传文件中敏感轨迹的方法
JP6517537B2 (ja) * 2015-02-26 2019-05-22 日本電信電話株式会社 単語ベクトル学習装置、自然言語処理装置、方法、及びプログラム
US20190207946A1 (en) * 2016-12-20 2019-07-04 Google Inc. Conditional provision of access by interactive assistant modules
US11436417B2 (en) 2017-05-15 2022-09-06 Google Llc Providing access to user-controlled resources by automated assistants
US10127227B1 (en) 2017-05-15 2018-11-13 Google Llc Providing access to user-controlled resources by automated assistants
US10915707B2 (en) * 2017-10-20 2021-02-09 MachineVantage, Inc. Word replaceability through word vectors
EP3682345B1 (en) 2018-08-07 2021-11-24 Google LLC Assembling and evaluating automated assistant responses for privacy concerns
EP3706013A1 (de) 2019-03-08 2020-09-09 Hospitality Digital GmbH Konzise, zutreffende indexierung
JP6751188B1 (ja) * 2019-08-05 2020-09-02 Dmg森精機株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5317507A (en) * 1990-11-07 1994-05-31 Gallant Stephen I Method for document retrieval and for word sense disambiguation using neural networks
JP3460728B2 (ja) 1992-08-14 2003-10-27 株式会社リコー 文書検索方式
JP3422541B2 (ja) * 1992-12-17 2003-06-30 ゼロックス・コーポレーション キーワードのモデル化方法及び非キーワードhmmの提供方法
JP2823761B2 (ja) 1992-12-24 1998-11-11 シャープ株式会社 文書検索装置
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
US5604839A (en) * 1994-07-29 1997-02-18 Microsoft Corporation Method and system for improving speech recognition through front-end normalization of feature vectors
JPH096799A (ja) * 1995-06-19 1997-01-10 Sharp Corp 文書分類装置及び文書検索装置
US5832474A (en) * 1996-02-26 1998-11-03 Matsushita Electric Industrial Co., Ltd. Document search and retrieval system with partial match searching of user-drawn annotations
US5893095A (en) * 1996-03-29 1999-04-06 Virage, Inc. Similarity engine for content-based retrieval of images
US5862211A (en) * 1997-01-13 1999-01-19 Lucent Technologies Inc. Automatic simultaneous voice-and-data call setup for remote-site servicing
US5825855A (en) * 1997-01-30 1998-10-20 Toshiba America Information Systems, Inc. Method of recognizing pre-recorded announcements

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
芥子,「ベクトル空間モデルに基づくフルテキストサーチシステム」1992年度人工知能学会(第6回)全国大会論文集(▲I▼)pp.343−346(平4−6−24)
芥子,乾,石鞍「大規模文書データベースからの連想検索」第23回人工知能学会知識データベースシステム研究会資料,pp.105−112,1993(平5−1−21)
芥子,乾,石鞍「大規模文書データベースからの連想検索」電子情報通信学会技術研究報告(AI92−99),Vol.92,No.426,pp.73−80(平5−1−22)

Also Published As

Publication number Publication date
EP0862122B1 (en) 2010-05-26
US6175828B1 (en) 2001-01-16
EP0862122A2 (en) 1998-09-02
JPH10240759A (ja) 1998-09-11
DE69739889D1 (de) 2010-07-08
EP0862122A3 (en) 2000-01-26

Similar Documents

Publication Publication Date Title
JP3195752B2 (ja) 検索装置
JP3040945B2 (ja) 文書検索装置
JP4467791B2 (ja) 情報管理及び検索
EP0590858B1 (en) Method for performing a search of a plurality of documents for similarity to a query
EP0965089B1 (en) Information retrieval utilizing semantic representation of text
JP2002520712A (ja) データ検索システムと方法およびサーチ・エンジンにおけるその使用
US20080222138A1 (en) Method and Apparatus for Constructing a Link Structure Between Documents
CN102955772B (zh) 一种基于语义的相似度计算方法和装置
JPH03172966A (ja) 類似文書検索装置
CN113220862A (zh) 标准问识别方法、装置及计算机设备及存储介质
CN114880447A (zh) 信息检索方法、装置、设备及存储介质
CN111723179B (zh) 基于概念图谱的反馈模型信息检索方法、系统及介质
Ha et al. Utilizing sbert for finding similar questions in community question answering
JP3198932B2 (ja) 文書検索装置
CN113505196B (zh) 基于词性的文本检索方法、装置、电子设备及存储介质
JP3024045B2 (ja) 自然言語に基づくデータ検索装置
Kang Keyword-based document clustering
JP4325370B2 (ja) 文書関連語彙獲得装置及びプログラム
JP5418138B2 (ja) 文書検索システム、情報処理装置およびプログラム
JP2000112949A (ja) 情報判別支援装置及び類似情報判別支援プログラムを記録した記録媒体
CN112182159A (zh) 一种基于语义表示的个性化检索式对话方法和系统
CN111737413A (zh) 基于概念网语义的反馈模型信息检索方法、系统及介质
JP3123836B2 (ja) テキスト型データベース装置
JPH064584A (ja) 文章検索装置
JP3503506B2 (ja) 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090601

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130601

Year of fee payment: 12

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term