JP3195752B2 - 検索装置 - Google Patents
検索装置Info
- Publication number
- JP3195752B2 JP3195752B2 JP04503997A JP4503997A JP3195752B2 JP 3195752 B2 JP3195752 B2 JP 3195752B2 JP 04503997 A JP04503997 A JP 04503997A JP 4503997 A JP4503997 A JP 4503997A JP 3195752 B2 JP3195752 B2 JP 3195752B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- data
- word
- vector
- request sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
辞書等のテキストデータベース、テキストによる説明文
のつけられた写真や動画等の画像データベース、あるい
はテキストデータが複合されたマルチメディアデータベ
ースの検索装置に関するものである。
としてキーワードを用いた検索が広く使われている。検
索したいキーワードを入力し、そのキーワードを含むデ
ータを探し出すという方法である。画像データベース等
については、各画像にその画像の説明文をつけておき、
その説明文に対してキーワード検索を行うことによって
画像の検索を行うことができる。しかし、キーワード検
索では意味的に近い言葉であってもキーワードが一致し
なければ検索できないという問題があった。
して、特徴ベクトルを用いた連想検索がある。特徴ベク
トルとは、(社)電子情報通信学会発行の信学技法A1
92−99(1993)「大規模データベースからの連
想検索」で提案された文脈ベクトルのことである。つま
り、本発明中の「特徴ベクトル」は上記の「文脈ベクト
ル」にそのまま対応する。この特徴ベクトルを用いた検
索として特開平6ー195388号公報がある。
念と文脈との関係の程度を示したものであり、多数の特
徴単語との意味的な結合関係の程度をベクトル表現した
ものである。N個の概念分類を特徴単語とすると、N次
元ベクトルの各要素の値を一つ一つの特徴単語に対応さ
せることになる。単語iの特徴ベクトルXi=(xi
1,xi2,…,xiN)の各要素の値は、0≦xij
≦Emとなる。Emは、正の定数である。単語iと特徴
単語jとの間に関係がない場合には、xij=0にな
り、関係がある場合には、その関係の程度に応じて大き
い値をとる。例えば、特徴ベクトルが5つの特徴単語
(自然、都会、騒音、動物、緑)から成り立っていると
し、それぞれの要素の値が0か1の2値である場合に
は、単語「山」の特徴ベクトルを、(1,0,0,1,
1)のように表すことができる。
装置の概略構成図である。この検索装置は検索の要求文
を入力するための入力手段21、検索結果を出力するた
めの出力手段22、検索装置を制御するための制御手段
23、単語辞書24、データベース25からなる。制御
手段23は、単語抽出手段26、ベクトル生成手段2
7、ベクトル検索手段28の各機能を実現するものであ
る。単語辞書24には、単語とその単語に対応する特徴
ベクトル(以下、単語ベクトルという)が対になって記
憶されている。また、データベース25には、データと
そのデータに対応する特徴ベクトル(以下、データベク
トルという)が対になって記憶されている。データベク
トルの大きさは一定の値になるように正規化されてい
る。
力することによって行われる。単語抽出手段26は、単
語辞書24を参照しながら入力手段21から入力された
要求文中の単語を抽出する。ベクトル生成手段27は、
単語抽出手段26によって抽出された要求文の単語に対
応する単語ベクトルを単語辞書24から読み出し、要求
文を特徴ベクトル空間内のベクトル(以下、要求文ベク
トルという)に変換する。この変換は、単語抽出手段2
6で抽出された単語の単語ベクトルの和を計算し、その
ベクトルの和の大きさが一定の値になるように正規化す
ることで行われる。ベクトル検索手段28は、この要求
文ベクトルとデータベース25中のデータベクトルとの
距離を計算し、最も距離の近いデータベクトルを持つデ
ータから順に順位をつけて検索結果として出力手段22
から出力する。
うな特徴ベクトルを用いた検索では、要求文ベクトルと
データベクトルとの距離にだけ基づいて検索を行ってい
るため、キーワード検索のように要求文に含まれている
単語を含んでいるデータを上位にして検索できるとは限
らない。この検索では、キーワードを持つデータの検索
が行えない、あるいはキーワードが一致するデータを検
索しながら、同時に意味的な検索を行うことができない
という問題点がある。
6ー208588号公報のように検索の要求文を形態素
解析して品詞情報によってキーワードの重要度を決定し
て要求文とデータのキーワードが完全に一致していなく
ても検索が行えるというものもある。しかし、この検索
も基本的にはキーワード検索であり、検索の要求文をい
くつかの単語に区切って検索を行うが、意味的に近くて
も要求文に含まれていない単語だけからなるデータを検
索することはできないという問題点がある。
ワード検索と特徴ベクトルを用いた検索を同時に行い、
両者の結果をうまく組み合わせることによって検索結果
の順位づけを行い、両者の検索結果の改善を行う検索装
置を提供することにある。
を入力する入力手段と、単語を単語ベクトルに対応づけ
て格納する単語辞書と、少なくとも単語を含むデータを
データベクトルに対応付けて格納するデータベースと、
前記単語辞書を用いて前記要求文に含まれている単語を
抽出する単語抽出手段と、前記単語辞書と前記単語抽出
手段とを用いて前記要求文から要求文ベクトルを生成す
るベクトル生成手段と、前記要求文ベクトルと前記デー
タベクトルとの意味的類似度を前記データごとに求める
ベクトル検索手段と、前記単語抽出手段を用いて前記要
求文に含まれている単語と共通の単語を含む前記データ
を求めるキーワード検索手段と、前記意味的類似度と前
記キーワード検索手段で求められたデータ中の単語と前
記要求文中に含まれる単語との一致度とに基づいて前記
要求文に適合するデータの検索を行う拡張検索手段と、
を備え、前記拡張検索手段は、前記意味的類似度と前記
一致度の総合得点を重み付けして計算し、総合得点の高
いデータから順に検索結果として出力することを特徴と
する検索装置を提供する。
入力手段と、単語を単語ベクトルに対応づけて格納する
単語辞書と、少なくとも単語を含むデータを格納するデ
ータベースと、前記単語辞書を用いて前記要求文に含ま
れている単語を抽出する単語抽出手段と、前記単語辞書
と前記単語抽出手段とを用いて前記要求文から要求文ベ
クトルを生成すると共に前記データからデータベクトル
を生成するベクトル生成手段と、前記要求文ベクトルと
前記データベクトルとの意味的類似度を前記データごと
に求めるベクトル検索手段と、前記単語抽出手段を用い
て前記要求文に含まれている単語と共通の単語を含む前
記データを求めるキーワード検索手段と、前記意味的類
似度と前記キーワード検索手段で求められたデータ中の
単語と前記要求文中に含まれる単語との一致度とに基づ
いて前記要求文に適合するデータの検索を行う拡張検索
手段と、を備え、前記拡張検索手段は、前記意味的類似
度と前記一致度の総合得点を重み付けして計算し、総合
得点の高いデータから順に検索結果として出力すること
を特徴とする検索装置を提供する。
前記データベースのデータとそのデータに含まれる単語
との関係を記憶したインデックステーブルを備え、前記
キーワード検索手段は、前記単語抽出手段のかわりに前
記インデックステーブルを用いて前記要求文に含まれて
いる単語と共通の単語を含む前記データを求めることを
特徴とする検索装置を提供する。
施の形態を説明する。図1に、本発明に係る検索装置の
概略構成を示す。この検索装置は、検索の要求文を入力
するキーボード、手書き入力するためのタブレット、あ
るいは音声入力するためのマイク等からなる入力手段1
1、検索結果を得点順に出力するディスプレイやプリン
タ等からなる出力手段12、検索プログラムに従って検
索動作を制御するための制御手段13、単語とその単語
の特徴を表す単語ベクトルを保持する単語辞書14、デ
ータとそのデータの特徴を表すデータベクトルを複数保
持するデータベース15、データベース中のデータが含
んでいる単語とそのデータとの関係を記憶しているイン
デックステーブル10からなる。制御手段13、単語辞
書14、データベース15、インデックステーブル10
は、CPUやメモリや外部記憶装置からなるコンピュー
タシステムである。
が、この動作は検索プログラムに従って行われ、この検
索プログラムは記憶媒体に保持され、制御手段13のメ
モリ上にロードされて用いられる。制御手段13は、検
索の要求文あるいはデータから単語を抽出する単語抽出
手段16、要求文から要求文ベクトルを生成するベクト
ル生成手段17、本発明の検索を行う拡張検索手段20
の各機能を実現するものである。また、拡張検索手段2
0は、特徴ベクトルを用いた検索を行うベクトル検索手
段18、キーワード検索を行うキーワード検索手段19
を備える。
キストデータ、テキストによる説明文の付けられた写真
や動画の画像データ、テキストによる説明文が音声出力
されるようにされた音声データ、あるいはこれらの複合
的な組み合わせデータであり、各データには少なくとも
一部に単語を含んでいることが必要である。また、デー
タベクトルの大きさは一定の値になるように正規化され
ているが、この例では、ベクトルの大きさはベクトルの
各要素の2乗和の平方根で計算され、大きさが10にな
るように正規化されている。データベクトルは、単語辞
書14を用いてデータごとに予め求めて格納しておけ
ば、検索のたびにデータベース15からデータベクトル
を生成しなくてよく、検索動作が高速になる。また、デ
ータベクトルは、データべース15中に含まれている必
要はなく、データベース15中の各データとの対応関係
さえ明確であれば、制御手段13に接続された記憶装置
(図示せず)に格納されていてもよい。また、データベ
クトルは、予め保持しておくのではなく、検索を行う時
に、データベース15中のテキストデータからベクトル
生成手段17によって生成してもよい。こうすることに
より、データベース15の記憶容量を節約できる。
説明する。検索は入力手段11から検索の要求文を入力
することによって開始される。単語抽出手段16は、単
語辞書14を参照しながら入力手段11から入力された
要求文中の単語を抽出する。ベクトル生成手段17は、
単語抽出手段16によって抽出された要求文の単語に対
応する単語ベクトルを単語辞書14から読み出し、入力
された要求文を要求文ベクトルに変換する。この変換
は、抽出された単語ベクトルの和を計算し、そのベクト
ルの和の大きさが一定の値になるように正規化すること
で行われる。この例では、要求文ベクトルの大きさは1
0になるように正規化されている。
クトルとデータベース15中の各データに対応するデー
タベクトルとの距離を計算する。この例では距離計算
は、2つのベクトルの内積計算を行うことによって行わ
れる。要求文ベクトルもデータベクトルも大きさが10
になるように正規化されているので、最も距離が近い場
合には内積値は100になり、最も距離が離れている場
合には内積値は0になる。つまり、2つのベクトルの内
積値は0から100の間の値になり、内積値が大きいほ
ど2つのベクトルの距離が近く意味的に近いことにな
る。ここでは、この内積値を検索の得点にして、それぞ
れのデータには要求文ベクトルとの内積値がベクトル検
索の得点として計算される。例えば、特徴ベクトルが5
次元ベクトルであったとして、要求文ベクトルVが、 V=(3,4,7,5,1) で、データベクトルUが、 U=(1,5,3,8,1) の場合、2つのベクトルの内積値Pは、 P=3×1+4×5+7×3+5×8+1×1=85 となる。つまり、この要求文に対するこのデータの得点
は85点ということになる。
段16で抽出された要求文に含まれる単語を含んでいる
データを、データベース15から探し出す。データベー
ス15中のデータについて単語抽出手段16を用いて、
各データに含まれている単語を抽出し、各データに含ま
れている単語が1つでも要求文に含まれている単語と一
致するデータを検索結果として出力する。例えば、要求
文が「都会の秋の西の空」で、「都会」「秋」「西」
「空」が単語として抽出された場合には、「都会」
「秋」「西」「空」のいずれかの単語を含んでいるデー
タを検索して出力することになる。
を行う際に、データベース15中の各データが含んでい
る単語を記憶しているインデックステーブル10を保持
している場合には、データに含まれている単語を抽出す
るために単語抽出手段16をキーワード検索を行うたび
に用いる必要がなくなり、検索動作が高速になる。デー
タベース15中の各データにデータ番号をつけておき、
インデックステーブル10に、各単語毎にその単語が含
まれているデータのデータ番号を記憶させるか、各デー
タ毎にそのデータを含んでいる単語を記憶させておく。
つまり、各単語毎にインデックステーブル10を作成し
た場合には図2のようになり、各データ毎にインデック
ステーブル10を作成した場合には図3のようになる。
トル検索手段18とキーワード検索手段19の結果に基
づいて各データごとに得点づけを行う。この得点付けと
しては、ベクトル検索手段18では0点から100点の
間で要求文との意味的な類似度の高さに応じて各データ
が得点づけされ、キーワード検索手段19では要求文に
含まれている単語と同じ単語を含んでいるデータを検索
し、一致する単語の数に基づいて、次式のように得点づ
けされる。 (得点)=(一致する単語数)/(要求文の単語数)×
100 ただし、要求文中やデータ中に同一の単語が2回以上現
れる時は、その単語は1つだけ存在するものとして扱
う。このように得点づけすることによって、キーワード
検索についても各データについて0点から100点の間
で得点を与えることができる。つまり、要求文中の単語
を全て含んでいるデータは100点に、1つも含んでい
ないデータは0点になる。例えば、要求文が「都会の秋
の西の空」で、「都会」「秋」「西」「空」の4つの単
語が抽出されていて、データ「都会の街」が「都会」と
「街」を単語として抽出している場合には、「都会」が
両者で一致しているので、このデータの得点Sは、 S=1/4×100=25 のように、25点と計算される。このようにしてベクト
ル検索の得点Pとキーワード検索の得点Sが計算される
と、拡張検索手段20は両者の検索結果の得点を各デー
タごとに加算して、総合得点の高いデータから順に検索
結果として出力手段12に出力する。この検索結果に
は、検索結果のデータと共に総合得点と両方の検索結果
の各得点とを出力してもよい。
による。 St=P+α×S ここで、αは0以上の実数であり、ベクトル検索とキー
ワード検索の重み付けを変化させるようにしておく。α
=1の時は両者の検索結果の得点が1:1で加算され、
0点から200点の間の得点が与えられることになる。
例えば、ベクトル検索の得点が85点で、キーワード検
索の得点が25点の場合には、総合得点は110点にな
る。α=0の場合にはベクトル検索に、α≫1の場合に
はキーワード検索を行うのと同じになる。
ながらユーザが決定しても良く、また、検索を行って得
られた所定順位までのベクトル検索結果の総得点とキー
ワード検索結果の総得点に応じて(例えば両検索結果の
総得点が均等になるように)、αを自動設定してもよ
い。このようにαの大きさを調整することによって、ベ
クトル検索とキーワード検索の度合を調整することがで
きる。このように、両者の検索結果を組み合わせること
によって、両者の検索の不備を補い、検索結果の改善を
行うことができる。
ベクトルを使った検索の両方の特徴を加味した検索結果
を得ることができ、検索結果の改善を行うことができ
る。
示す図である。
である。
例である。
る。
Claims (3)
- 【請求項1】 検索の要求文を入力する入力手段と、 単語を単語ベクトルに対応づけて格納する単語辞書と、 少なくとも単語を含むデータをデータベクトルに対応付
けて格納するデータベースと、 前記単語辞書を用いて前記要求文に含まれている単語を
抽出する単語抽出手段と、 前記単語辞書と前記単語抽出手段とを用いて前記要求文
から要求文ベクトルを生成するベクトル生成手段と、 前記要求文ベクトルと前記データベクトルとの意味的類
似度を前記データごとに求めるベクトル検索手段と、 前記単語抽出手段を用いて前記要求文に含まれている単
語と共通の単語を含む前記データを求めるキーワード検
索手段と、 前記意味的類似度と前記キーワード検索手段で求められ
たデータ中の単語と前記要求文中に含まれる単語との一
致度とに基づいて前記要求文に適合するデータの検索を
行う拡張検索手段と、を備え、 前記拡張検索手段は、前記意味的類似度と前記一致度の
総合得点を重み付けして計算し、総合得点の高いデータ
から順に検索結果として出力する ことを特徴とする検索
装置。 - 【請求項2】 検索の要求文を入力する入力手段と、 単語を単語ベクトルに対応づけて格納する単語辞書と、 少なくとも単語を含むデータを格納するデータベース
と、 前記単語辞書を用いて前記要求文に含まれている単語を
抽出する単語抽出手段と、 前記単語辞書と前記単語抽出手段とを用いて前記要求文
から要求文ベクトルを生成すると共に前記データからデ
ータベクトルを生成するベクトル生成手段と、 前記要求文ベクトルと前記データベクトルとの意味的類
似度を前記データごとに求めるベクトル検索手段と、 前記単語抽出手段を用いて前記要求文に含まれている単
語と共通の単語を含む前記データを求めるキーワード検
索手段と、 前記意味的類似度と前記キーワード検索手段で求められ
たデータ中の単語と前記要求文中に含まれる単語との一
致度とに基づいて前記要求文に適合するデータの検索を
行う拡張検索手段と、を備え、 前記拡張検索手段は、前記意味的類似度と前記一致度の
総合得点を重み付けして計算し、総合得点の高いデータ
から順に検索結果として出力する ことを特徴とする検索
装置。 - 【請求項3】 請求項1または請求項2に記載の検索装
置において、 前記データベースのデータとそのデータに含まれる単語
との関係を記憶したインデックステーブルを備え、 前記キーワード検索手段は、前記単語抽出手段のかわり
に前記インデックステーブルを用いて前記要求文に含ま
れている単語と共通の単語を含む前記データを求めるこ
とを特徴とする検索装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04503997A JP3195752B2 (ja) | 1997-02-28 | 1997-02-28 | 検索装置 |
DE69739889T DE69739889D1 (de) | 1997-02-28 | 1997-12-18 | Wiederauffindungsvorrichtung |
EP97310397A EP0862122B1 (en) | 1997-02-28 | 1997-12-18 | Retrieval apparatus |
US09/002,781 US6175828B1 (en) | 1997-02-28 | 1998-01-05 | Retrieval apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04503997A JP3195752B2 (ja) | 1997-02-28 | 1997-02-28 | 検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10240759A JPH10240759A (ja) | 1998-09-11 |
JP3195752B2 true JP3195752B2 (ja) | 2001-08-06 |
Family
ID=12708227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04503997A Expired - Lifetime JP3195752B2 (ja) | 1997-02-28 | 1997-02-28 | 検索装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6175828B1 (ja) |
EP (1) | EP0862122B1 (ja) |
JP (1) | JP3195752B2 (ja) |
DE (1) | DE69739889D1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10326286A (ja) * | 1997-05-27 | 1998-12-08 | Mitsubishi Electric Corp | 類似検索装置及び類似検索プログラムを記録した記録媒体 |
EP0990998A3 (en) | 1998-09-30 | 2005-04-20 | Canon Kabushiki Kaisha | Information search apparatus and method |
US6493705B1 (en) | 1998-09-30 | 2002-12-10 | Canon Kabushiki Kaisha | Information search apparatus and method, and computer readable memory |
JP3578651B2 (ja) * | 1998-12-04 | 2004-10-20 | 株式会社リコー | 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6424969B1 (en) * | 1999-07-20 | 2002-07-23 | Inmentia, Inc. | System and method for organizing data |
JP3725373B2 (ja) * | 1999-08-04 | 2005-12-07 | 富士通株式会社 | 単語重要度計算装置、文書検索装置、単語重要度計算プログラムを記録したコンピュータ読み取り可能な記録媒体および文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP3730451B2 (ja) * | 1999-08-24 | 2006-01-05 | シャープ株式会社 | 情報提供装置 |
US6751621B1 (en) | 2000-01-27 | 2004-06-15 | Manning & Napier Information Services, Llc. | Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors |
US7912868B2 (en) * | 2000-05-02 | 2011-03-22 | Textwise Llc | Advertisement placement method and system using semantic analysis |
US6687689B1 (en) * | 2000-06-16 | 2004-02-03 | Nusuara Technologies Sdn. Bhd. | System and methods for document retrieval using natural language-based queries |
JP4188543B2 (ja) * | 2000-06-22 | 2008-11-26 | 株式会社メディアクリエイト | 情報提供システム |
US20020120651A1 (en) * | 2000-09-12 | 2002-08-29 | Lingomotors, Inc. | Natural language search method and system for electronic books |
US20030028564A1 (en) * | 2000-12-19 | 2003-02-06 | Lingomotors, Inc. | Natural language method and system for matching and ranking documents in terms of semantic relatedness |
US6944619B2 (en) | 2001-04-12 | 2005-09-13 | Primentia, Inc. | System and method for organizing data |
US20040158561A1 (en) * | 2003-02-04 | 2004-08-12 | Gruenwald Bjorn J. | System and method for translating languages using an intermediate content space |
US7383257B2 (en) * | 2003-05-30 | 2008-06-03 | International Business Machines Corporation | Text explanation for on-line analytic processing events |
US7502779B2 (en) * | 2003-06-05 | 2009-03-10 | International Business Machines Corporation | Semantics-based searching for information in a distributed data processing system |
US7577682B2 (en) * | 2003-07-31 | 2009-08-18 | Sap Ag | Semantic objects |
WO2006133050A2 (en) * | 2005-06-06 | 2006-12-14 | The Regents Of The University Of California | Relationship networks |
JP4878477B2 (ja) * | 2006-01-18 | 2012-02-15 | 富士通株式会社 | 情報検索適切度判定処理プログラムおよびオペレータスキル判定処理プログラム |
JP4922692B2 (ja) * | 2006-07-28 | 2012-04-25 | 富士通株式会社 | 検索クエリー作成装置 |
EP2307951A4 (en) * | 2008-07-29 | 2012-12-19 | Textwise Llc | METHOD AND APPARATUS FOR ASSOCIATING DATA SETS USING SEMANTIC VECTORS AND KEYWORD ANALYSIS |
EP2287749A4 (en) * | 2009-01-23 | 2011-08-03 | Nec Corp | DATA DEVICE RECALL |
CN104375984A (zh) * | 2014-11-21 | 2015-02-25 | 无锡科思电子科技有限公司 | 一种检测网络上传文件中敏感轨迹的方法 |
JP6517537B2 (ja) * | 2015-02-26 | 2019-05-22 | 日本電信電話株式会社 | 単語ベクトル学習装置、自然言語処理装置、方法、及びプログラム |
US20190207946A1 (en) * | 2016-12-20 | 2019-07-04 | Google Inc. | Conditional provision of access by interactive assistant modules |
US11436417B2 (en) | 2017-05-15 | 2022-09-06 | Google Llc | Providing access to user-controlled resources by automated assistants |
US10127227B1 (en) | 2017-05-15 | 2018-11-13 | Google Llc | Providing access to user-controlled resources by automated assistants |
US10915707B2 (en) * | 2017-10-20 | 2021-02-09 | MachineVantage, Inc. | Word replaceability through word vectors |
EP3682345B1 (en) | 2018-08-07 | 2021-11-24 | Google LLC | Assembling and evaluating automated assistant responses for privacy concerns |
EP3706013A1 (de) | 2019-03-08 | 2020-09-09 | Hospitality Digital GmbH | Konzise, zutreffende indexierung |
JP6751188B1 (ja) * | 2019-08-05 | 2020-09-02 | Dmg森精機株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5317507A (en) * | 1990-11-07 | 1994-05-31 | Gallant Stephen I | Method for document retrieval and for word sense disambiguation using neural networks |
JP3460728B2 (ja) | 1992-08-14 | 2003-10-27 | 株式会社リコー | 文書検索方式 |
JP3422541B2 (ja) * | 1992-12-17 | 2003-06-30 | ゼロックス・コーポレーション | キーワードのモデル化方法及び非キーワードhmmの提供方法 |
JP2823761B2 (ja) | 1992-12-24 | 1998-11-11 | シャープ株式会社 | 文書検索装置 |
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
US5604839A (en) * | 1994-07-29 | 1997-02-18 | Microsoft Corporation | Method and system for improving speech recognition through front-end normalization of feature vectors |
JPH096799A (ja) * | 1995-06-19 | 1997-01-10 | Sharp Corp | 文書分類装置及び文書検索装置 |
US5832474A (en) * | 1996-02-26 | 1998-11-03 | Matsushita Electric Industrial Co., Ltd. | Document search and retrieval system with partial match searching of user-drawn annotations |
US5893095A (en) * | 1996-03-29 | 1999-04-06 | Virage, Inc. | Similarity engine for content-based retrieval of images |
US5862211A (en) * | 1997-01-13 | 1999-01-19 | Lucent Technologies Inc. | Automatic simultaneous voice-and-data call setup for remote-site servicing |
US5825855A (en) * | 1997-01-30 | 1998-10-20 | Toshiba America Information Systems, Inc. | Method of recognizing pre-recorded announcements |
-
1997
- 1997-02-28 JP JP04503997A patent/JP3195752B2/ja not_active Expired - Lifetime
- 1997-12-18 EP EP97310397A patent/EP0862122B1/en not_active Expired - Lifetime
- 1997-12-18 DE DE69739889T patent/DE69739889D1/de not_active Expired - Lifetime
-
1998
- 1998-01-05 US US09/002,781 patent/US6175828B1/en not_active Expired - Lifetime
Non-Patent Citations (3)
Title |
---|
芥子,「ベクトル空間モデルに基づくフルテキストサーチシステム」1992年度人工知能学会(第6回)全国大会論文集(▲I▼)pp.343−346(平4−6−24) |
芥子,乾,石鞍「大規模文書データベースからの連想検索」第23回人工知能学会知識データベースシステム研究会資料,pp.105−112,1993(平5−1−21) |
芥子,乾,石鞍「大規模文書データベースからの連想検索」電子情報通信学会技術研究報告(AI92−99),Vol.92,No.426,pp.73−80(平5−1−22) |
Also Published As
Publication number | Publication date |
---|---|
EP0862122B1 (en) | 2010-05-26 |
US6175828B1 (en) | 2001-01-16 |
EP0862122A2 (en) | 1998-09-02 |
JPH10240759A (ja) | 1998-09-11 |
DE69739889D1 (de) | 2010-07-08 |
EP0862122A3 (en) | 2000-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3195752B2 (ja) | 検索装置 | |
JP3040945B2 (ja) | 文書検索装置 | |
JP4467791B2 (ja) | 情報管理及び検索 | |
EP0590858B1 (en) | Method for performing a search of a plurality of documents for similarity to a query | |
EP0965089B1 (en) | Information retrieval utilizing semantic representation of text | |
JP2002520712A (ja) | データ検索システムと方法およびサーチ・エンジンにおけるその使用 | |
US20080222138A1 (en) | Method and Apparatus for Constructing a Link Structure Between Documents | |
CN102955772B (zh) | 一种基于语义的相似度计算方法和装置 | |
JPH03172966A (ja) | 類似文書検索装置 | |
CN113220862A (zh) | 标准问识别方法、装置及计算机设备及存储介质 | |
CN114880447A (zh) | 信息检索方法、装置、设备及存储介质 | |
CN111723179B (zh) | 基于概念图谱的反馈模型信息检索方法、系统及介质 | |
Ha et al. | Utilizing sbert for finding similar questions in community question answering | |
JP3198932B2 (ja) | 文書検索装置 | |
CN113505196B (zh) | 基于词性的文本检索方法、装置、电子设备及存储介质 | |
JP3024045B2 (ja) | 自然言語に基づくデータ検索装置 | |
Kang | Keyword-based document clustering | |
JP4325370B2 (ja) | 文書関連語彙獲得装置及びプログラム | |
JP5418138B2 (ja) | 文書検索システム、情報処理装置およびプログラム | |
JP2000112949A (ja) | 情報判別支援装置及び類似情報判別支援プログラムを記録した記録媒体 | |
CN112182159A (zh) | 一种基于语义表示的个性化检索式对话方法和系统 | |
CN111737413A (zh) | 基于概念网语义的反馈模型信息检索方法、系统及介质 | |
JP3123836B2 (ja) | テキスト型データベース装置 | |
JPH064584A (ja) | 文章検索装置 | |
JP3503506B2 (ja) | 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090601 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100601 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100601 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110601 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120601 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120601 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 12 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |