JPH1145274A - 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体Info
- Publication number
- JPH1145274A JPH1145274A JP9202035A JP20203597A JPH1145274A JP H1145274 A JPH1145274 A JP H1145274A JP 9202035 A JP9202035 A JP 9202035A JP 20203597 A JP20203597 A JP 20203597A JP H1145274 A JPH1145274 A JP H1145274A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- search
- occurrence
- words
- synonyms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
や、多数の類義語を有する単語がキーワードである場合
でも、利用者の意図する検索処理を効率的に行い、か
つ、過剰検索を回避できるようにすること。 【解決手段】 検索式、検索文または検索用キーワード
群で表現された検索条件を入力し(S301)、検索条
件を構成するキーワードを抽出し(S302)、抽出し
たキーワードが複数存在する場合(S303)、抽出し
た複数のキーワード毎に類義語を求めた後(S30
4)、単語間の共起性に基づいて、求めた類義語から共
起性の低い類義語を除外して(S305)、残りの類義
語を用いてキーワードを拡張し(S306)、抽出した
キーワードが複数存在しない場合(S303)、抽出し
たキーワードの類義語を求め(S307)、求めた類義
語を用いてキーワードを拡張する(S306)。
Description
語がキーワードである場合や、多数の類義語を有する単
語がキーワードである場合に発生する過剰検索を回避可
能な単語間の共起性を用いたキーワードの拡張方法およ
びその方法の各工程をコンピュータに実行させるための
プログラムを記録したコンピュータ読み取り可能な記録
媒体に関する。
として記録・保存されていた文書についても、電子化さ
れた情報として取り扱うことが一般的となり、大量の電
子化された文書がデータベースに蓄積されることとなっ
ている。
されていくに従って、大量の文書の中から所望の文書を
容易に探し出すことができる検索技術が重要となってく
る。特に、誰もがコンピュータを用いて作業を行う今日
にあっては、特殊な手法を用いることなく、コンピュー
タの初心者であっても簡単に所望の文書を検索できるよ
うな検索システムを構築することが重要なポイントとな
る。
ることも重要なポイントである。例えば、検索精度の向
上を図るための方法として、検索式、検索文または検索
用キーワード群で表現された検索条件から、該検索条件
を構成するキーワードを抽出し、抽出したキーワードの
類義語を用いてキーワードの拡張を行い、拡張したキー
ワードを用いて検索処理を行う検索方法が知られてい
る。
来の技術によれば、類義語を用いてキーワードを拡張す
ることにより、検索精度の向上を図っているものの、多
義性を有する単語がキーワードである場合や、多数の類
義語を有する単語がキーワードである場合には、利用者
の意図しない検索処理が行われたり、キーワードの拡張
過剰によって過剰検索が発生するという問題点があっ
た。
ら見た場合には、検索精度の向上を図っているものの、
利用者側から見た場合には、必ずしも検索精度の向上に
繋がらないという問題点があった。特に、利用者の意図
しない検索処理が行われると、検索結果から目的とする
情報を捜し出す(検索する)必要があり、作業性が悪
い、使い勝手が悪いという不具合や、検索精度に対する
信頼性が損なわれるという不具合が発生する。また、過
剰検索が行われると、処理時間が長くなるという不具合
が発生する。
て、多義性を有する単語がキーワードである場合や、多
数の類義語を有する単語がキーワードである場合でも、
利用者の意図する検索処理を効率的に行い、かつ、過剰
検索を回避できるようにすることを目的とする。
め、請求項1の単語間の共起性を用いたキーワードの拡
張方法は、検索式、検索文または検索用キーワード群で
表現された検索条件を入力し、前記検索条件を構成する
キーワードを抽出する第1の工程と、前記第1の工程で
抽出したキーワードの類義語を求める第2の工程と、前
記第1の工程で抽出したキーワードが複数存在する場合
に、単語間の共起性に基づいて前記第2の工程で求めた
類義語から共起性の低い類義語を除外する第3の工程
と、前記第2の工程で求めた類義語または第3の工程で
前記共起性の低い類義語を除外した後の類義語を用い
て、前記第1の工程で抽出したキーワードを拡張する第
4の工程と、を含むものである。
キーワードの拡張方法は、検索式、検索文または検索用
キーワード群で表現された検索条件を入力し、前記検索
条件を構成するキーワードを抽出する第1の工程と、前
記第1の工程で抽出したキーワードの類義語を求める第
2の工程と、前記第1の工程で抽出したキーワードが複
数存在する場合に、単語間の共起性に基づいて前記第2
の工程で求めた類義語から共起性の低い類義語を除外す
る第3の工程と、前記第2の工程で求めた類義語または
第3の工程で前記共起性の低い類義語を除外した後の類
義語から、キーワードの拡張に使用する類義語を選択す
る第4の工程と、前記第4の工程で選択された類義語を
用いて、前記第1の工程で抽出したキーワードを拡張す
る第5の工程と、を含むものである。
キーワードの拡張方法は、請求項2記載の単語間の共起
性を用いたキーワードの拡張方法において、前記第4の
工程が、さらに任意の単語を類義語として追加可能であ
るものである。
可能な記録媒体は、前記請求項1〜3に記載のいずれか
一つの単語間の共起性を用いたキーワードの拡張方法の
各工程をコンピュータに実行させるためのプログラムを
記録したものである。
ーワードの拡張方法およびその方法の各工程をコンピュ
ータに実行させるためのプログラムを記録したコンピュ
ータ読み取り可能な記録媒体の一実施の形態について、
添付の図面を参照しつつ詳細に説明する。
用いたキーワードの拡張方法を実現するためのコンピュ
ータのハードウエア構成を示すブロック構成図である。
図1において、100はCPUを、101はROMを、
102はRAMを、103はベクトル空間法を用いた検
索処理を行う検索ソフト104を格納したハードディス
ク装置を、105はキーボードやマウス等の入力装置
を、106はCRT等のディスプレイを、107は検索
対象文書を格納した文書DBを、108は上記各部を接
続するためのバスを示している。
は、さらに、フロッピーディスクドライブ装置や、CD
−ROMドライブ装置、ネットワークを介して情報の送
受信を行うための通信装置等を接続することができる。
いたキーワードの拡張方法による具体的な処理につい
て、(1)ベクトル空間法を用いた検索処理(2)単語
間の共起性を用いたキーワードの拡張処理の順で詳細に
説明していくことにする。
略ブロック図である。この図2を用いて検索ソフト10
4によるベクトル空間法を用いた検索処理を説明するこ
とにより、後に説明する単語間の共起性を用いたキーワ
ードの拡張処理の前提となる技術を説明する。
る検索処理を可能とするために、文書DB107に格納
された検索対象文書を転置ファイル205に登録する処
理およびベクトル空間法による検索処理を行うものであ
る。
る処理 検索対象文書を転置ファイル205に登録する処理は、
図2に示す自然言語処理モジュール200およびデータ
ベース・ビルド・コンポーネント204によって行われ
る。
B107から検索対象文書を入力し、入力した検索対象
文書について、フォーマットの認識処理や、品詞情報を
格納した辞書201および各単語の係り受け等を解析す
るための文法辞書202を用いて形態素解析,構文解析
等の解析処理を行う。そして、解析結果に基づいて、検
索対象文書を複数のセンテンスからなるサブドキュメン
トに区切り、サブドキュメントから名詞句を抽出した
後,サブドキュメント毎の名詞句リストからなるドキュ
メント・セット203を生成する。
04は、自然言語処理モジュール200で生成した検索
対象文書のドキュメント・セット203を入力し、入力
したドキュメント・セット203の各名詞句について、
サブドキュメント中の出現頻度,文書DB107全体に
おける分布等の統計情報を求め、求めた名詞句毎の統計
情報を用いてサブドキュメントをベクター表現に変換す
る。この処理をドキュメント・セット203中の全ての
サブドキュメントについて行い、変換したサブドキュメ
ントのベクター表現に基づいて、検索対象文書のベクタ
ー表現を生成し、転置ファイル205に登録する。
索対象文書がベクター表現に変換されて転置ファイル2
05に登録される。これにより、ベクトル空間法による
検索処理を行うことができるようになる。
処理モジュール200,クエリー・ビルド・コンポーネ
ント207および検索エンジン209によって行われ
る。
置105から検索条件206を入力し、入力した検索条
件206について、品詞情報を格納した辞書201およ
び各単語の係り受け等を解析するための文法辞書202
を用いて形態素解析,構文解析等の解析処理を行い、検
索条件206を構成するキーワードを抽出する。そし
て、抽出したキーワードの類義語や関連語をシソーラス
辞書210から抽出し、抽出した類義語を用いてキーワ
ードを拡張した後、キーワードからなるドキュメント・
セット203を生成する。
は、自然言語処理モジュール200から検索条件206
のドキュメント・セット203を入力し、入力したドキ
ュメント・セット203中の各キーワードについて、ド
キュメント・セット203中の出現頻度,転置ファイル
205全体における分布等の統計情報を求め、求めた統
計情報を用いて各キーワードをベクター表現に変換した
クエリー・ドキュメント208をそれぞれ生成する。
H社のCLARIT)209は、クエリー・ビルド・コ
ンポーネント207で生成したクエリー・ドキュメント
208毎に、転置ファイル205中の検索対象文書のベ
クター表現との類似度を求めた後、検索対象文書にクエ
リー・ドキュメント208との類似度に応じたスコアリ
ングを行い、判定閾値を超えるスコアの検索対象文書を
検索結果として出力する。
の拡張処理 続いて、単語間の共起性を用いたキーワードの拡張処理
について説明する。この単語間の共起性を用いたキーワ
ードの拡張処理は、上述したベクトル空間法による検索
処理を行う際に、自然言語処理モジュール200におい
て行われるものである。すなわち、自然言語処理モジュ
ール200において、検索条件206から抽出したキー
ワードの類義語や関連語をシソーラス辞書210から抽
出し、抽出した類義語を用いてキーワードを拡張する際
に実行される。
ドの拡張処理を示すフローチャートである。検索ソフト
104は、入力装置105から検索条件206を入力す
ると(S301)、自然言語処理モジュール200にお
いて、入力した検索条件206を解析して、検索条件2
06を構成するキーワードを抽出する処理を行う(S3
02)。ここで、検索条件206は、検索式、検索文ま
たは検索用キーワード群のいずれで表現されたものであ
っても良い。
するキーワードを抽出した後、抽出したキーワードが複
数存在するか否かを判定する(S303)。
は、抽出したキーワード毎に該当する類義語や関連語を
シソーラス辞書210から抽出する処理を行う(S30
4)。
や関連語を抽出すると、単語間の共起性に基づいて、抽
出した類義語や関連語から共起性の低い類義語や関連語
を除外する処理を行う(S305)。
詳細に説明する。入力した検索条件206が、例えば
「乗用車の新モデル」という検索文である場合、ステッ
プS302において、「乗用車」および「モデル」が検
索条件206のキーワードとして抽出される。そして、
ステップS303において、キーワードである「乗用
車」および「モデル」のそれぞれについて類義語や関連
語が抽出される。
義語や関連語を抽出した結果の一例を示す説明図であ
る。図4から明らかなように、キーワード「モデル」に
ついて多数の類義語や関連語が抽出されている。そこ
で、ステップS305において、もう一つのキーワード
である「乗用車」との共起性が低い類義語や関連語を除
外する処理が行われる。
や関連語から「乗用車」との共起性が低いものを除外し
た結果の一例を示す説明図である。図4および図5から
明らかなように、「乗用車」との共起性が低い「美
人」,「モード」等の類義語や関連語が除外されている
ことがわかる。もし、検索条件206が「水着のモデ
ル」であったならば、図5で除外されている類義語や関
連語は異なるものとなる。
や関連語を除外した後、図3のステップS306に進
み、共起性の低い類義語や関連語を除外した後の類義語
や関連語を用いてキーワードを拡張する処理を行う。
206から抽出したキーワードが複数存在しない場合
は、ステップS307に進み、抽出したキーワードに該
当する類義語や関連語をシソーラス辞書210から抽出
する処理を行った後、抽出した類義語や関連語でキーワ
ードを拡張する処理を行う(S306)。
ーワードは、図2を用いて説明したように、ドキュメン
ト・セット203としてクエリー・ビルド・コンポーネ
ント207に出力される。
07で抽出した類義語や関連語またはステップS305
で共起性の低い類義語や関連語を除外した後の類義語や
関連語でそのままキーワードの拡張を行うことにしてい
るが、キーワードの拡張を行う前に、キーワードの拡張
に使用する類義語や関連語を選択することができるよう
にすることもできる。
連語を選択するための選択画面の一例を示す説明図であ
る。図6において、600は検索条件入力ウィンドウ
を、601は検索条件入力欄を、602は類義語・関連
語選択ウィンドウをそれぞれ示している。
入力すると、図3のステップS305までの処理が行わ
れ、キーワードの拡張のために抽出された類義語や関連
語が類義語・関連語選択ウィンドウ602に表示され
る。図6では、図5と同様に、キーワード「モデル」に
ついて共起性の低い類義語や関連語を除外した後の類義
語や関連語が類義語・関連語選択ウィンドウ602に表
示されている。
ウィンドウ602中の類義語や関連語から、ある類義語
や関連語をキーワードの拡張に使用するという指定また
は使用しないという指定を行うことにより、キーワード
の拡張に用いる類義語や関連語を選択することができ
る。また、類義語・関連語選択ウィンドウ602中に所
望の類義語や関連語が存在しない場合には、ユーザの好
みに応じた任意の単語を類義語や関連語として追加する
ことができる。
性を用いたキーワードの拡張方法によれば、検索条件2
06から抽出したキーワードが複数存在する場合に、単
語間の共起性に基づいてシソーラス辞書210から抽出
した類義語や関連語から共起性の低い類義語や関連語を
除外するため、多義性を有する単語がキーワードである
場合や、多数の類義語を有する単語がキーワードである
場合でも、利用者の意図する検索処理を効率的に行うこ
とができ、かつ、過剰検索を回避することができる。
たコンピュータをネットワークに接続することにより、
検索サーバとして用いることができる。したがって、こ
の場合は、ネットワークに接続されたクライアントから
検索条件206を入力することになる。
いて説明したように、ベクトル空間法による検索処理を
前提にして説明したが、ベクトル空間法による検索処理
に代えて、ブーリアン検索による検索処理を行うことが
できることは明らかである。
共起性を用いたキーワードの拡張方法は、予め用意され
たプログラム(検索ソフト104)を図1に示したパー
ソナルコンピュータやワークステーション等のコンピュ
ータで実行することによって実現される。このプログラ
ムは、ハードディスク,フロッピーディスク,CD−R
OM,MO,DVD等のコンピュータで読み取り可能な
記録媒体に記録され、コンピュータによって記録媒体か
ら読み出されることによって実行される。また、このプ
ログラムは、上記記録媒体を介して、またはネットワー
クを介して配布することができる。
共起性を用いたキーワードの拡張方法(請求項1)によ
れば、検索式、検索文または検索用キーワード群で表現
された検索条件を入力し、検索条件を構成するキーワー
ドを抽出する第1の工程と、第1の工程で抽出したキー
ワードの類義語を求める第2の工程と、第1の工程で抽
出したキーワードが複数存在する場合に、単語間の共起
性に基づいて第2の工程で求めた類義語から共起性の低
い類義語を除外する第3の工程と、第2の工程で求めた
類義語または第3の工程で共起性の低い類義語を除外し
た後の類義語を用いて、第1の工程で抽出したキーワー
ドを拡張する第4の工程と、を含むため、多義性を有す
る単語がキーワードである場合や、多数の類義語を有す
る単語がキーワードである場合でも、利用者の意図する
検索処理を効率的に行うことができ、かつ、過剰検索を
回避することができる。
ーワードの拡張方法(請求項2)によれば、検索式、検
索文または検索用キーワード群で表現された検索条件を
入力し、検索条件を構成するキーワードを抽出する第1
の工程と、第1の工程で抽出したキーワードの類義語を
求める第2の工程と、第1の工程で抽出したキーワード
が複数存在する場合に、単語間の共起性に基づいて第2
の工程で求めた類義語から共起性の低い類義語を除外す
る第3の工程と、第2の工程で求めた類義語または第3
の工程で共起性の低い類義語を除外した後の類義語か
ら、キーワードの拡張に使用する類義語を選択する第4
の工程と、第4の工程で選択された類義語を用いて、第
1の工程で抽出したキーワードを拡張する第5の工程
と、を含むため、多義性を有する単語がキーワードであ
る場合や、多数の類義語を有する単語がキーワードであ
る場合でも、利用者の意図する検索処理を効率的に行う
ことができ、かつ、過剰検索を回避することができる。
ーワードの拡張方法(請求項3)によれば、請求項2記
載の単語間の共起性を用いたキーワードの拡張方法にお
いて、第4の工程は、さらに任意の単語を類義語として
追加可能であるため、さらに利用者の意図する検索処理
を効率的に行うことができる。
な記録媒体(請求項4)によれば、請求項1〜3に記載
のいずれか一つの単語間の共起性を用いたキーワードの
拡張方法の各工程をコンピュータに実行させるためのプ
ログラムを記録したため、このプログラムをコンピュー
タに実行させることにより、多義性を有する単語がキー
ワードである場合や、多数の類義語を有する単語がキー
ワードである場合でも、利用者の意図する検索処理を効
率的に行うことができ、かつ、過剰検索を回避すること
ができる。
ードの拡張方法を実現するためのコンピュータのハード
ウエア構成を示すブロック構成図である。
ードの拡張方法において、検索ソフトの処理を示す概略
ブロック図である。
ードの拡張方法において、単語間の共起性を用いたキー
ワードの拡張処理を示すフローチャートである。
ードの拡張方法において、キーワードである「モデル」
の類義語や関連語を抽出した結果の一例を示す説明図で
ある。
「乗用車」との共起性が低いものを除外した結果の一例
を示す説明図である。
ードの拡張方法において、キーワードの拡張前に類義語
や関連語を選択するための選択画面の一例を示す説明図
である。
Claims (4)
- 【請求項1】 検索式、検索文または検索用キーワード
群で表現された検索条件を入力し、前記検索条件を構成
するキーワードを抽出する第1の工程と、 前記第1の工程で抽出したキーワードの類義語を求める
第2の工程と、 前記第1の工程で抽出したキーワードが複数存在する場
合に、単語間の共起性に基づいて前記第2の工程で求め
た類義語から共起性の低い類義語を除外する第3の工程
と、 前記第2の工程で求めた類義語または第3の工程で前記
共起性の低い類義語を除外した後の類義語を用いて、前
記第1の工程で抽出したキーワードを拡張する第4の工
程と、 を含むことを特徴とする単語間の共起性を用いたキーワ
ードの拡張方法。 - 【請求項2】 検索式、検索文または検索用キーワード
群で表現された検索条件を入力し、前記検索条件を構成
するキーワードを抽出する第1の工程と、 前記第1の工程で抽出したキーワードの類義語を求める
第2の工程と、 前記第1の工程で抽出したキーワードが複数存在する場
合に、単語間の共起性に基づいて前記第2の工程で求め
た類義語から共起性の低い類義語を除外する第3の工程
と、 前記第2の工程で求めた類義語または第3の工程で前記
共起性の低い類義語を除外した後の類義語から、キーワ
ードの拡張に使用する類義語を選択する第4の工程と、 前記第4の工程で選択された類義語を用いて、前記第1
の工程で抽出したキーワードを拡張する第5の工程と、 を含むことを特徴とする単語間の共起性を用いたキーワ
ードの拡張方法。 - 【請求項3】 前記第4の工程は、さらに任意の単語を
類義語として追加可能であることを特徴とする請求項2
記載の単語間の共起性を用いたキーワードの拡張方法。 - 【請求項4】 前記請求項1〜3に記載のいずれか一つ
の単語間の共起性を用いたキーワードの拡張方法の各工
程をコンピュータに実行させるためのプログラムを記録
したことを特徴とするコンピュータ読み取り可能な記録
媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20203597A JP4065346B2 (ja) | 1997-07-28 | 1997-07-28 | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20203597A JP4065346B2 (ja) | 1997-07-28 | 1997-07-28 | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1145274A true JPH1145274A (ja) | 1999-02-16 |
JP4065346B2 JP4065346B2 (ja) | 2008-03-26 |
Family
ID=16450861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20203597A Expired - Fee Related JP4065346B2 (ja) | 1997-07-28 | 1997-07-28 | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4065346B2 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004280259A (ja) * | 2003-03-13 | 2004-10-07 | National Institute Of Information & Communication Technology | 検索装置 |
WO2007105642A1 (ja) * | 2006-03-10 | 2007-09-20 | National Institute Of Information And Communications Technology | 多義語による情報検索装置及びプログラム |
JP2008518345A (ja) * | 2004-10-28 | 2008-05-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | データ処理システム及びデータ処理方法 |
JP2009093429A (ja) * | 2007-10-09 | 2009-04-30 | Kodansha Ltd | 検索システム及び検索方法 |
JP2010033197A (ja) * | 2008-07-25 | 2010-02-12 | Internatl Business Mach Corp <Ibm> | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム |
JP2010524066A (ja) * | 2007-04-06 | 2010-07-15 | アリババ グループ ホールディング リミテッド | 相関キーワードを処理する方法、装置、及びシステム |
JP2013073626A (ja) * | 2011-09-27 | 2013-04-22 | Nhn Business Platform Corp | コンセプトキーワード拡張データセットを利用した検索方法、装置、及びコンピュータ読み取り可能な記録媒体 |
JP2016126567A (ja) * | 2015-01-05 | 2016-07-11 | 日本放送協会 | コンテンツ推薦装置、及びプログラム |
JP2017078919A (ja) * | 2015-10-19 | 2017-04-27 | 日本電信電話株式会社 | 単語拡張装置、分類装置、機械学習装置、方法、及びプログラム |
WO2018088040A1 (ja) * | 2016-11-14 | 2018-05-17 | オムロン株式会社 | マッチング装置、マッチング方法及びプログラム |
CN110795615A (zh) * | 2019-10-28 | 2020-02-14 | 百度在线网络技术(北京)有限公司 | 搜索方法、装置、设备和存储介质 |
-
1997
- 1997-07-28 JP JP20203597A patent/JP4065346B2/ja not_active Expired - Fee Related
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004280259A (ja) * | 2003-03-13 | 2004-10-07 | National Institute Of Information & Communication Technology | 検索装置 |
JP2008518345A (ja) * | 2004-10-28 | 2008-05-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | データ処理システム及びデータ処理方法 |
WO2007105642A1 (ja) * | 2006-03-10 | 2007-09-20 | National Institute Of Information And Communications Technology | 多義語による情報検索装置及びプログラム |
US8626742B2 (en) | 2007-04-06 | 2014-01-07 | Alibaba Group Holding Limited | Method, apparatus and system of processing correlated keywords |
US9275100B2 (en) | 2007-04-06 | 2016-03-01 | Alibaba Group Holding Limited | Method, apparatus and system of processing correlated keywords |
JP2010524066A (ja) * | 2007-04-06 | 2010-07-15 | アリババ グループ ホールディング リミテッド | 相関キーワードを処理する方法、装置、及びシステム |
JP2009093429A (ja) * | 2007-10-09 | 2009-04-30 | Kodansha Ltd | 検索システム及び検索方法 |
US9195744B2 (en) | 2008-07-25 | 2015-11-24 | International Business Machines Corporation | Protecting information in search queries |
JP2010033197A (ja) * | 2008-07-25 | 2010-02-12 | Internatl Business Mach Corp <Ibm> | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム |
JP2013073626A (ja) * | 2011-09-27 | 2013-04-22 | Nhn Business Platform Corp | コンセプトキーワード拡張データセットを利用した検索方法、装置、及びコンピュータ読み取り可能な記録媒体 |
US9330135B2 (en) | 2011-09-27 | 2016-05-03 | Naver Corporation | Method, apparatus and computer readable recording medium for a search using extension keywords |
JP2016126567A (ja) * | 2015-01-05 | 2016-07-11 | 日本放送協会 | コンテンツ推薦装置、及びプログラム |
JP2017078919A (ja) * | 2015-10-19 | 2017-04-27 | 日本電信電話株式会社 | 単語拡張装置、分類装置、機械学習装置、方法、及びプログラム |
WO2018088040A1 (ja) * | 2016-11-14 | 2018-05-17 | オムロン株式会社 | マッチング装置、マッチング方法及びプログラム |
JP2018081377A (ja) * | 2016-11-14 | 2018-05-24 | オムロン株式会社 | マッチング装置、マッチング方法及びプログラム |
CN110795615A (zh) * | 2019-10-28 | 2020-02-14 | 百度在线网络技术(北京)有限公司 | 搜索方法、装置、设备和存储介质 |
CN110795615B (zh) * | 2019-10-28 | 2022-08-09 | 百度在线网络技术(北京)有限公司 | 搜索方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4065346B2 (ja) | 2008-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7272558B1 (en) | Speech recognition training method for audio and video file indexing on a search engine | |
US10296584B2 (en) | Semantic textual analysis | |
JP3691844B2 (ja) | 文書処理方法 | |
JPH1145241A (ja) | かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2001043236A (ja) | 類似語抽出方法、文書検索方法及びこれらに用いる装置 | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
CN102214189B (zh) | 基于数据挖掘获取词用法知识的系统及方法 | |
JP3173411B2 (ja) | 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体 | |
JP4065346B2 (ja) | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3596210B2 (ja) | 関連語辞書作成装置 | |
JP2003167898A (ja) | 情報検索システム | |
JPH1145268A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2894301B2 (ja) | 文脈情報を用いた文書検索方法および装置 | |
JP2005202924A (ja) | 対訳判断装置、方法及びプログラム | |
JPH1145252A (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2003303194A (ja) | 慣用句辞書作成装置、検索用インデックス作成装置、文書検索装置、それらの方法、プログラム及び記録媒体 | |
JP3851712B2 (ja) | 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH1145254A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2002132789A (ja) | 文書検索方法 | |
JPH1145266A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH09185632A (ja) | 情報検索・編集方法及び装置 | |
JP2003108582A (ja) | 類義語抽出方法および文書検索装置 | |
JP4138048B2 (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3006526B2 (ja) | 類似文書検索方法および類似文書検索装置 | |
JPH1145249A (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070605 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070911 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080104 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140111 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |