JPH1145274A - 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH1145274A
JPH1145274A JP9202035A JP20203597A JPH1145274A JP H1145274 A JPH1145274 A JP H1145274A JP 9202035 A JP9202035 A JP 9202035A JP 20203597 A JP20203597 A JP 20203597A JP H1145274 A JPH1145274 A JP H1145274A
Authority
JP
Japan
Prior art keywords
keyword
search
occurrence
words
synonyms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9202035A
Other languages
English (en)
Other versions
JP4065346B2 (ja
Inventor
Sumio Fujita
澄男 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP20203597A priority Critical patent/JP4065346B2/ja
Publication of JPH1145274A publication Critical patent/JPH1145274A/ja
Application granted granted Critical
Publication of JP4065346B2 publication Critical patent/JP4065346B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 多義性を有する単語がキーワードである場合
や、多数の類義語を有する単語がキーワードである場合
でも、利用者の意図する検索処理を効率的に行い、か
つ、過剰検索を回避できるようにすること。 【解決手段】 検索式、検索文または検索用キーワード
群で表現された検索条件を入力し(S301)、検索条
件を構成するキーワードを抽出し(S302)、抽出し
たキーワードが複数存在する場合(S303)、抽出し
た複数のキーワード毎に類義語を求めた後(S30
4)、単語間の共起性に基づいて、求めた類義語から共
起性の低い類義語を除外して(S305)、残りの類義
語を用いてキーワードを拡張し(S306)、抽出した
キーワードが複数存在しない場合(S303)、抽出し
たキーワードの類義語を求め(S307)、求めた類義
語を用いてキーワードを拡張する(S306)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、多義性を有する単
語がキーワードである場合や、多数の類義語を有する単
語がキーワードである場合に発生する過剰検索を回避可
能な単語間の共起性を用いたキーワードの拡張方法およ
びその方法の各工程をコンピュータに実行させるための
プログラムを記録したコンピュータ読み取り可能な記録
媒体に関する。
【0002】
【従来の技術】コンピュータの発達に伴って、紙を媒体
として記録・保存されていた文書についても、電子化さ
れた情報として取り扱うことが一般的となり、大量の電
子化された文書がデータベースに蓄積されることとなっ
ている。
【0003】ところで、大量の電子化された文書が蓄積
されていくに従って、大量の文書の中から所望の文書を
容易に探し出すことができる検索技術が重要となってく
る。特に、誰もがコンピュータを用いて作業を行う今日
にあっては、特殊な手法を用いることなく、コンピュー
タの初心者であっても簡単に所望の文書を検索できるよ
うな検索システムを構築することが重要なポイントとな
る。
【0004】また、簡単な操作で精度の高い検索を行え
ることも重要なポイントである。例えば、検索精度の向
上を図るための方法として、検索式、検索文または検索
用キーワード群で表現された検索条件から、該検索条件
を構成するキーワードを抽出し、抽出したキーワードの
類義語を用いてキーワードの拡張を行い、拡張したキー
ワードを用いて検索処理を行う検索方法が知られてい
る。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の技術によれば、類義語を用いてキーワードを拡張す
ることにより、検索精度の向上を図っているものの、多
義性を有する単語がキーワードである場合や、多数の類
義語を有する単語がキーワードである場合には、利用者
の意図しない検索処理が行われたり、キーワードの拡張
過剰によって過剰検索が発生するという問題点があっ
た。
【0006】換言すれば、検索処理を行うシステム側か
ら見た場合には、検索精度の向上を図っているものの、
利用者側から見た場合には、必ずしも検索精度の向上に
繋がらないという問題点があった。特に、利用者の意図
しない検索処理が行われると、検索結果から目的とする
情報を捜し出す(検索する)必要があり、作業性が悪
い、使い勝手が悪いという不具合や、検索精度に対する
信頼性が損なわれるという不具合が発生する。また、過
剰検索が行われると、処理時間が長くなるという不具合
が発生する。
【0007】本発明は上記に鑑みてなされたものであっ
て、多義性を有する単語がキーワードである場合や、多
数の類義語を有する単語がキーワードである場合でも、
利用者の意図する検索処理を効率的に行い、かつ、過剰
検索を回避できるようにすることを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の単語間の共起性を用いたキーワードの拡
張方法は、検索式、検索文または検索用キーワード群で
表現された検索条件を入力し、前記検索条件を構成する
キーワードを抽出する第1の工程と、前記第1の工程で
抽出したキーワードの類義語を求める第2の工程と、前
記第1の工程で抽出したキーワードが複数存在する場合
に、単語間の共起性に基づいて前記第2の工程で求めた
類義語から共起性の低い類義語を除外する第3の工程
と、前記第2の工程で求めた類義語または第3の工程で
前記共起性の低い類義語を除外した後の類義語を用い
て、前記第1の工程で抽出したキーワードを拡張する第
4の工程と、を含むものである。
【0009】また、請求項2の単語間の共起性を用いた
キーワードの拡張方法は、検索式、検索文または検索用
キーワード群で表現された検索条件を入力し、前記検索
条件を構成するキーワードを抽出する第1の工程と、前
記第1の工程で抽出したキーワードの類義語を求める第
2の工程と、前記第1の工程で抽出したキーワードが複
数存在する場合に、単語間の共起性に基づいて前記第2
の工程で求めた類義語から共起性の低い類義語を除外す
る第3の工程と、前記第2の工程で求めた類義語または
第3の工程で前記共起性の低い類義語を除外した後の類
義語から、キーワードの拡張に使用する類義語を選択す
る第4の工程と、前記第4の工程で選択された類義語を
用いて、前記第1の工程で抽出したキーワードを拡張す
る第5の工程と、を含むものである。
【0010】また、請求項3の単語間の共起性を用いた
キーワードの拡張方法は、請求項2記載の単語間の共起
性を用いたキーワードの拡張方法において、前記第4の
工程が、さらに任意の単語を類義語として追加可能であ
るものである。
【0011】さらに、請求項4のコンピュータ読み取り
可能な記録媒体は、前記請求項1〜3に記載のいずれか
一つの単語間の共起性を用いたキーワードの拡張方法の
各工程をコンピュータに実行させるためのプログラムを
記録したものである。
【0012】
【発明の実施の形態】以下、単語間の共起性を用いたキ
ーワードの拡張方法およびその方法の各工程をコンピュ
ータに実行させるためのプログラムを記録したコンピュ
ータ読み取り可能な記録媒体の一実施の形態について、
添付の図面を参照しつつ詳細に説明する。
【0013】図1は、本実施の形態の単語間の共起性を
用いたキーワードの拡張方法を実現するためのコンピュ
ータのハードウエア構成を示すブロック構成図である。
図1において、100はCPUを、101はROMを、
102はRAMを、103はベクトル空間法を用いた検
索処理を行う検索ソフト104を格納したハードディス
ク装置を、105はキーボードやマウス等の入力装置
を、106はCRT等のディスプレイを、107は検索
対象文書を格納した文書DBを、108は上記各部を接
続するためのバスを示している。
【0014】なお、図示は省略するが、バス108に
は、さらに、フロッピーディスクドライブ装置や、CD
−ROMドライブ装置、ネットワークを介して情報の送
受信を行うための通信装置等を接続することができる。
【0015】次に、本実施の形態の単語間の共起性を用
いたキーワードの拡張方法による具体的な処理につい
て、(1)ベクトル空間法を用いた検索処理(2)単語
間の共起性を用いたキーワードの拡張処理の順で詳細に
説明していくことにする。
【0016】(1)ベクトル空間法を用いた検索処理 図2は、図1に示した検索ソフト104の処理を示す概
略ブロック図である。この図2を用いて検索ソフト10
4によるベクトル空間法を用いた検索処理を説明するこ
とにより、後に説明する単語間の共起性を用いたキーワ
ードの拡張処理の前提となる技術を説明する。
【0017】検索ソフト104は、ベクトル空間法によ
る検索処理を可能とするために、文書DB107に格納
された検索対象文書を転置ファイル205に登録する処
理およびベクトル空間法による検索処理を行うものであ
る。
【0018】a.検索対象文書を転置ファイルに登録す
る処理 検索対象文書を転置ファイル205に登録する処理は、
図2に示す自然言語処理モジュール200およびデータ
ベース・ビルド・コンポーネント204によって行われ
る。
【0019】自然言語処理モジュール200は、文書D
B107から検索対象文書を入力し、入力した検索対象
文書について、フォーマットの認識処理や、品詞情報を
格納した辞書201および各単語の係り受け等を解析す
るための文法辞書202を用いて形態素解析,構文解析
等の解析処理を行う。そして、解析結果に基づいて、検
索対象文書を複数のセンテンスからなるサブドキュメン
トに区切り、サブドキュメントから名詞句を抽出した
後,サブドキュメント毎の名詞句リストからなるドキュ
メント・セット203を生成する。
【0020】データベース・ビルド・コンポーネント2
04は、自然言語処理モジュール200で生成した検索
対象文書のドキュメント・セット203を入力し、入力
したドキュメント・セット203の各名詞句について、
サブドキュメント中の出現頻度,文書DB107全体に
おける分布等の統計情報を求め、求めた名詞句毎の統計
情報を用いてサブドキュメントをベクター表現に変換す
る。この処理をドキュメント・セット203中の全ての
サブドキュメントについて行い、変換したサブドキュメ
ントのベクター表現に基づいて、検索対象文書のベクタ
ー表現を生成し、転置ファイル205に登録する。
【0021】このようにして、文書DB107中の各検
索対象文書がベクター表現に変換されて転置ファイル2
05に登録される。これにより、ベクトル空間法による
検索処理を行うことができるようになる。
【0022】b.ベクトル空間法による検索処理 ベクトル空間法による検索処理は、図2に示す自然言語
処理モジュール200,クエリー・ビルド・コンポーネ
ント207および検索エンジン209によって行われ
る。
【0023】自然言語処理モジュール200は、入力装
置105から検索条件206を入力し、入力した検索条
件206について、品詞情報を格納した辞書201およ
び各単語の係り受け等を解析するための文法辞書202
を用いて形態素解析,構文解析等の解析処理を行い、検
索条件206を構成するキーワードを抽出する。そし
て、抽出したキーワードの類義語や関連語をシソーラス
辞書210から抽出し、抽出した類義語を用いてキーワ
ードを拡張した後、キーワードからなるドキュメント・
セット203を生成する。
【0024】クエリー・ビルド・コンポーネント207
は、自然言語処理モジュール200から検索条件206
のドキュメント・セット203を入力し、入力したドキ
ュメント・セット203中の各キーワードについて、ド
キュメント・セット203中の出現頻度,転置ファイル
205全体における分布等の統計情報を求め、求めた統
計情報を用いて各キーワードをベクター表現に変換した
クエリー・ドキュメント208をそれぞれ生成する。
【0025】検索エンジン(例えば、CLARITEC
H社のCLARIT)209は、クエリー・ビルド・コ
ンポーネント207で生成したクエリー・ドキュメント
208毎に、転置ファイル205中の検索対象文書のベ
クター表現との類似度を求めた後、検索対象文書にクエ
リー・ドキュメント208との類似度に応じたスコアリ
ングを行い、判定閾値を超えるスコアの検索対象文書を
検索結果として出力する。
【0026】(2)単語間の共起性を用いたキーワード
の拡張処理 続いて、単語間の共起性を用いたキーワードの拡張処理
について説明する。この単語間の共起性を用いたキーワ
ードの拡張処理は、上述したベクトル空間法による検索
処理を行う際に、自然言語処理モジュール200におい
て行われるものである。すなわち、自然言語処理モジュ
ール200において、検索条件206から抽出したキー
ワードの類義語や関連語をシソーラス辞書210から抽
出し、抽出した類義語を用いてキーワードを拡張する際
に実行される。
【0027】図3は、単語間の共起性を用いたキーワー
ドの拡張処理を示すフローチャートである。検索ソフト
104は、入力装置105から検索条件206を入力す
ると(S301)、自然言語処理モジュール200にお
いて、入力した検索条件206を解析して、検索条件2
06を構成するキーワードを抽出する処理を行う(S3
02)。ここで、検索条件206は、検索式、検索文ま
たは検索用キーワード群のいずれで表現されたものであ
っても良い。
【0028】ステップS302で検索条件206を構成
するキーワードを抽出した後、抽出したキーワードが複
数存在するか否かを判定する(S303)。
【0029】抽出したキーワードが複数存在する場合に
は、抽出したキーワード毎に該当する類義語や関連語を
シソーラス辞書210から抽出する処理を行う(S30
4)。
【0030】そして、シソーラス辞書210から類義語
や関連語を抽出すると、単語間の共起性に基づいて、抽
出した類義語や関連語から共起性の低い類義語や関連語
を除外する処理を行う(S305)。
【0031】ここで、ステップS305における処理を
詳細に説明する。入力した検索条件206が、例えば
「乗用車の新モデル」という検索文である場合、ステッ
プS302において、「乗用車」および「モデル」が検
索条件206のキーワードとして抽出される。そして、
ステップS303において、キーワードである「乗用
車」および「モデル」のそれぞれについて類義語や関連
語が抽出される。
【0032】図4は、キーワードである「モデル」の類
義語や関連語を抽出した結果の一例を示す説明図であ
る。図4から明らかなように、キーワード「モデル」に
ついて多数の類義語や関連語が抽出されている。そこ
で、ステップS305において、もう一つのキーワード
である「乗用車」との共起性が低い類義語や関連語を除
外する処理が行われる。
【0033】図5は、図4に示した「モデル」の類義語
や関連語から「乗用車」との共起性が低いものを除外し
た結果の一例を示す説明図である。図4および図5から
明らかなように、「乗用車」との共起性が低い「美
人」,「モード」等の類義語や関連語が除外されている
ことがわかる。もし、検索条件206が「水着のモデ
ル」であったならば、図5で除外されている類義語や関
連語は異なるものとなる。
【0034】上述したようにして、共起性の低い類義語
や関連語を除外した後、図3のステップS306に進
み、共起性の低い類義語や関連語を除外した後の類義語
や関連語を用いてキーワードを拡張する処理を行う。
【0035】一方、ステップS303において検索条件
206から抽出したキーワードが複数存在しない場合
は、ステップS307に進み、抽出したキーワードに該
当する類義語や関連語をシソーラス辞書210から抽出
する処理を行った後、抽出した類義語や関連語でキーワ
ードを拡張する処理を行う(S306)。
【0036】そして、ステップS306で拡張されたキ
ーワードは、図2を用いて説明したように、ドキュメン
ト・セット203としてクエリー・ビルド・コンポーネ
ント207に出力される。
【0037】なお、上記説明においては、ステップS3
07で抽出した類義語や関連語またはステップS305
で共起性の低い類義語や関連語を除外した後の類義語や
関連語でそのままキーワードの拡張を行うことにしてい
るが、キーワードの拡張を行う前に、キーワードの拡張
に使用する類義語や関連語を選択することができるよう
にすることもできる。
【0038】図6は、キーワードの拡張前に類義語や関
連語を選択するための選択画面の一例を示す説明図であ
る。図6において、600は検索条件入力ウィンドウ
を、601は検索条件入力欄を、602は類義語・関連
語選択ウィンドウをそれぞれ示している。
【0039】検索条件入力欄601に検索条件206を
入力すると、図3のステップS305までの処理が行わ
れ、キーワードの拡張のために抽出された類義語や関連
語が類義語・関連語選択ウィンドウ602に表示され
る。図6では、図5と同様に、キーワード「モデル」に
ついて共起性の低い類義語や関連語を除外した後の類義
語や関連語が類義語・関連語選択ウィンドウ602に表
示されている。
【0040】ユーザは、表示された類義語・関連語選択
ウィンドウ602中の類義語や関連語から、ある類義語
や関連語をキーワードの拡張に使用するという指定また
は使用しないという指定を行うことにより、キーワード
の拡張に用いる類義語や関連語を選択することができ
る。また、類義語・関連語選択ウィンドウ602中に所
望の類義語や関連語が存在しない場合には、ユーザの好
みに応じた任意の単語を類義語や関連語として追加する
ことができる。
【0041】このように、本実施の形態の単語間の共起
性を用いたキーワードの拡張方法によれば、検索条件2
06から抽出したキーワードが複数存在する場合に、単
語間の共起性に基づいてシソーラス辞書210から抽出
した類義語や関連語から共起性の低い類義語や関連語を
除外するため、多義性を有する単語がキーワードである
場合や、多数の類義語を有する単語がキーワードである
場合でも、利用者の意図する検索処理を効率的に行うこ
とができ、かつ、過剰検索を回避することができる。
【0042】なお、本実施の形態において、図1に示し
たコンピュータをネットワークに接続することにより、
検索サーバとして用いることができる。したがって、こ
の場合は、ネットワークに接続されたクライアントから
検索条件206を入力することになる。
【0043】また、本実施の形態においては、図2を用
いて説明したように、ベクトル空間法による検索処理を
前提にして説明したが、ベクトル空間法による検索処理
に代えて、ブーリアン検索による検索処理を行うことが
できることは明らかである。
【0044】さらに、本実施の形態で説明した単語間の
共起性を用いたキーワードの拡張方法は、予め用意され
たプログラム(検索ソフト104)を図1に示したパー
ソナルコンピュータやワークステーション等のコンピュ
ータで実行することによって実現される。このプログラ
ムは、ハードディスク,フロッピーディスク,CD−R
OM,MO,DVD等のコンピュータで読み取り可能な
記録媒体に記録され、コンピュータによって記録媒体か
ら読み出されることによって実行される。また、このプ
ログラムは、上記記録媒体を介して、またはネットワー
クを介して配布することができる。
【0045】
【発明の効果】以上説明したように、本発明の単語間の
共起性を用いたキーワードの拡張方法(請求項1)によ
れば、検索式、検索文または検索用キーワード群で表現
された検索条件を入力し、検索条件を構成するキーワー
ドを抽出する第1の工程と、第1の工程で抽出したキー
ワードの類義語を求める第2の工程と、第1の工程で抽
出したキーワードが複数存在する場合に、単語間の共起
性に基づいて第2の工程で求めた類義語から共起性の低
い類義語を除外する第3の工程と、第2の工程で求めた
類義語または第3の工程で共起性の低い類義語を除外し
た後の類義語を用いて、第1の工程で抽出したキーワー
ドを拡張する第4の工程と、を含むため、多義性を有す
る単語がキーワードである場合や、多数の類義語を有す
る単語がキーワードである場合でも、利用者の意図する
検索処理を効率的に行うことができ、かつ、過剰検索を
回避することができる。
【0046】また、本発明の単語間の共起性を用いたキ
ーワードの拡張方法(請求項2)によれば、検索式、検
索文または検索用キーワード群で表現された検索条件を
入力し、検索条件を構成するキーワードを抽出する第1
の工程と、第1の工程で抽出したキーワードの類義語を
求める第2の工程と、第1の工程で抽出したキーワード
が複数存在する場合に、単語間の共起性に基づいて第2
の工程で求めた類義語から共起性の低い類義語を除外す
る第3の工程と、第2の工程で求めた類義語または第3
の工程で共起性の低い類義語を除外した後の類義語か
ら、キーワードの拡張に使用する類義語を選択する第4
の工程と、第4の工程で選択された類義語を用いて、第
1の工程で抽出したキーワードを拡張する第5の工程
と、を含むため、多義性を有する単語がキーワードであ
る場合や、多数の類義語を有する単語がキーワードであ
る場合でも、利用者の意図する検索処理を効率的に行う
ことができ、かつ、過剰検索を回避することができる。
【0047】また、本発明の単語間の共起性を用いたキ
ーワードの拡張方法(請求項3)によれば、請求項2記
載の単語間の共起性を用いたキーワードの拡張方法にお
いて、第4の工程は、さらに任意の単語を類義語として
追加可能であるため、さらに利用者の意図する検索処理
を効率的に行うことができる。
【0048】また、本発明のコンピュータ読み取り可能
な記録媒体(請求項4)によれば、請求項1〜3に記載
のいずれか一つの単語間の共起性を用いたキーワードの
拡張方法の各工程をコンピュータに実行させるためのプ
ログラムを記録したため、このプログラムをコンピュー
タに実行させることにより、多義性を有する単語がキー
ワードである場合や、多数の類義語を有する単語がキー
ワードである場合でも、利用者の意図する検索処理を効
率的に行うことができ、かつ、過剰検索を回避すること
ができる。
【図面の簡単な説明】
【図1】本実施の形態の単語間の共起性を用いたキーワ
ードの拡張方法を実現するためのコンピュータのハード
ウエア構成を示すブロック構成図である。
【図2】本実施の形態の単語間の共起性を用いたキーワ
ードの拡張方法において、検索ソフトの処理を示す概略
ブロック図である。
【図3】本実施の形態の単語間の共起性を用いたキーワ
ードの拡張方法において、単語間の共起性を用いたキー
ワードの拡張処理を示すフローチャートである。
【図4】本実施の形態の単語間の共起性を用いたキーワ
ードの拡張方法において、キーワードである「モデル」
の類義語や関連語を抽出した結果の一例を示す説明図で
ある。
【図5】図4に示した「モデル」の類義語や関連語から
「乗用車」との共起性が低いものを除外した結果の一例
を示す説明図である。
【図6】本実施の形態の単語間の共起性を用いたキーワ
ードの拡張方法において、キーワードの拡張前に類義語
や関連語を選択するための選択画面の一例を示す説明図
である。
【符号の説明】
100 CPU 101 ROM 102 RAM 103 ハードディスク装置 104 検索ソフト 105 入力装置 106 ディスプレイ 107 文書DB 108 バス 200 自然言語処理モジュール 201 辞書 202 文法辞書 203 ドキュメント・セット 204 データベース・ビルド・コンポーネント 205 転置ファイル 206 検索条件 207 クエリー・ビルド・コンポーネント 208 クエリー・ドキュメント 209 検索エンジン 210 シソーラス辞書 600 検索条件入力ウィンドウ 601 検索条件入力欄 602 類義語・関連語選択ウィンドウ

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 検索式、検索文または検索用キーワード
    群で表現された検索条件を入力し、前記検索条件を構成
    するキーワードを抽出する第1の工程と、 前記第1の工程で抽出したキーワードの類義語を求める
    第2の工程と、 前記第1の工程で抽出したキーワードが複数存在する場
    合に、単語間の共起性に基づいて前記第2の工程で求め
    た類義語から共起性の低い類義語を除外する第3の工程
    と、 前記第2の工程で求めた類義語または第3の工程で前記
    共起性の低い類義語を除外した後の類義語を用いて、前
    記第1の工程で抽出したキーワードを拡張する第4の工
    程と、 を含むことを特徴とする単語間の共起性を用いたキーワ
    ードの拡張方法。
  2. 【請求項2】 検索式、検索文または検索用キーワード
    群で表現された検索条件を入力し、前記検索条件を構成
    するキーワードを抽出する第1の工程と、 前記第1の工程で抽出したキーワードの類義語を求める
    第2の工程と、 前記第1の工程で抽出したキーワードが複数存在する場
    合に、単語間の共起性に基づいて前記第2の工程で求め
    た類義語から共起性の低い類義語を除外する第3の工程
    と、 前記第2の工程で求めた類義語または第3の工程で前記
    共起性の低い類義語を除外した後の類義語から、キーワ
    ードの拡張に使用する類義語を選択する第4の工程と、 前記第4の工程で選択された類義語を用いて、前記第1
    の工程で抽出したキーワードを拡張する第5の工程と、 を含むことを特徴とする単語間の共起性を用いたキーワ
    ードの拡張方法。
  3. 【請求項3】 前記第4の工程は、さらに任意の単語を
    類義語として追加可能であることを特徴とする請求項2
    記載の単語間の共起性を用いたキーワードの拡張方法。
  4. 【請求項4】 前記請求項1〜3に記載のいずれか一つ
    の単語間の共起性を用いたキーワードの拡張方法の各工
    程をコンピュータに実行させるためのプログラムを記録
    したことを特徴とするコンピュータ読み取り可能な記録
    媒体。
JP20203597A 1997-07-28 1997-07-28 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4065346B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20203597A JP4065346B2 (ja) 1997-07-28 1997-07-28 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20203597A JP4065346B2 (ja) 1997-07-28 1997-07-28 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH1145274A true JPH1145274A (ja) 1999-02-16
JP4065346B2 JP4065346B2 (ja) 2008-03-26

Family

ID=16450861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20203597A Expired - Fee Related JP4065346B2 (ja) 1997-07-28 1997-07-28 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4065346B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004280259A (ja) * 2003-03-13 2004-10-07 National Institute Of Information & Communication Technology 検索装置
WO2007105642A1 (ja) * 2006-03-10 2007-09-20 National Institute Of Information And Communications Technology 多義語による情報検索装置及びプログラム
JP2008518345A (ja) * 2004-10-28 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ データ処理システム及びデータ処理方法
JP2009093429A (ja) * 2007-10-09 2009-04-30 Kodansha Ltd 検索システム及び検索方法
JP2010033197A (ja) * 2008-07-25 2010-02-12 Internatl Business Mach Corp <Ibm> 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム
JP2010524066A (ja) * 2007-04-06 2010-07-15 アリババ グループ ホールディング リミテッド 相関キーワードを処理する方法、装置、及びシステム
JP2013073626A (ja) * 2011-09-27 2013-04-22 Nhn Business Platform Corp コンセプトキーワード拡張データセットを利用した検索方法、装置、及びコンピュータ読み取り可能な記録媒体
JP2016126567A (ja) * 2015-01-05 2016-07-11 日本放送協会 コンテンツ推薦装置、及びプログラム
JP2017078919A (ja) * 2015-10-19 2017-04-27 日本電信電話株式会社 単語拡張装置、分類装置、機械学習装置、方法、及びプログラム
WO2018088040A1 (ja) * 2016-11-14 2018-05-17 オムロン株式会社 マッチング装置、マッチング方法及びプログラム
CN110795615A (zh) * 2019-10-28 2020-02-14 百度在线网络技术(北京)有限公司 搜索方法、装置、设备和存储介质

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004280259A (ja) * 2003-03-13 2004-10-07 National Institute Of Information & Communication Technology 検索装置
JP2008518345A (ja) * 2004-10-28 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ データ処理システム及びデータ処理方法
WO2007105642A1 (ja) * 2006-03-10 2007-09-20 National Institute Of Information And Communications Technology 多義語による情報検索装置及びプログラム
US8626742B2 (en) 2007-04-06 2014-01-07 Alibaba Group Holding Limited Method, apparatus and system of processing correlated keywords
US9275100B2 (en) 2007-04-06 2016-03-01 Alibaba Group Holding Limited Method, apparatus and system of processing correlated keywords
JP2010524066A (ja) * 2007-04-06 2010-07-15 アリババ グループ ホールディング リミテッド 相関キーワードを処理する方法、装置、及びシステム
JP2009093429A (ja) * 2007-10-09 2009-04-30 Kodansha Ltd 検索システム及び検索方法
US9195744B2 (en) 2008-07-25 2015-11-24 International Business Machines Corporation Protecting information in search queries
JP2010033197A (ja) * 2008-07-25 2010-02-12 Internatl Business Mach Corp <Ibm> 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム
JP2013073626A (ja) * 2011-09-27 2013-04-22 Nhn Business Platform Corp コンセプトキーワード拡張データセットを利用した検索方法、装置、及びコンピュータ読み取り可能な記録媒体
US9330135B2 (en) 2011-09-27 2016-05-03 Naver Corporation Method, apparatus and computer readable recording medium for a search using extension keywords
JP2016126567A (ja) * 2015-01-05 2016-07-11 日本放送協会 コンテンツ推薦装置、及びプログラム
JP2017078919A (ja) * 2015-10-19 2017-04-27 日本電信電話株式会社 単語拡張装置、分類装置、機械学習装置、方法、及びプログラム
WO2018088040A1 (ja) * 2016-11-14 2018-05-17 オムロン株式会社 マッチング装置、マッチング方法及びプログラム
JP2018081377A (ja) * 2016-11-14 2018-05-24 オムロン株式会社 マッチング装置、マッチング方法及びプログラム
CN110795615A (zh) * 2019-10-28 2020-02-14 百度在线网络技术(北京)有限公司 搜索方法、装置、设备和存储介质
CN110795615B (zh) * 2019-10-28 2022-08-09 百度在线网络技术(北京)有限公司 搜索方法、装置、设备和存储介质

Also Published As

Publication number Publication date
JP4065346B2 (ja) 2008-03-26

Similar Documents

Publication Publication Date Title
US7272558B1 (en) Speech recognition training method for audio and video file indexing on a search engine
US10296584B2 (en) Semantic textual analysis
JP3691844B2 (ja) 文書処理方法
JPH1145241A (ja) かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001043236A (ja) 類似語抽出方法、文書検索方法及びこれらに用いる装置
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
CN102214189B (zh) 基于数据挖掘获取词用法知识的系统及方法
JP3173411B2 (ja) 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体
JP4065346B2 (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3596210B2 (ja) 関連語辞書作成装置
JP2003167898A (ja) 情報検索システム
JPH1145268A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2894301B2 (ja) 文脈情報を用いた文書検索方法および装置
JP2005202924A (ja) 対訳判断装置、方法及びプログラム
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003303194A (ja) 慣用句辞書作成装置、検索用インデックス作成装置、文書検索装置、それらの方法、プログラム及び記録媒体
JP3851712B2 (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002132789A (ja) 文書検索方法
JPH1145266A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH09185632A (ja) 情報検索・編集方法及び装置
JP2003108582A (ja) 類義語抽出方法および文書検索装置
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3006526B2 (ja) 類似文書検索方法および類似文書検索装置
JPH1145249A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070911

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080104

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140111

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees