JP2011186972A - 関連語辞書作成装置、関連語辞書作成方法、プログラム、及び、文書検索システム - Google Patents
関連語辞書作成装置、関連語辞書作成方法、プログラム、及び、文書検索システム Download PDFInfo
- Publication number
- JP2011186972A JP2011186972A JP2010054002A JP2010054002A JP2011186972A JP 2011186972 A JP2011186972 A JP 2011186972A JP 2010054002 A JP2010054002 A JP 2010054002A JP 2010054002 A JP2010054002 A JP 2010054002A JP 2011186972 A JP2011186972 A JP 2011186972A
- Authority
- JP
- Japan
- Prior art keywords
- related word
- information
- document
- word
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】関連語辞書作成装置100は、検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出部101と、上記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成部102と、を備える。
【選択図】図7
Description
検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
上記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を備える。
検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出し、
上記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する方法である。
情報処理装置に、
検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
上記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を実現させるためのプログラムである。
検索語としての単語を受け付ける検索語受付手段と、
上記受け付けた単語に基づいて、複数の文書を検索し、当該検索の結果としての文書の一覧を出力する検索結果出力手段と、
上記出力した文書の一覧からユーザが選択した文書を特定するための文書特定情報を受け付ける文書特定情報受付手段と、
上記受け付けた単語と、上記受け付けた文書特定情報と、を対応付けた関連語基礎情報を記憶する関連語基礎情報記憶手段と、
上記記憶されている関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
上記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を備える。
(構成)
図1に示したように、第1実施形態に係る文書検索システム1は、文書検索装置10と、関連語辞書作成装置20と、を含む。文書検索装置10及び関連語辞書作成装置20は、互いに通信可能に接続されている。また、文書検索装置10と、クライアント装置30と、は、IP(Internet Protocol)網を構成する通信回線NWを介して、互いに通信可能に接続されている。
図2は、上記のように構成された、文書検索システム1の機能と、クライアント装置30の機能と、を表すブロック図である。この機能の少なくとも一部は、文書検索装置10のCPUが後述する図3に示したフローチャートにより表されるプログラムを実行するとともに、関連語辞書作成装置20のCPUが後述する図4に示したフローチャートにより表されるプログラムを実行することにより、実現される。
文書検索装置10の文書情報記憶部12は、複数の文書を予め記憶している。本例では、文書情報記憶部12が記憶する複数の文書は、IP網を介して接続されたウェブサーバから取得され、且つ、HTML(HyperText Markup Language)に従って記述された文書である。なお、文書情報記憶部12が記憶する文書は、他の形式(例えば、文書を作成するアプリケーションプログラムによって定められた形式)に従った文書であってもよい。
次に、上述した文書検索システム1の作動について説明する。
文書検索装置10のCPUは、図3にフローチャートにより示した文書検索処理プログラムを、文書検索装置10の起動時に実行するようになっている。
いま、クライアント装置30のユーザが検索語を入力した場合を想定して説明を続ける。この場合、クライアント装置30は、当該検索語を含む文書検索処理要求を文書検索装置10へ送信する。
ところで、クライアント装置30は、文書検索装置10から検索結果情報を受信し、当該検索結果情報が表す文書の一覧を、出力装置を介して出力する(本例では、ディスプレイに表示させる)。
その後、文書検索装置10は、ステップS101へ戻り、ステップS101〜ステップS104の処理を繰り返し実行する。
いま、取得されたループ用リスト内に組情報が1つ以上存在している場合を想定して説明を続ける。
いま、抽出対象リスト内に組情報が1つ以上存在している場合を想定して説明を続ける。
その後、関連語辞書作成装置20は、ステップS206へ戻り、抽出対象リスト内に組情報が存在しなくなるまで、ステップS206〜ステップS209の処理を繰り返し実行する。
次に、本発明の第2実施形態に係る関連語辞書作成装置について図7を参照しながら説明する。
第2実施形態に係る関連語辞書作成装置100は、
検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出部(関連単語群抽出手段)101と、
上記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成部(関連語辞書情報生成手段)102と、
を備える。
上記実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限られない。
検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
前記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を備える関連語辞書作成装置。
付記1に記載の関連語辞書作成装置であって、
前記関連単語群抽出手段は、同一の文書特定情報と対応付けられた前記単語を前記関連単語群として抽出するように構成された関連語辞書作成装置。
付記1又は付記2に記載の関連語辞書作成装置であって、
前記関連語基礎情報は、前記文書検索システムが、前記単語と、当該単語に基づく前記文書特定情報と、を受け付ける毎に蓄積した、当該単語及び当該文書特定情報の組からなる組情報を含み、
前記関連単語群抽出手段は、同一の組情報が予め設定された閾値数よりも多く存在する場合に、当該組情報に含まれる前記単語を前記関連単語群として抽出するように構成された関連語辞書作成装置。
付記1乃至付記3のいずれか一項に記載の関連語辞書作成装置であって、
前記文書特定情報は、URI(Uniform Resource Identifier)を表す情報である関連語辞書作成装置。
付記1乃至付記3のいずれか一項に記載の関連語辞書作成装置であって、
前記文書特定情報は、ファイルシステムにおけるファイル名を表す情報である関連語辞書作成装置。
検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出し、
前記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する、関連語辞書作成方法。
付記6に記載の関連語辞書作成方法であって、
同一の文書特定情報と対応付けられた前記単語を前記関連単語群として抽出する、関連語辞書作成方法。
付記6又は付記7に記載の関連語辞書作成方法であって、
前記関連語基礎情報は、前記文書検索システムが、前記単語と、当該単語に基づく前記文書特定情報と、を受け付ける毎に蓄積した、当該単語及び当該文書特定情報の組からなる組情報を含み、
同一の組情報が予め設定された閾値数よりも多く存在する場合に、当該組情報に含まれる前記単語を前記関連単語群として抽出する、関連語辞書作成方法。
情報処理装置に、
検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
前記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を実現させるためのプログラム。
付記9に記載のプログラムであって、
前記関連単語群抽出手段は、同一の文書特定情報と対応付けられた前記単語を前記関連単語群として抽出するように構成されたプログラム。
付記9又は付記10に記載のプログラムであって、
前記関連語基礎情報は、前記文書検索システムが、前記単語と、当該単語に基づく前記文書特定情報と、を受け付ける毎に蓄積した、当該単語及び当該文書特定情報の組からなる組情報を含み、
前記関連単語群抽出手段は、同一の組情報が予め設定された閾値数よりも多く存在する場合に、当該組情報に含まれる前記単語を前記関連単語群として抽出するように構成されたプログラム。
検索語としての単語を受け付ける検索語受付手段と、
前記受け付けた単語に基づいて、複数の文書を検索し、当該検索の結果としての文書の一覧を出力する検索結果出力手段と、
前記出力した文書の一覧からユーザが選択した文書を特定するための文書特定情報を受け付ける文書特定情報受付手段と、
前記受け付けた単語と、前記受け付けた文書特定情報と、を対応付けた関連語基礎情報を記憶する関連語基礎情報記憶手段と、
前記記憶されている関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
前記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を備える文書検索システム。
付記12に記載の文書検索システムであって、
前記関連単語群抽出手段は、同一の文書特定情報と対応付けられた前記単語を前記関連単語群として抽出するように構成された文書検索システム。
付記12又は付記13に記載の文書検索システムであって、
前記単語と、当該単語に基づく前記文書特定情報と、が受け付けられる毎に、当該単語及び当該文書特定情報の組からなる組情報を前記関連語基礎情報記憶手段に蓄積するように構成され、
前記関連単語群抽出手段は、同一の組情報が予め設定された閾値数よりも多く存在する場合に、当該組情報に含まれる前記単語を前記関連単語群として抽出するように構成された文書検索システム。
付記12乃至付記14のいずれか一項に記載の文書検索システムであって、
前記検索結果出力手段は、前記受け付けた単語と、前記生成された関連語辞書情報にて当該単語と対応付けられた単語である関連語と、に基づいて、前記複数の文書を検索するように構成された文書検索システム。
10 文書検索装置
11 検索語受付部
12 文書情報記憶部
13 検索結果出力部
14 文書特定情報受付部
15 関連語基礎情報記憶部
20 関連語辞書作成装置
21 関連単語群抽出部
22 関連語辞書情報生成部
23 関連語辞書情報記憶部
30 クライアント装置
31 検索語送信部
32 検索結果受信部
33 文書特定情報送信部
100 関連語辞書作成装置
101 関連単語群抽出部
102 関連語辞書情報生成部
NW 通信回線
Claims (10)
- 検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
前記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を備える関連語辞書作成装置。 - 請求項1に記載の関連語辞書作成装置であって、
前記関連単語群抽出手段は、同一の文書特定情報と対応付けられた前記単語を前記関連単語群として抽出するように構成された関連語辞書作成装置。 - 請求項1又は請求項2に記載の関連語辞書作成装置であって、
前記関連語基礎情報は、前記文書検索システムが、前記単語と、当該単語に基づく前記文書特定情報と、を受け付ける毎に蓄積した、当該単語及び当該文書特定情報の組からなる組情報を含み、
前記関連単語群抽出手段は、同一の組情報が予め設定された閾値数よりも多く存在する場合に、当該組情報に含まれる前記単語を前記関連単語群として抽出するように構成された関連語辞書作成装置。 - 請求項1乃至請求項3のいずれか一項に記載の関連語辞書作成装置であって、
前記文書特定情報は、URI(Uniform Resource Identifier)を表す情報である関連語辞書作成装置。 - 請求項1乃至請求項3のいずれか一項に記載の関連語辞書作成装置であって、
前記文書特定情報は、ファイルシステムにおけるファイル名を表す情報である関連語辞書作成装置。 - 検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出し、
前記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する、関連語辞書作成方法。 - 請求項6に記載の関連語辞書作成方法であって、
同一の文書特定情報と対応付けられた前記単語を前記関連単語群として抽出する、関連語辞書作成方法。 - 情報処理装置に、
検索語としての単語と、文書検索システムが当該検索語に基づいて複数の文書を検索した結果として出力する文書の一覧からユーザが選択した文書を特定するための文書特定情報と、を対応付けた関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
前記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を実現させるためのプログラム。 - 検索語としての単語を受け付ける検索語受付手段と、
前記受け付けた単語に基づいて、複数の文書を検索し、当該検索の結果としての文書の一覧を出力する検索結果出力手段と、
前記出力した文書の一覧からユーザが選択した文書を特定するための文書特定情報を受け付ける文書特定情報受付手段と、
前記受け付けた単語と、前記受け付けた文書特定情報と、を対応付けた関連語基礎情報を記憶する関連語基礎情報記憶手段と、
前記記憶されている関連語基礎情報に基づいて、互いに関連する複数の単語からなる関連単語群を抽出する関連単語群抽出手段と、
前記抽出された関連単語群に含まれる複数の単語を互いに対応付けた関連語辞書情報を生成する関連語辞書情報生成手段と、
を備える文書検索システム。 - 請求項9に記載の文書検索システムであって、
前記検索結果出力手段は、前記受け付けた単語と、前記生成された関連語辞書情報にて当該単語と対応付けられた単語である関連語と、に基づいて、前記複数の文書を検索するように構成された文書検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010054002A JP5636700B2 (ja) | 2010-03-11 | 2010-03-11 | 関連語辞書作成装置、関連語辞書作成方法、プログラム、及び、文書検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010054002A JP5636700B2 (ja) | 2010-03-11 | 2010-03-11 | 関連語辞書作成装置、関連語辞書作成方法、プログラム、及び、文書検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011186972A true JP2011186972A (ja) | 2011-09-22 |
JP5636700B2 JP5636700B2 (ja) | 2014-12-10 |
Family
ID=44793126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010054002A Expired - Fee Related JP5636700B2 (ja) | 2010-03-11 | 2010-03-11 | 関連語辞書作成装置、関連語辞書作成方法、プログラム、及び、文書検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5636700B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020160514A (ja) * | 2019-03-25 | 2020-10-01 | カシオ計算機株式会社 | 検索装置、辞書作成プログラム、辞書データ作成方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005309998A (ja) * | 2004-04-23 | 2005-11-04 | Fujitsu Ltd | コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置 |
JP2008176746A (ja) * | 2007-01-22 | 2008-07-31 | Yafoo Japan Corp | ページ移動操作の履歴情報に基づいてWebページへの参照元のWebページに関する情報を推薦する方法及びサーバ |
JP2008242622A (ja) * | 2007-03-26 | 2008-10-09 | Fujitsu Ltd | 検索候補語句提示装置、検索候補語句提示プログラムおよび検索候補語句提示方法 |
-
2010
- 2010-03-11 JP JP2010054002A patent/JP5636700B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005309998A (ja) * | 2004-04-23 | 2005-11-04 | Fujitsu Ltd | コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置 |
JP2008176746A (ja) * | 2007-01-22 | 2008-07-31 | Yafoo Japan Corp | ページ移動操作の履歴情報に基づいてWebページへの参照元のWebページに関する情報を推薦する方法及びサーバ |
JP2008242622A (ja) * | 2007-03-26 | 2008-10-09 | Fujitsu Ltd | 検索候補語句提示装置、検索候補語句提示プログラムおよび検索候補語句提示方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020160514A (ja) * | 2019-03-25 | 2020-10-01 | カシオ計算機株式会社 | 検索装置、辞書作成プログラム、辞書データ作成方法 |
JP7443667B2 (ja) | 2019-03-25 | 2024-03-06 | カシオ計算機株式会社 | 検索装置、辞書検索プログラム、辞書検索方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5636700B2 (ja) | 2014-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102133951B1 (ko) | 짧은 링크 처리 방법, 디바이스, 및 서버 | |
JP6105094B2 (ja) | アプリケーションへの状態リンクを含む検索結果の生成 | |
JP5742506B2 (ja) | 文書類似度算出装置 | |
CN109815261B (zh) | 全局搜索功能实现及数据实时同步方法、装置及电子设备 | |
KR20120045017A (ko) | 분산형 네트워크에서 다중 키워드 문의들을 효율적으로 프로세싱하기 위한 방법 및 장치 | |
US20140286333A1 (en) | Method and system for local calling via webpage | |
WO2013074514A1 (en) | Providing a client interface for a server-based web application programming interface | |
CN113268955A (zh) | 报文转换的方法和装置 | |
CN102882988A (zh) | 一种获得资源信息的地址信息的方法、装置及设备 | |
CN113761565B (zh) | 数据脱敏方法和装置 | |
CN111797334B (zh) | 一种网址访问方法、装置、电子设备及存储介质 | |
US8738801B2 (en) | Methods and apparatus for updating index information while adding and updating documents in a distributed network | |
JP5636700B2 (ja) | 関連語辞書作成装置、関連語辞書作成方法、プログラム、及び、文書検索システム | |
JP2013054602A (ja) | グラフパターンマッチングシステムおよびグラフパターンマッチング方法 | |
JP5747128B2 (ja) | マイクロブログベースのドキュメントファイルの共有の方法及び装置 | |
JP2013214159A (ja) | ログ管理方法、ログ管理システムおよび情報処理装置 | |
JP5644558B2 (ja) | 文書関連度算出装置 | |
JP2011170813A (ja) | Webサービス記憶プログラム、および、Webサービス記憶装置 | |
CN106933826B (zh) | 数据预处理方法及装置 | |
US8381172B2 (en) | Method, apparatus, mobile terminal and computer program product for employing a form engine as a script engine | |
JP5856905B2 (ja) | 主題抽出装置およびそのプログラム | |
JP5640578B2 (ja) | 文書処理装置、文書処理方法、及び、プログラム | |
JP2011248819A (ja) | コンテンツ管理システム、コンテンツ管理方法、情報処理装置、及び、プログラム | |
JP5673051B2 (ja) | 文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム | |
US20100153970A1 (en) | Method, apparatus and computer program product for providing multi-dimensional manipulations to context models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20120717 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131216 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140430 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140730 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141007 |
|
LAPS | Cancellation because of no payment of annual fees |