JP6334491B2 - 概念ベース生成装置、概念検索装置、方法、及びプログラム - Google Patents
概念ベース生成装置、概念検索装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6334491B2 JP6334491B2 JP2015197646A JP2015197646A JP6334491B2 JP 6334491 B2 JP6334491 B2 JP 6334491B2 JP 2015197646 A JP2015197646 A JP 2015197646A JP 2015197646 A JP2015197646 A JP 2015197646A JP 6334491 B2 JP6334491 B2 JP 6334491B2
- Authority
- JP
- Japan
- Prior art keywords
- concept
- search
- search target
- word
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
以下の非特許文献1では、コーパスから、単語と該単語の概念を表す単語概念ベクトルとの組の集合である単語概念ベースを生成する。各検索対象文書に対し、該検索対象文書中の単語の、単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索対象文書の概念ベクトルである検索対象文書概念ベクトルを生成する。検索クエリに対し、該検索クエリ中の単語の、単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索クエリの概念ベクトルである検索クエリ概念ベクトルを生成し、各検索対象文書に対し、該検索クエリ概念ベクトルと、該検索対象文書の概念ベクトルとの類似度を算出する。検索結果として、類似度の降順にランキングした検索対象文書を表示する。あるいは、ある閾値以上の類似度をもつ検索対象文書を表示する。
本発明の実施の形態の学習手段は、検索対象文書Xを、対応する検索クエリのそれぞれを包含するように更新する。更新後の検索対象文書X中の単語の集合は、対応する検索クエリp中の単語の集合を包含する。したがって、検索対象文書概念ベース生成手段において、検索対象文書X中の単語の概念ベクトルを合成して得られる検索対象文書概念ベクトルは、対応する検索クエリp中の単語の概念ベクトルを合成して得られる検索クエリ概念ベクトル(この概念ベクトルは検索対象文書概念ベース生成手段において生成するわけではない)の方へ、更新前と比べて近づく。検索手段において、対応する検索クエリpに概念的に近い新規の検索クエリgが入力されたとき、新規検索クエリgの概念ベクトルは、対応する検索クエリpの概念ベクトルと近い。このため、検索対象文書Xの概念ベクトルは、新規検索クエリgの概念ベクトルの方へ、更新前と比べて近づく。これにより、新規検索クエリgに対し、概念的に適合する検索対象文書Xとの類似度が、更新前と比べ高くなる。
本発明の実施の形態に係る概念検索装置の構成について説明する。図1は、本発明の請求項3の概念検索装置の構成例である。図1に示すように、本発明の実施の形態に係る概念検索装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この概念検索装置100は、機能的には図1に示すように入力手段10と、演算手段20と、出力手段40とを備えている。
各単語の単語概念ベクトルは長さ1に正規化されたd次元ベクトルであり、概念的に近い単語の概念ベクトルは、近くに配置されている。
20 演算手段
22 学習手段
24 更新後検索対象文書集合データベース
26 単語概念ベース
28 検索対象文書概念ベース生成手段
30 検索対象文書概念ベース
32 検索手段
40 出力手段
100 概念検索装置
Claims (7)
- 単語と該単語の概念を表す単語概念ベクトルとの組の集合である単語概念ベースと、
検索対象となる文書である検索対象文書の集合Aと、
検索クエリと、該検索クエリに概念的に適合する前記集合A中の検索対象文書である正解文書の集合との、組の集合Bを入力とし、前記集合B中の各正解文書に対し、前記集合Bにおいて該正解文書に対応づけられている検索クエリのそれぞれを、該正解文書に連結することにより、前記集合A中の該正解文書を更新する学習手段と、
前記集合A中の各検索対象文書に対し、該検索対象文書中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索対象文書の概念ベクトルである検索対象文書概念ベクトルを生成し、該検索対象文書と前記検索対象文書概念ベクトルとの組の集合を格納する検索対象文書概念ベースを生成する検索対象文書概念ベース生成手段と、
を含むことを特徴とする概念ベース生成装置。 - 単語と該単語の概念を表す単語概念ベクトルとの組の集合である単語概念ベースと、
検索対象となる文書である検索対象文書の集合Aであって、かつ検索クエリと、該検索クエリに概念的に適合する前記集合A中の検索対象文書である正解文書の集合との、組の集合B中の各正解文書に対し、前記集合Bにおいて該正解文書に対応づけられている検索クエリのそれぞれを、該正解文書に連結することにより該正解文書を更新された前記集合A中の各検索対象文書に対し、該検索対象文書中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより生成された、該検索対象文書の概念ベクトルである検索対象文書概念ベクトルと、該検索対象文書との組の集合を格納する検索対象文書概念ベースと、
新規の検索クエリに対し、該検索クエリ中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索クエリの概念ベクトルである検索クエリ概念ベクトルを生成し、前記検索対象文書概念ベース中の各検索対象文書に対し、該検索クエリ概念ベクトルと、該検索対象文書の概念ベクトルとの類似度を算出する検索手段と、
を含むことを特徴とする概念検索装置。 - 単語と該単語の概念を表す単語概念ベクトルとの組の集合である単語概念ベースと、
検索対象となる文書である検索対象文書の集合Aと、
検索クエリと、該検索クエリに概念的に適合する前記集合A中の検索対象文書である正解文書の集合との、組の集合Bを入力とし、前記集合B中の各正解文書に対し、前記集合Bにおいて該正解文書に対応づけられている検索クエリのそれぞれを、該正解文書に連結することにより、前記集合A中の該正解文書を更新する学習手段と、
前記集合A中の各検索対象文書に対し、該検索対象文書中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索対象文書の概念ベクトルである検索対象文書概念ベクトルを生成し、該検索対象文書と前記検索対象文書概念ベクトルとの組の集合を格納する検索対象文書概念ベースを生成する検索対象文書概念ベース生成手段と、
新規の検索クエリに対し、該検索クエリ中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索クエリの概念ベクトルである検索クエリ概念ベクトルを生成し、前記検索対象文書概念ベース中の各検索対象文書に対し、該検索クエリ概念ベクトルと、該検索対象文書の概念ベクトルとの類似度を算出する検索手段と、
を含むことを特徴とする概念検索装置。 - 単語と該単語の概念を表す単語概念ベクトルとの組の集合である単語概念ベース、検索対象となる文書である検索対象文書の集合A、学習手段、及び検索対象文書概念ベース生成手段を含む概念ベース生成装置における概念ベース生成方法であって、
前記学習手段が、検索クエリと、該検索クエリに概念的に適合する前記集合A中の検索対象文書である正解文書の集合との、組の集合Bを入力とし、前記集合B中の各正解文書に対し、前記集合Bにおいて該正解文書に対応づけられている検索クエリのそれぞれを、該正解文書に連結することにより、前記集合A中の該正解文書を更新するステップと、
前記検索対象文書概念ベース生成手段が、前記集合A中の各検索対象文書に対し、該検索対象文書中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索対象文書の概念ベクトルである検索対象文書概念ベクトルを生成し、該検索対象文書と前記検索対象文書概念ベクトルとの組の集合を格納する検索対象文書概念ベースを生成するステップと、
を含むことを特徴とする概念ベース生成方法。 - 単語と該単語の概念を表す単語概念ベクトルとの組の集合である単語概念ベースと、検索対象となる文書である検索対象文書の集合Aであって、かつ検索クエリと、該検索クエリに概念的に適合する前記集合A中の検索対象文書である正解文書の集合との、組の集合B中の各正解文書に対し、前記集合Bにおいて該正解文書に対応づけられている検索クエリのそれぞれを、該正解文書に連結することにより該正解文書を更新された前記集合A中の各検索対象文書に対し、該検索対象文書中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより生成された、該検索対象文書の概念ベクトルである検索対象文書概念ベクトルと、該検索対象文書との組の集合を格納する検索対象文書概念ベースと、検索手段とを含む概念検索装置における概念検索方法であって、
前記検索手段が、新規の検索クエリに対し、該検索クエリ中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索クエリの概念ベクトルである検索クエリ概念ベクトルを生成し、前記検索対象文書概念ベース中の各検索対象文書に対し、該検索クエリ概念ベクトルと、該検索対象文書の概念ベクトルとの類似度を算出するステップ
を含むことを特徴とする概念検索方法。 - 単語と該単語の概念を表す単語概念ベクトルとの組の集合である単語概念ベース、検索対象となる文書である検索対象文書の集合A、学習手段、検索対象文書概念ベース生成手段、及び検索手段を含む概念検索装置における概念検索方法であって、
前記学習手段が、検索クエリと、該検索クエリに概念的に適合する前記集合A中の検索対象文書である正解文書の集合との、組の集合Bを入力とし、前記集合B中の各正解文書に対し、前記集合Bにおいて該正解文書に対応づけられている検索クエリのそれぞれを、該正解文書に連結することにより、前記集合A中の該正解文書を更新するステップと、
前記検索対象文書概念ベース生成手段が、前記集合A中の各検索対象文書に対し、該検索対象文書中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索対象文書の概念ベクトルである検索対象文書概念ベクトルを生成し、該検索対象文書と前記検索対象文書概念ベクトルとの組の集合を格納する検索対象文書概念ベースを生成するステップと、
前記検索手段が、新規の検索クエリに対し、該検索クエリ中の単語の、前記単語概念ベースにおける対応する単語概念ベクトルを合成することにより、該検索クエリの概念ベクトルである検索クエリ概念ベクトルを生成し、前記検索対象文書概念ベース中の各検索対象文書に対し、該検索クエリ概念ベクトルと、該検索対象文書の概念ベクトルとの類似度を算出するステップと、
を含むことを特徴とする概念検索方法。 - コンピュータを、請求項1記載の概念ベース生成装置若しくは請求項2〜請求項3の何れか1項記載の概念検索装置の各手段として機能させるための、又はコンピュータに、請求項4記載の概念ベース生成方法若しくは請求項5〜請求項6の何れか1項記載の概念検索方法の各ステップを実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015197646A JP6334491B2 (ja) | 2015-10-05 | 2015-10-05 | 概念ベース生成装置、概念検索装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015197646A JP6334491B2 (ja) | 2015-10-05 | 2015-10-05 | 概念ベース生成装置、概念検索装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017072884A JP2017072884A (ja) | 2017-04-13 |
JP6334491B2 true JP6334491B2 (ja) | 2018-05-30 |
Family
ID=58537688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015197646A Active JP6334491B2 (ja) | 2015-10-05 | 2015-10-05 | 概念ベース生成装置、概念検索装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6334491B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL137305A (en) * | 2000-07-13 | 2005-08-31 | Clicksoftware Technologies Ld | Method and system for sharing knowledge |
JP2004070636A (ja) * | 2002-08-06 | 2004-03-04 | Mitsubishi Electric Corp | 概念検索装置 |
JP4711761B2 (ja) * | 2005-07-08 | 2011-06-29 | 株式会社ジャストシステム | データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体 |
-
2015
- 2015-10-05 JP JP2015197646A patent/JP6334491B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017072884A (ja) | 2017-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109408526B (zh) | Sql语句生成方法、装置、计算机设备及存储介质 | |
JP5661813B2 (ja) | セマンティックオブジェクトの特徴付けおよび検索 | |
JP6722615B2 (ja) | クエリクラスタリング装置、方法、及びプログラム | |
US8478704B2 (en) | Decomposable ranking for efficient precomputing that selects preliminary ranking features comprising static ranking features and dynamic atom-isolated components | |
JP2017162190A (ja) | 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 | |
KR20150070171A (ko) | 스트링 변환의 귀납적 합성을 위한 랭킹 기법 | |
US20060179039A1 (en) | Method and system for performing secondary search actions based on primary search result attributes | |
CN111813930B (zh) | 相似文档检索方法及装置 | |
CN108875065B (zh) | 一种基于内容的印尼新闻网页推荐方法 | |
CN112612875B (zh) | 一种查询词自动扩展方法、装置、设备及存储介质 | |
CN104067273A (zh) | 将搜索结果分组为简档页面 | |
WO2023144413A1 (en) | Augmenting machine learning language models using search engine results | |
JP2011204225A (ja) | 属性抽出装置および方法 | |
JP7388256B2 (ja) | 情報処理装置及び情報処理方法 | |
JP4266222B2 (ja) | 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体 | |
CN117076636A (zh) | 一种智能客服的信息查询方法、系统和设备 | |
JP6495206B2 (ja) | 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム | |
JP2017146869A (ja) | 情報検索プログラム及び情報検索装置 | |
CN110019714A (zh) | 基于历史结果的多意图查询方法、装置、设备及存储介质 | |
JP6334491B2 (ja) | 概念ベース生成装置、概念検索装置、方法、及びプログラム | |
JP6698061B2 (ja) | 単語ベクトル変換装置、方法、及びプログラム | |
JP5008137B2 (ja) | 単語ベクトル生成装置、単語ベクトル生成方法、プログラムおよびプログラムを記録した記録媒体 | |
JP4099197B2 (ja) | 概念ベクトル推定方法及び装置及びプログラム及びコンピュータ読取可能な記憶媒体 | |
CN110414680A (zh) | 基于众包标注的知识加工系统 | |
CN105426490A (zh) | 一种基于树形结构的索引方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180424 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6334491 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |