JP7260769B2 - 検索支援方法及び情報処理装置 - Google Patents
検索支援方法及び情報処理装置 Download PDFInfo
- Publication number
- JP7260769B2 JP7260769B2 JP2019082934A JP2019082934A JP7260769B2 JP 7260769 B2 JP7260769 B2 JP 7260769B2 JP 2019082934 A JP2019082934 A JP 2019082934A JP 2019082934 A JP2019082934 A JP 2019082934A JP 7260769 B2 JP7260769 B2 JP 7260769B2
- Authority
- JP
- Japan
- Prior art keywords
- documents
- document
- search
- cluster
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
(付記1)文書検索の検索結果に含まれる複数の文書のうち、特定の文書数Nの文書を対象としてクラスタリングを行い、前記クラスタリングにより生成された各クラスタに分類された文書から抽出した単語を検索キーワード候補として提示する検索支援方法において、前記クラスタリングの所要時間が基準を超える場合、前記クラスタリングにより生成された各クラスタについて、前記各クラスタに分類された文書のうち、特定の単語を含む文書を特定し、前記特定の文書数Nを、前記特定の文書数Nから前記特定の単語を含む前記文書の文書数Mを差し引いた文書数N-Mに更新する、処理をコンピュータが実行することを特徴とする検索支援方法。
(付記2)前記特定の単語は、前記各クラスタに分類された文書をそれぞれ特徴づける複数の単語のうち、文書を特徴づける度合が他の単語に比べて低い単語である、ことを特徴とする付記1に記載の検索支援方法。
(付記3)前記特定の文書数Nは、前記複数の文書の総数又は前記複数の文書に含まれる一部の文書の総数である、ことを特徴とする付記1又は2に記載の検索支援方法。
(付記4)前記特定の単語を含む前記文書を特定する前に、前記クラスタリングにより生成された各クラスタに分類されなかった非分類の文書を特定し、前記非分類の文書を前記クラスタリングの対象から除外する、ことを特徴とする付記1から3のいずれか1項に記載の検索支援方法。
(付記5)前記各クラスタに分類された文書から抽出した単語は、いずれも、前記各クラスタをそれぞれ特徴づける単語である、ことを特徴とする付記1から4のいずれか1項に記載の検索支援方法。
(付記6)前記各クラスタをそれぞれ特徴づける単語は、前記各クラスタに分類された文書を特徴づける単語の出現頻度に基づいて決定される、ことを特徴とする付記5に記載の検索支援方法。
(付記7)文書検索の検索結果に含まれる複数の文書を対象として第1のクラスタリングを行い、前記第1のクラスタリングにより生成された各クラスタに分類された文書から抽出した単語を検索キーワード候補として提示する検索支援方法であって、前記文書検索の検索対象に該当する複数の文書のうち、特定の文書数N(Nは自然数)の文書を対象とする第2のクラスタリングの所要時間が基準を超える場合、前記第2のクラスタリングにより生成された各クラスタについて、前記各クラスタに分類された文書のうち、特定の単語を含む文書を特定し、前記特定の文書数Nを、前記特定の文書数Nから前記特定の単語を含む前記文書の文書数M(MはNより小さな自然数)を差し引いた文書数N-Mに更新する、処理をコンピュータが実行することを特徴とする検索支援方法。
(付記8)記憶部に記憶された文書群を検索対象とした検索結果を取得すると、前記検索結果に含まれる文書が、質問及び回答を含む第1の種別と、現象及び原因を含む第2の種別とのいずれかを判定し、前記文書が前記第1の種別である場合、前記質問及び前記回答を抽出対象として単語抽出処理を行い、前記文書が前記第2の種別である場合、前記現象を抽出対象とし、かつ、前記原因を抽出対象とせずに単語抽出処理を行い、前記単語抽出処理により抽出した単語のうち、いずれかの単語の指定を受け付けると、前記文書群を検索対象として、指定された前記単語による検索処理を行うか、前記検索結果に含まれる前記文書を絞り込み対象として、指定された前記単語による絞り込み処理を行う、処理をコンピュータが実行することを特徴とする検索支援方法。
(付記9)文書検索の検索結果に含まれる複数の文書のうち、特定の文書数Nの文書を対象としてクラスタリングを行い、前記クラスタリングにより生成された各クラスタに分類された文書から抽出した単語を検索キーワード候補として提示する情報処理装置において、前記クラスタリングの所要時間が基準を超える場合、前記クラスタリングにより生成された各クラスタについて、前記各クラスタに分類された文書のうち、特定の単語を含む文書を特定し、前記特定の文書数Nを、前記特定の文書数Nから前記特定の単語を含む前記文書の文書数Mを差し引いた文書数N-Mに更新する、処理を実行する処理部を備えることを特徴とする情報処理装置。
(付記10)前記処理部は、前記特定の単語を含む前記文書を特定する前に、前記クラスタリングにより生成された各クラスタに分類されなかった非分類の文書を特定し、前記非分類の文書を前記クラスタリングの対象から除外する、ことを特徴とする付記9に記載の情報処理装置。
(付記11)文書検索の検索結果に含まれる複数の文書を対象として第1のクラスタリングを行い、前記第1のクラスタリングにより生成された各クラスタに分類された文書から抽出した単語を検索キーワード候補として提示する情報処理装置であって、前記文書検索の検索対象に該当する複数の文書のうち、特定の文書数N(Nは自然数)の文書を対象とする第2のクラスタリングの所要時間が基準を超える場合、前記第2のクラスタリングにより生成された各クラスタについて、前記各クラスタに分類された文書のうち、特定の単語を含む文書を特定し、前記特定の文書数Nを、前記特定の文書数Nから前記特定の単語を含む前記文書の文書数M(MはNより小さな自然数)を差し引いた文書数N-Mに更新する、処理を実行する処理部を備えることを特徴とする情報処理装置。
(付記12)文書群を記憶する記憶部と、前記文書群を検索対象とした検索結果を取得すると、前記検索結果に含まれる文書が、質問及び回答を含む第1の種別と、現象及び原因を含む第2の種別とのいずれかを判定し、前記文書が前記第1の種別である場合、前記質問及び前記回答を抽出対象として単語抽出処理を行い、前記文書が前記第2の種別である場合、前記現象を抽出対象とし、かつ、前記原因を抽出対象とせずに単語抽出処理を行い、前記単語抽出処理により抽出した単語のうち、いずれかの単語の指定を受け付けると、前記文書群を検索対象として、指定された前記単語による検索処理を行うか、前記検索結果に含まれる前記文書を絞り込み対象として、指定された前記単語による絞り込み処理を行う処理を実行する処理部と、を備えることを特徴とする情報処理装置。
100 ユーザ端末
200 対話サーバ
210 記憶部
211 文書群記憶部
220 処理部
221 文書検索部
222 文書数決定部
223 提示キーワード決定部
230 通信部
Claims (8)
- 文書検索の検索結果に含まれる複数の文書のうち、特定の文書数Nの文書を対象としてクラスタリングを行い、前記クラスタリングにより生成された各クラスタに分類された文書から抽出した単語を検索キーワード候補として提示する検索支援方法において、
前記クラスタリングの所要時間が基準を超える場合、前記クラスタリングにより生成された各クラスタについて、前記各クラスタに分類された文書のうち、特定の単語を含む文書を特定し、
前記特定の文書数Nを、前記特定の文書数Nから前記特定の単語を含む前記文書の文書数Mを差し引いた文書数N-Mに更新する、
処理をコンピュータが実行し、
前記特定の単語は、前記各クラスタに分類された文書をそれぞれ特徴づける複数の単語のうち、文書を特徴づける度合が他の単語に比べて低い単語である、
ことを特徴とする検索支援方法。 - 前記特定の文書数Nは、前記複数の文書の総数又は前記複数の文書に含まれる一部の文書の総数である、
ことを特徴とする請求項1に記載の検索支援方法。 - 前記特定の単語を含む前記文書を特定する前に、前記クラスタリングにより生成された各クラスタに分類されなかった非分類の文書を特定し、
前記非分類の文書を前記クラスタリングの対象から除外する、
ことを特徴とする請求項1又は2に記載の検索支援方法。 - 前記各クラスタに分類された文書から抽出した単語は、いずれも、前記各クラスタをそれぞれ特徴づける単語である、
ことを特徴とする請求項1から3のいずれか1項に記載の検索支援方法。 - 前記各クラスタをそれぞれ特徴づける単語は、前記各クラスタに分類された文書を特徴づける単語の出現頻度に基づいて決定される、
ことを特徴とする請求項4に記載の検索支援方法。 - 文書検索の検索結果に含まれる複数の文書を対象として第1のクラスタリングを行い、前記第1のクラスタリングにより生成された各クラスタに分類された文書から抽出した単語を検索キーワード候補として提示する検索支援方法において、
前記文書検索の検索対象に該当する複数の文書のうち、特定の文書数N(Nは自然数)の文書を対象とする第2のクラスタリングの所要時間が基準を超える場合、前記第2のクラスタリングにより生成された各クラスタについて、前記各クラスタに分類された文書のうち、特定の単語を含む文書を特定し、
前記特定の文書数Nを、前記特定の文書数Nから前記特定の単語を含む前記文書の文書数M(MはNより小さな自然数)を差し引いた文書数N-Mに更新する、
処理をコンピュータが実行し、
前記特定の単語は、前記各クラスタに分類された文書をそれぞれ特徴づける複数の単語のうち、文書を特徴づける度合が他の単語に比べて低い単語である、
ことを特徴とする検索支援方法。 - 文書検索の検索結果に含まれる複数の文書のうち、特定の文書数Nの文書を対象としてクラスタリングを行い、前記クラスタリングにより生成された各クラスタに分類された文書から抽出した単語を検索キーワード候補として提示する情報処理装置において、
前記クラスタリングの所要時間が基準を超える場合、前記クラスタリングにより生成された各クラスタについて、前記各クラスタに分類された文書のうち、特定の単語を含む文書を特定し、
前記特定の文書数Nを、前記特定の文書数Nから前記特定の単語を含む前記文書の文書数Mを差し引いた文書数N-Mに更新する、
処理を実行する処理部を備え、
前記特定の単語は、前記各クラスタに分類された文書をそれぞれ特徴づける複数の単語のうち、文書を特徴づける度合が他の単語に比べて低い単語である、
ことを特徴とする情報処理装置。 - 文書検索の検索結果に含まれる複数の文書を対象として第1のクラスタリングを行い、前記第1のクラスタリングにより生成された各クラスタに分類された文書から抽出した単語を検索キーワード候補として提示する情報処理装置において、
前記文書検索の検索対象に該当する複数の文書のうち、特定の文書数N(Nは自然数)の文書を対象とする第2のクラスタリングの所要時間が基準を超える場合、前記第2のクラスタリングにより生成された各クラスタについて、前記各クラスタに分類された文書のうち、特定の単語を含む文書を特定し、
前記特定の文書数Nを、前記特定の文書数Nから前記特定の単語を含む前記文書の文書数M(MはNより小さな自然数)を差し引いた文書数N-Mに更新する、
処理を実行する処理部を備え、
前記特定の単語は、前記各クラスタに分類された文書をそれぞれ特徴づける複数の単語のうち、文書を特徴づける度合が他の単語に比べて低い単語である、
ことを特徴とする情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019082934A JP7260769B2 (ja) | 2019-04-24 | 2019-04-24 | 検索支援方法及び情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019082934A JP7260769B2 (ja) | 2019-04-24 | 2019-04-24 | 検索支援方法及び情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020181309A JP2020181309A (ja) | 2020-11-05 |
JP7260769B2 true JP7260769B2 (ja) | 2023-04-19 |
Family
ID=73024072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019082934A Active JP7260769B2 (ja) | 2019-04-24 | 2019-04-24 | 検索支援方法及び情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7260769B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014063343A (ja) | 2012-09-21 | 2014-04-10 | Nippon Telegr & Teleph Corp <Ntt> | クラスタリング品質改善方法 |
-
2019
- 2019-04-24 JP JP2019082934A patent/JP7260769B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014063343A (ja) | 2012-09-21 | 2014-04-10 | Nippon Telegr & Teleph Corp <Ntt> | クラスタリング品質改善方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2020181309A (ja) | 2020-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11580168B2 (en) | Method and system for providing context based query suggestions | |
CN107408130B (zh) | 通过间接集群连接来进行搜索的方法 | |
US8316007B2 (en) | Automatically finding acronyms and synonyms in a corpus | |
US10102191B2 (en) | Propagation of changes in master content to variant content | |
US20230177360A1 (en) | Surfacing unique facts for entities | |
JP2005128873A (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
WO2017075017A1 (en) | Automatic conversation creator for news | |
US10380243B2 (en) | Parallel-translation dictionary creating apparatus and method | |
KR20100106464A (ko) | 데이터 클러스터와 유의어의 탐색과 수정에 대한 방법 및 시스템 | |
US10970324B2 (en) | System for generation of automated response follow-up | |
US10229187B2 (en) | System for determination of automated response follow-up | |
US20060101004A1 (en) | Method and system for retrieving a document | |
US20200159780A1 (en) | Categorically filtering search results | |
JP5226241B2 (ja) | タグを付与する方法 | |
US20210042363A1 (en) | Search pattern suggestions for large datasets | |
JP5256273B2 (ja) | 意図抽出装置、方法及びプログラム | |
JP2017219899A (ja) | ナレッジ検索装置、ナレッジ検索方法、および、ナレッジ検索プログラム | |
JP7260769B2 (ja) | 検索支援方法及び情報処理装置 | |
CN116383340A (zh) | 信息搜索方法、装置、电子设备和存储介质 | |
US20220335070A1 (en) | Method and apparatus for querying writing material, and storage medium | |
WO2010132062A1 (en) | System and methods for sentiment analysis | |
JP2022106948A (ja) | 情報表示方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP7280094B2 (ja) | 判断支援装置および判断支援方法 | |
JP2012027525A (ja) | ファイル格納補助システムと方法およびプログラム | |
JP2022136506A (ja) | 検索システム、検索方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7260769 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |