JP7400408B2 - 検索根拠可視化システム、プログラム、および方法 - Google Patents
検索根拠可視化システム、プログラム、および方法 Download PDFInfo
- Publication number
- JP7400408B2 JP7400408B2 JP2019215838A JP2019215838A JP7400408B2 JP 7400408 B2 JP7400408 B2 JP 7400408B2 JP 2019215838 A JP2019215838 A JP 2019215838A JP 2019215838 A JP2019215838 A JP 2019215838A JP 7400408 B2 JP7400408 B2 JP 7400408B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- term
- unit
- word
- displayed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012800 visualization Methods 0.000 title claims description 69
- 238000000034 method Methods 0.000 title claims description 24
- 238000010586 diagram Methods 0.000 description 18
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 12
- 239000000284 extract Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 241000008357 Okapia johnstoni Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本発明の一実施形態に係る検索システム10を含む全体の構成図である。図1に示されるように、検索システム10は、任意のネットワーク40を介して、入力装置20および出力装置30と通信可能に接続されている。以下、それぞれについて説明する。
図2は、本発明の一実施形態に係る検索システム10のハードウェア構成図である。
以下、検索システム10の機能ブロックを(実施例1)と(実施例2)とに分けて説明する。
図3は、本発明の一実施形態に係る検索システム10の機能ブロック図(実施例1)である。図3に示されるように、検索システム10は、検索語取得部101、全文検索部102、検索結果取得部103、可視化部104、検索文修正部105を備えることができる。また、検索システム10は、プログラムを実行することによって、検索語取得部101、全文検索部102、検索結果取得部103、可視化部104、検索文修正部105として機能することができる。以下、それぞれについて説明する。
図4は、本発明の一実施形態に係る検索システム10の機能ブロック図(実施例2)である。
図8は、本発明の一実施形態に係る検索対象のデータ構造情報の一例である。インデックス記憶部205には、図8のような検索対象のデータが記憶されうる。図8に示されるように、文書(例えば、ユーザが蓄積した議事録、報告書、日報等)の、文書を特定するための識別子(文書ID)、文書のタイトル、文書の本文内容(テキスト)が記憶されうる。本文内容(テキスト)が検索対象となる。
・入力装置20は、検索語取得部101に対して、検索語を取得するよう請求する(1.1)。
・検索語取得部101は、全文検索部102に対して、検索を実行するよう請求する(1.1.1)。
・全文検索部102は、検索結果取得部103に対して、検索の結果を取得するよう請求する(2)。
・検索結果取得部103は、可視化部104に対して、文書と検索語との対応関係を可視化したグラフを作成するよう請求する(2.1)。
・検索語取得部101は、可視化部104に対して、文書と検索語との対応関係を可視化したグラフを作成するよう請求する(3)。
・可視化部104は、グラフを作成する(4)。
・可視化部104は、出力装置30に対して、グラフを出力するよう請求する(5)。
・ユーザは、出力装置30に対して、検索の根拠を提示するよう請求する(6)。
・ユーザは、出力装置30を介して検索文修正部105に対して、検索用のクエリを修正して検索を実行するよう請求する(7)。
・入力装置20は、検索語取得部111に対して、検索語を取得するよう請求する(1.1)。
・検索語取得部111は、全文検索部112に対して、初期検索(つまり、検索語による検索)を実行するよう請求する(1.1.1)。
・全文検索部112は、検索結果取得部113に対して、初期検索の結果を取得するよう請求する(1.1.1.1)。
・検索結果取得部113は、拡張語取得部116に対して、拡張語を取得するよう請求する(1.1.1.1.1)。
・拡張語取得部116は、全文検索部112に対して、再検索(元検索語と拡張語による検索)を実行するよう請求する(1.1.1.1.1.1)。
・全文検索部112は、検索結果取得部113に対して、再検索の結果を取得するよう請求する(1.1.1.1.1.1.1)。
・検索結果取得部113は、可視化部114に対して、文書と新たな検索語(元検索語および拡張語)との対応関係を可視化したグラフを作成するよう請求する(1.1.1.1.1.1.1.1)。
・検索語取得部111は、可視化部114に対して、文書と新たな検索語(元検索語および拡張語)との対応関係を可視化したグラフを作成するよう請求する(2)。
・拡張語取得部116は、可視化部114に対して、文書と新たな検索語(元検索語および拡張語)との対応関係を可視化したグラフを作成するよう請求する(3)。
・可視化部114は、グラフを作成する(4)。
・可視化部114は、出力装置30に対して、グラフを出力するよう請求する(5)。
・ユーザは、出力装置30に対して、検索の根拠を提示するよう請求する(6)。
・ユーザは、出力装置30を介して検索文修正部115に対して、検索用のクエリを修正して検索を実行するよう請求する(7)。
(2)可視化部104、114は、元検索語または拡張語のベクトル類似度に基づいて、ベクトル類似度が高ければ高いほど、元検索語または拡張語を中心に近い位置に配置する。具体的には、可視化部104、114は、円と円との間の各領域に、所定の範囲内のベクトル類似度の元検索語または拡張語を配置する(例えば、外側の領域から順に、ベクトル類似度が0~0.05、0.05~0.10、0.10~0.15・・・である元検索語または拡張語が配置される)。つまり、同じ範囲内のベクトル類似度の元検索語または拡張語は、同じ領域に配置される。また、可視化部104、114は、元検索語および拡張語間の類似度に基づいて、各領域内での配置の位置を決定する。
(3)可視化部104、114は、元検索語または拡張語の出現回数に基づいて、出現回数が多ければ多いほど、元検索語または拡張語の文字の大きさを大きく表示する。
(4)可視化部104、114は、元検索語と拡張語とを区別できるように表わす(例えば、拡張語に下線を付ける、元検索語とは異なる色で拡張語を表示する等の文字修飾を行う)。
(2)可視化部104、114は、元検索語または拡張語のベクトル類似度に基づいて、ベクトル類似度が高ければ高いほど、文書を中心に近い位置に配置する。具体的には、可視化部104、114は、円と円との間の各領域に、所定の範囲内のベクトル類似度の文書を配置する(例えば、外側の領域から順に、ベクトル類似度が0~0.05、0.05~0.10、0.10~0.15・・・である文書が配置される)。つまり、同じ範囲内のベクトル類似度の文書は、同じ領域に配置される。また、可視化部104、114は、文書間の類似度に基づいて、各領域内での配置の位置を決定する。
(3)可視化部104、114は、元検索語または拡張語の出現回数に基づいて、出現回数が多ければ多いほど、文書の文字の大きさを大きく表示する。
20 入力装置
30 出力装置
40 ネットワーク
101 検索語取得部
102 全文検索部
103 検索結果取得部
104 可視化部
105 検索文修正部
111 検索語取得部
112 全文検索部
113 検索結果取得部
114 可視化部
115 検索文修正部
116 拡張語取得部
201 検索語受信部
202 拡張語受信部
203 クエリ生成部
204 検索対象収集部
205 インデックス記憶部
206 検索部
207 検索id送信部
301 初期結果受信部
302 予備単語算出部
303 拡張語選択部
304 拡張語送信部
Claims (10)
- 検索語を取得する検索語取得部と、
前記検索語に基づいて、検索を実行する全文検索部と、
3つ以上の前記検索語と前記検索の結果との対応関係を表示する可視化部と
を備え、
前記可視化部は、前記検索の結果が中心に表示されており、前記検索語が、前記検索の結果との類似度が高いほど中心に近い位置に表示されており、かつ、前記検索の結果内で出現する回数が多いほど大きな文字で表示されている画面を出力する、検索システム。 - 検索語を取得する検索語取得部と、
前記検索語に基づいて、検索を実行する全文検索部と、
3つ以上の前記検索語と前記検索の結果との対応関係を表示する可視化部と
を備え、
前記可視化部は、前記検索語が中心に表示されており、前記検索の結果が、前記検索語との類似度が高いほど中心に近い位置に表示されており、かつ、前記検索の結果内で出現する回数が多いほど大きな文字で表示されている画面を出力する、検索システム。 - 前記検索語は、元検索語、および、前記元検索語から導出される拡張語であり、
前記全文検索部は、前記元検索語および前記拡張語に基づいて、検索を実行し、
前記可視化部は、前記元検索語および前記拡張語と前記検索の結果との対応関係を表示する、請求項1または2に記載の検索システム。 - 前記拡張語は、擬似適合フィードバックを用いた検索において、前記元検索語による検索の結果から抽出された用語である、請求項3に記載の検索システム。
- 前記拡張語は、前記元検索語の類義語と、前記元検索語の上位概念を示す用語と、前記元検索語の下位概念を示す用語と、前記元検索語と共起関係にある用語とのうちの少なくとも1つである、請求項3に記載の検索システム。
- 検索用のクエリを修正して検索を実行する検索文修正部、をさらに備えた請求項1から5のいずれか一項に記載の検索システム。
- 前記可視化部は、前記検索の結果が中心に表示されており前記検索語が螺旋状に配置されている画面を出力する、請求項1に記載の検索システム。
- 前記可視化部は、前記検索語が中心に表示されており前記検索の結果が螺旋状に配置されている画面を出力する、請求項2に記載の検索システム。
- コンピュータを
検索語を取得する検索語取得部、
前記検索語に基づいて、検索を実行する全文検索部、
3つ以上の前記検索語と前記検索の結果との対応関係を表示する可視化部
として機能させ、
前記可視化部は、前記検索の結果が中心に表示されており、前記検索語が、前記検索の結果との類似度が高いほど中心に近い位置に表示されており、かつ、前記検索の結果内で出現する回数が多いほど大きな文字で表示されている画面を出力する、プログラム。 - コンピュータが実行する方法であって、
検索語を取得するステップと、
前記検索語に基づいて、検索を実行するステップと、
3つ以上の前記検索語と前記検索の結果との対応関係を表示するステップと
を含み、
前記表示するステップでは、前記検索の結果が中心に表示されており、前記検索語が、前記検索の結果との類似度が高いほど中心に近い位置に表示されており、かつ、前記検索の結果内で出現する回数が多いほど大きな文字で表示されている画面を出力する、方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019215838A JP7400408B2 (ja) | 2019-11-28 | 2019-11-28 | 検索根拠可視化システム、プログラム、および方法 |
CN202080082432.5A CN114730319A (zh) | 2019-11-28 | 2020-11-11 | 搜索有效度可视化系统、搜索有效度可视化方法及载体装置 |
EP20808520.9A EP4066130A1 (en) | 2019-11-28 | 2020-11-11 | System of visualizing validity level of searching, method of visualizing validity level of searching, and carrier means |
US17/760,888 US11899702B2 (en) | 2019-11-28 | 2020-11-11 | System of visualizing validity level of searching, method of visualizing validity level of searching, and carrier means |
PCT/IB2020/060594 WO2021105810A1 (en) | 2019-11-28 | 2020-11-11 | System of visualizing validity level of searching, method of visualizing validity level of searching, and carrier means |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019215838A JP7400408B2 (ja) | 2019-11-28 | 2019-11-28 | 検索根拠可視化システム、プログラム、および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021086461A JP2021086461A (ja) | 2021-06-03 |
JP7400408B2 true JP7400408B2 (ja) | 2023-12-19 |
Family
ID=73476204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019215838A Active JP7400408B2 (ja) | 2019-11-28 | 2019-11-28 | 検索根拠可視化システム、プログラム、および方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11899702B2 (ja) |
EP (1) | EP4066130A1 (ja) |
JP (1) | JP7400408B2 (ja) |
CN (1) | CN114730319A (ja) |
WO (1) | WO2021105810A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001350793A (ja) | 2000-06-05 | 2001-12-21 | Fuji Xerox Co Ltd | 関連情報表示制御装置及び関連情報表示方法 |
JP2008027021A (ja) | 2006-07-19 | 2008-02-07 | Ricoh Co Ltd | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体。 |
JP2008250623A (ja) | 2007-03-30 | 2008-10-16 | Nomura Research Institute Ltd | 検索システム |
JP2012068755A (ja) | 2010-09-21 | 2012-04-05 | Nomura Research Institute Ltd | 検索システム及び検索プログラム |
JP2014052803A (ja) | 2012-09-06 | 2014-03-20 | Ryukoku Univ | 音声ドキュメント検索方法および音声ドキュメント検索システム |
JP2017515249A (ja) | 2014-05-01 | 2017-06-08 | レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド | 結果文書セットに関する推定関連性指示子を表示するため及びクエリ可視化を表示するためのシステム及び方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2758826B2 (ja) | 1994-03-02 | 1998-05-28 | 株式会社リコー | 文書検索装置 |
JP2970443B2 (ja) * | 1994-12-09 | 1999-11-02 | 松下電器産業株式会社 | 文書検索装置 |
JPH11338873A (ja) * | 1998-05-26 | 1999-12-10 | Nippon Telegr & Teleph Corp <Ntt> | 再検索方法及び装置及び再検索プログラムを格納した記憶媒体及び追加検索語候補提示方法及び装置及び追加検索語候補提示プログラムを格納した記憶媒体 |
JP2003323275A (ja) | 2002-02-28 | 2003-11-14 | Ricoh Co Ltd | 画像描画処理装置及び画像処理システム |
JP2005242994A (ja) | 2004-01-27 | 2005-09-08 | Ricoh Co Ltd | サービス提供装置、情報処理装置、サービス提供方法、情報処理方法、サービス提供プログラム、情報処理プログラム及び記録媒体 |
JP4447345B2 (ja) | 2004-02-19 | 2010-04-07 | 株式会社エヌ・ティ・ティ・データ | 類似特許明細書検索システム及びその方法並びにプログラム |
US7941429B2 (en) * | 2007-07-10 | 2011-05-10 | Yahoo! Inc. | Interface for visually searching and navigating objects |
JP5187313B2 (ja) | 2007-10-12 | 2013-04-24 | 日本電気株式会社 | 文書重要度算出システム、文書重要度算出方法およびプログラム |
US9213961B2 (en) * | 2008-09-21 | 2015-12-15 | Oracle International Corporation | Systems and methods for generating social index scores for key term analysis and comparisons |
US9257090B2 (en) * | 2012-10-04 | 2016-02-09 | Spirority, Inc. | Graphical display of content on a display device in a spiral pattern |
IN2014CH01007A (ja) * | 2014-02-27 | 2015-09-04 | Accenture Global Services Ltd | |
US9984160B2 (en) * | 2015-09-30 | 2018-05-29 | International Business Machines Corporation | Determining a query answer selection |
JP6870260B2 (ja) | 2016-09-27 | 2021-05-12 | 株式会社リコー | 通信システム、通信装置、通信管理方法、及びプログラム |
US20180373719A1 (en) * | 2017-06-22 | 2018-12-27 | Microsoft Technology Licensing, Llc | Dynamic representation of suggested queries |
JP2019215838A (ja) | 2017-09-29 | 2019-12-19 | 横浜特殊船舶株式会社 | 車両の一時預かりシステムおよびペットの一時預かりシステム |
JP7196393B2 (ja) | 2017-12-01 | 2022-12-27 | 株式会社リコー | 情報提示装置、情報提示システム、情報提示方法およびプログラム |
-
2019
- 2019-11-28 JP JP2019215838A patent/JP7400408B2/ja active Active
-
2020
- 2020-11-11 US US17/760,888 patent/US11899702B2/en active Active
- 2020-11-11 EP EP20808520.9A patent/EP4066130A1/en active Pending
- 2020-11-11 CN CN202080082432.5A patent/CN114730319A/zh active Pending
- 2020-11-11 WO PCT/IB2020/060594 patent/WO2021105810A1/en unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001350793A (ja) | 2000-06-05 | 2001-12-21 | Fuji Xerox Co Ltd | 関連情報表示制御装置及び関連情報表示方法 |
JP2008027021A (ja) | 2006-07-19 | 2008-02-07 | Ricoh Co Ltd | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体。 |
JP2008250623A (ja) | 2007-03-30 | 2008-10-16 | Nomura Research Institute Ltd | 検索システム |
JP2012068755A (ja) | 2010-09-21 | 2012-04-05 | Nomura Research Institute Ltd | 検索システム及び検索プログラム |
JP2014052803A (ja) | 2012-09-06 | 2014-03-20 | Ryukoku Univ | 音声ドキュメント検索方法および音声ドキュメント検索システム |
JP2017515249A (ja) | 2014-05-01 | 2017-06-08 | レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド | 結果文書セットに関する推定関連性指示子を表示するため及びクエリ可視化を表示するためのシステム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4066130A1 (en) | 2022-10-05 |
JP2021086461A (ja) | 2021-06-03 |
WO2021105810A1 (en) | 2021-06-03 |
CN114730319A (zh) | 2022-07-08 |
US11899702B2 (en) | 2024-02-13 |
US20220342917A1 (en) | 2022-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4746439B2 (ja) | 文書検索サーバおよび文書検索方法 | |
US7769771B2 (en) | Searching a document using relevance feedback | |
US8984012B2 (en) | Self-tuning alterations framework | |
US8301616B2 (en) | Search equalizer | |
JP4937812B2 (ja) | 検索システム | |
JP5194826B2 (ja) | 情報検索装置、情報検索方法及び制御プログラム | |
US9075879B2 (en) | System, method and computer program for searching within a sub-domain by linking to other sub-domains | |
US12105762B2 (en) | Methods and servers for ranking digital documents in response to a query | |
CN111373386A (zh) | 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序 | |
WO2010109594A1 (ja) | 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法 | |
JP5139883B2 (ja) | 検索システム | |
JP5193669B2 (ja) | 検索システム | |
JP4945015B2 (ja) | 文書検索システム、文書検索プログラム、および文書検索方法 | |
JP7400408B2 (ja) | 検索根拠可視化システム、プログラム、および方法 | |
JP2009086774A (ja) | 検索サービス装置 | |
JP2008250625A (ja) | 検索システム | |
JP6534454B2 (ja) | 情報検索方法及び情報検索装置並びに情報検索システム | |
JP2009271671A (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP5870776B2 (ja) | リンク付与装置、リンク付与方法、およびプログラム | |
JP2009146013A (ja) | コンテンツ検索方法及び装置並びにプログラム | |
JP2010086210A (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP2009086772A (ja) | 検索サービス装置 | |
JP4879800B2 (ja) | 2次元マップ上における表示要素間の重複回避プログラム | |
Spirin et al. | Searching for design examples with crowdsourcing | |
JP2009116413A (ja) | ファイル検索システム、プログラム、及びコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230725 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231120 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7400408 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |