JP5758262B2 - 類似文書可視化装置、類似文書可視化方法およびプログラム - Google Patents
類似文書可視化装置、類似文書可視化方法およびプログラム Download PDFInfo
- Publication number
- JP5758262B2 JP5758262B2 JP2011222164A JP2011222164A JP5758262B2 JP 5758262 B2 JP5758262 B2 JP 5758262B2 JP 2011222164 A JP2011222164 A JP 2011222164A JP 2011222164 A JP2011222164 A JP 2011222164A JP 5758262 B2 JP5758262 B2 JP 5758262B2
- Authority
- JP
- Japan
- Prior art keywords
- document data
- similarity
- page
- similar
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012800 visualization Methods 0.000 title claims description 22
- 238000007794 visualization technique Methods 0.000 title description 5
- 238000004364 calculation method Methods 0.000 claims description 39
- 238000013075 data extraction Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 8
- 238000000034 method Methods 0.000 description 121
- 230000008569 process Effects 0.000 description 112
- 238000012545 processing Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
文書データ群に含まれる複数の文書データの各二文書データ間の内容の類似度を算出する類似度算出手段と、
前記文書データ群に含まれる文書データのうち利用者により選択された文書データに類似する一又は複数の文書データを前記類似度算出手段で算出した類似度に基づいて抽出する文書データ抽出手段と、
前記文書データ抽出手段で抽出した文書データを識別する識別記号と前記利用者に選択された文書データを識別する識別記号とを各文書データの文字数に基づいて整列して表示する識別表示整列手段と、
前記識別表示整列手段で表示した識別記号同士をリンクするリンク記号を選択可能に表示するリンク表示手段と、
前記リンク記号が利用者から選択されたことに応じて、該リンクされている識別記号に対応する文書データをそれぞれ特定する文書データ特定手段と、
類似度に対応付けられて予め複数記憶されている類似情報のうち、前記文書データ特定手段で特定した文書データ間の類似度に対応する類似情報を表示する類似情報表示手段と、を備え、
前記類似度算出手段は、二文書データ間の内容を各文書データのページ毎に比較してページ毎の類似度を算出するページ別類似度算出手段を含み、
前記類似情報表示手段は、前記ページ毎の類似度に基づいて利用者の操作を分類して表示する、
ことを特徴とする。
前記リンク表示手段は、
前記類似度判定手段で判定した類似度の文書データの識別記号同士をリンクするリンク記号を選択可能に表示する、ようにしてもよい。
前記ページ別類似度算出手段で算出したページ毎の類似度に基づいて前記二文書データ間の類似度を算出し、
前記類似情報表示手段は、
前記ページ別類似度算出手段で算出したページ毎の類似度に基づいて前記文書データ特定手段で特定した文書データ間のページ毎の類似情報を表示する、ようにしてもよい。
文書データ群に含まれる複数の文書データの各二文書データ間の内容の類似度を算出する類似度算出ステップと、
前記文書データ群に含まれる文書データのうち利用者により選択された文書データに類似する一又は複数の文書データを前記類似度算出ステップで算出した類似度に基づいて抽出する文書データ抽出ステップと、
前記文書データ抽出ステップで抽出した文書データを識別する識別記号と前記利用者に選択された文書データを識別する識別記号とを各文書データの文字数に基づいて整列して表示する識別表示整列ステップと、
前記識別表示整列ステップで表示した識別記号同士をリンクするリンク記号を選択可能に表示するリンク表示ステップと、
前記リンク記号が利用者から選択されたことに応じて、該リンクされている識別記号に対応する文書データをそれぞれ特定する文書データ特定ステップと、
類似度に対応付けられて予め複数記憶されている類似情報のうち、前記文書データ特定ステップで特定した文書データ間の類似度に対応する類似情報を表示する類似情報表示ステップと、を備え、
前記類似度算出ステップは、二文書データ間の内容を各文書データのページ毎に比較してページ毎の類似度を算出するページ別類似度算出ステップを含み、
前記類似情報表示ステップでは、前記ページ毎の類似度に基づいて利用者の操作を分類して表示する、
ことを特徴とする。
コンピュータを、
文書データ群に含まれる複数の文書データの各二文書データ間の内容の類似度を算出する類似度算出手段、
前記文書データ群に含まれる文書データのうち利用者により選択された文書データに類似する一又は複数の文書データを前記類似度算出手段で算出した類似度に基づいて抽出する文書データ抽出手段、
前記文書データ抽出手段で抽出した文書データを識別する識別記号と前記利用者に選択された文書データを識別する識別記号とを各文書データの文字数に基づいて整列して表示する識別表示整列手段、
前記識別表示整列手段で表示した識別記号同士をリンクするリンク記号を選択可能に表示するリンク表示手段、
前記リンク記号が利用者から選択されたことに応じて、該リンクされている識別記号に対応する文書データをそれぞれ特定する文書データ特定手段、
類似度に対応付けられて予め複数記憶されている類似情報のうち、前記文書データ特定手段で特定した文書データ間の類似度に対応する類似情報を表示する類似情報表示手段、として機能させ、
前記類似度算出手段は、二文書データ間の内容を各文書データのページ毎に比較してページ毎の類似度を算出するページ別類似度算出手段を含み、
前記類似情報表示手段は、前記ページ毎の類似度に基づいて利用者の操作を分類して表示する、
ことを特徴とする。
類似度=カウント値×2÷(基準文書データの文字数+比較文書データの文字数)・・・(1)
この発明は、上記の実施形態に限定されず、種々の変形及び応用が可能である。上記実施形態では、ページ毎に類似度を算出する例を示したが、これは一例である。類似度の算出は、ページ毎に算出しなくてもよく、例えば、章毎や段落毎に行ってもよい。
210 入力部
220 表示部
230 記憶部
231 プログラム
232 文書データ情報
240 制御部
241 類似度判定部
242 ツリー表示部
243 差分箇所表示部
260 システムバス
Claims (5)
- 文書データ群に含まれる複数の文書データの各二文書データ間の内容の類似度を算出する類似度算出手段と、
前記文書データ群に含まれる文書データのうち利用者により選択された文書データに類似する一又は複数の文書データを前記類似度算出手段で算出した類似度に基づいて抽出する文書データ抽出手段と、
前記文書データ抽出手段で抽出した文書データを識別する識別記号と前記利用者に選択された文書データを識別する識別記号とを各文書データの文字数に基づいて整列して表示する識別表示整列手段と、
前記識別表示整列手段で表示した識別記号同士をリンクするリンク記号を選択可能に表示するリンク表示手段と、
前記リンク記号が利用者から選択されたことに応じて、該リンクされている識別記号に対応する文書データをそれぞれ特定する文書データ特定手段と、
類似度に対応付けられて予め複数記憶されている類似情報のうち、前記文書データ特定手段で特定した文書データ間の類似度に対応する類似情報を表示する類似情報表示手段と、を備え、
前記類似度算出手段は、二文書データ間の内容を各文書データのページ毎に比較してページ毎の類似度を算出するページ別類似度算出手段を含み、
前記類似情報表示手段は、前記ページ毎の類似度に基づいて利用者の操作を分類して表示する、
ことを特徴とする類似文書可視化装置。 - 前記識別表示整列手段で整列した識別記号それぞれに対応する文書データについて、該文書データと最も類似度の高い文書データを前記類似度算出手段に基づいて判定する類似度判定手段をさらに備え、
前記リンク表示手段は、
前記類似度判定手段で判定した類似度の文書データの識別記号同士をリンクするリンク記号を選択可能に表示する、
ことを特徴とする請求項1に記載の類似文書可視化装置。 - 前記類似度算出手段は、
前記ページ別類似度算出手段で算出したページ毎の類似度に基づいて前記二文書データ間の類似度を算出し、
前記類似情報表示手段は、
前記ページ別類似度算出手段で算出したページ毎の類似度に基づいて前記文書データ特定手段で特定した文書データ間のページ毎の類似情報を表示する、
ことを特徴とする請求項1又は2に記載の類似文書可視化装置。 - 文書データ群に含まれる複数の文書データの各二文書データ間の内容の類似度を算出する類似度算出ステップと、
前記文書データ群に含まれる文書データのうち利用者により選択された文書データに類似する一又は複数の文書データを前記類似度算出ステップで算出した類似度に基づいて抽出する文書データ抽出ステップと、
前記文書データ抽出ステップで抽出した文書データを識別する識別記号と前記利用者に選択された文書データを識別する識別記号とを各文書データの文字数に基づいて整列して表示する識別表示整列ステップと、
前記識別表示整列ステップで表示した識別記号同士をリンクするリンク記号を選択可能に表示するリンク表示ステップと、
前記リンク記号が利用者から選択されたことに応じて、該リンクされている識別記号に対応する文書データをそれぞれ特定する文書データ特定ステップと、
類似度に対応付けられて予め複数記憶されている類似情報のうち、前記文書データ特定ステップで特定した文書データ間の類似度に対応する類似情報を表示する類似情報表示ステップと、を備え、
前記類似度算出ステップは、二文書データ間の内容を各文書データのページ毎に比較してページ毎の類似度を算出するページ別類似度算出ステップを含み、
前記類似情報表示ステップでは、前記ページ毎の類似度に基づいて利用者の操作を分類して表示する、
ことを特徴とする類似文書可視化方法。 - コンピュータを、
文書データ群に含まれる複数の文書データの各二文書データ間の内容の類似度を算出する類似度算出手段、
前記文書データ群に含まれる文書データのうち利用者により選択された文書データに類似する一又は複数の文書データを前記類似度算出手段で算出した類似度に基づいて抽出する文書データ抽出手段、
前記文書データ抽出手段で抽出した文書データを識別する識別記号と前記利用者に選択された文書データを識別する識別記号とを各文書データの文字数に基づいて整列して表示する識別表示整列手段、
前記識別表示整列手段で表示した識別記号同士をリンクするリンク記号を選択可能に表示するリンク表示手段、
前記リンク記号が利用者から選択されたことに応じて、該リンクされている識別記号に対応する文書データをそれぞれ特定する文書データ特定手段、
類似度に対応付けられて予め複数記憶されている類似情報のうち、前記文書データ特定手段で特定した文書データ間の類似度に対応する類似情報を表示する類似情報表示手段、として機能させ、
前記類似度算出手段は、二文書データ間の内容を各文書データのページ毎に比較してページ毎の類似度を算出するページ別類似度算出手段を含み、
前記類似情報表示手段は、前記ページ毎の類似度に基づいて利用者の操作を分類して表示する、
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011222164A JP5758262B2 (ja) | 2011-10-06 | 2011-10-06 | 類似文書可視化装置、類似文書可視化方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011222164A JP5758262B2 (ja) | 2011-10-06 | 2011-10-06 | 類似文書可視化装置、類似文書可視化方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013084060A JP2013084060A (ja) | 2013-05-09 |
JP5758262B2 true JP5758262B2 (ja) | 2015-08-05 |
Family
ID=48529210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011222164A Active JP5758262B2 (ja) | 2011-10-06 | 2011-10-06 | 類似文書可視化装置、類似文書可視化方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5758262B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7134814B2 (ja) * | 2018-09-28 | 2022-09-12 | キヤノン株式会社 | システム、ページデータ出力方法、及びプログラム |
CN109710146B (zh) * | 2018-12-07 | 2022-03-11 | 北京小米移动软件有限公司 | 文档显示方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001117935A (ja) * | 1999-10-19 | 2001-04-27 | Fujitsu Ltd | テキスト情報アクセス装置、その方法、及び記録媒体 |
JP2002312352A (ja) * | 2001-04-12 | 2002-10-25 | Ricoh Co Ltd | 関連文書管理システム |
JP4238616B2 (ja) * | 2003-03-28 | 2009-03-18 | 株式会社日立製作所 | 類似文書検索方法および類似文書検索装置 |
JP2005122295A (ja) * | 2003-10-14 | 2005-05-12 | Fujitsu Ltd | 関係図作成プログラム、関係図作成方法、および関係図作成装置 |
JP4977452B2 (ja) * | 2006-01-24 | 2012-07-18 | 株式会社リコー | 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム |
JP2009294993A (ja) * | 2008-06-06 | 2009-12-17 | Konica Minolta Holdings Inc | 関連文書抽出方法、関連文書抽出システム、及び関連文書抽出プログラム |
-
2011
- 2011-10-06 JP JP2011222164A patent/JP5758262B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013084060A (ja) | 2013-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4848317B2 (ja) | データベースのインデックス作成システム、方法及びプログラム | |
JP2015076064A (ja) | 情報処理装置、情報処理方法、プログラムならびに記憶媒体 | |
JP2009169689A (ja) | データ分類方法およびデータ処理装置 | |
JP5758262B2 (ja) | 類似文書可視化装置、類似文書可視化方法およびプログラム | |
JP6948492B2 (ja) | 情報管理装置並びにファイル管理方法 | |
US9292704B2 (en) | Information processing device for detecting an illegal stored document, illegal stored document detection method and recording medium | |
JP2009252185A (ja) | 情報検索装置、情報検索方法、制御プログラム及び記録媒体 | |
WO2016190444A1 (ja) | 情報管理装置並びにファイル管理方法 | |
JP5494066B2 (ja) | 検索装置、検索方法および検索プログラム | |
JP6994138B2 (ja) | 情報管理装置並びにファイル管理方法 | |
JP6091471B2 (ja) | ソースコード解析装置、ソースコード解析方法およびソースコード解析プログラム | |
CN110321125A (zh) | 单元格的数据配置方法、数据配置装置及可读存储介质 | |
US9990387B2 (en) | Information processing apparatus, information processing method and non-transitory computer readable medium | |
JP6413597B2 (ja) | 分析プログラム、分析方法及び分析装置 | |
US7840583B2 (en) | Search device and recording medium | |
JP4870732B2 (ja) | 情報処理装置、名寄せ方法及びプログラム | |
JP7068404B2 (ja) | 長期間に関連のあるイシュー単位のクラスタを利用した文書タイムラインを提供する方法およびシステム | |
JP2009301511A (ja) | 索引情報作成装置、索引情報作成方法及びプログラム | |
JP2009193298A (ja) | 情報処理装置及び情報処理方法及びプログラム | |
JP2008139359A (ja) | 地図データ処理方法及び装置 | |
JP2008009678A (ja) | 論理図面表示方法、プログラム及び装置 | |
CN105095331B (zh) | 信息处理器和信息处理方法 | |
JP2021026471A (ja) | 情報管理装置並びにファイル管理方法 | |
JP5768561B2 (ja) | 入力支援プログラム、入力支援装置、及び入力支援方法 | |
CN114997130A (zh) | 一种目录生成方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5758262 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |