JP2008257444A - 類似ファイル管理装置、その方法及びそのプログラム - Google Patents
類似ファイル管理装置、その方法及びそのプログラム Download PDFInfo
- Publication number
- JP2008257444A JP2008257444A JP2007098386A JP2007098386A JP2008257444A JP 2008257444 A JP2008257444 A JP 2008257444A JP 2007098386 A JP2007098386 A JP 2007098386A JP 2007098386 A JP2007098386 A JP 2007098386A JP 2008257444 A JP2008257444 A JP 2008257444A
- Authority
- JP
- Japan
- Prior art keywords
- file
- unit
- similar
- similarity
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
- G06F21/645—Protecting data integrity, e.g. using checksums, certificates or signatures using a third party
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2151—Time stamp
Abstract
【解決手段】ファイルに含まれる各単位について、単位内容から所定の計算式を用いて該単位に固有の情報を得る単位固有情報生成手段と、各単位に固有の情報をファイル間で各単位毎に比較することによりファイル間の類似度を求めるファイル類似度計算手段と、或るファイルが指定された場合、他のファイルについて、該或るファイルとの間の類似度及びファイル識別情報とを表示する表示手段と、を備える。各単位の固有の情報はハッシュ値、サムチェック値又はCRC値であってもよい。単位は、ページ、章、節又は段落であってもよい。
【選択図】図1
Description
2 文書編集部
3 文書管理部
10 ファイル操作部
20 識別情報管理部
30 ファイル保管部
100 ファイル保存手段
101 類似ファイル照会手段
102 ファイル読込手段
200 識別情報生成手段
Claims (7)
- ファイルに含まれる各単位について、単位内容から所定の計算式を用いて該単位に固有の情報を得る単位固有情報生成手段と、
各単位に固有の情報をファイル間で各単位毎に比較することによりファイル間の類似度を求めるファイル類似度計算手段と、
或るファイルが指定された場合、他のファイルについて、該或るファイルとの間の類似度及びファイル識別情報とを表示する表示手段と、
を備えることを特徴とする類似ファイル管理装置。 - 請求項1に記載の類似ファイル管理装置において、
各単位の固有の情報はハッシュ値、サムチェック値又はCRC値であることを特徴とする類似ファイル管理装置。 - 請求項1又は2に記載の類似ファイル管理装置において、前記単位は、ページ、章、節又は段落であることを特徴とする類似ファイル管理装置。
- ファイルに含まれる各単位について、単位内容から所定の計算式を用いて該単位に固有の情報を得る単位固有情報生成ステップと、
各単位に固有の情報をファイル間で各単位毎に比較することによりファイル間の類似度を求めるファイル類似度計算ステップと、
或るファイルが指定された場合、他のファイルについて、該或るファイルとの間の類似度及びファイル識別情報とを表示する表示ステップと、
を備えることを特徴とする類似ファイル管理方法。 - 請求項4に記載の類似ファイル管理方法において、
各単位の固有の情報はハッシュ値、サムチェック値又はCRC値であることを特徴とする類似ファイル管理方法。 - 請求項4又は5に記載の類似ファイル管理方法において、前記単位は、ページ、章、節又は段落であることを特徴とする類似ファイル管理方法。
- コンピュータを請求項1乃至3の何れか1項に記載の類似ファイル管理装置として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007098386A JP2008257444A (ja) | 2007-04-04 | 2007-04-04 | 類似ファイル管理装置、その方法及びそのプログラム |
US12/078,729 US8005830B2 (en) | 2007-04-04 | 2008-04-03 | Similar files management apparatus and method and program therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007098386A JP2008257444A (ja) | 2007-04-04 | 2007-04-04 | 類似ファイル管理装置、その方法及びそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008257444A true JP2008257444A (ja) | 2008-10-23 |
Family
ID=39827846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007098386A Pending JP2008257444A (ja) | 2007-04-04 | 2007-04-04 | 類似ファイル管理装置、その方法及びそのプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8005830B2 (ja) |
JP (1) | JP2008257444A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010231252A (ja) * | 2009-03-25 | 2010-10-14 | Symantec Corp | 電子メールコンテンツ包含を検出するシステム及び方法 |
JP2010256951A (ja) * | 2009-04-21 | 2010-11-11 | Data Henkan Kenkyusho:Kk | 類似データ検索装置及びそのプログラム |
WO2013073999A2 (ru) | 2011-11-18 | 2013-05-23 | Общество С Ограниченной Ответственностью "Центр Инноваций Натальи Касперской" | Способ автоматизированного анализа текстовых документов |
WO2013108745A1 (ja) * | 2012-01-16 | 2013-07-25 | 日本電気株式会社 | ストレージ装置、その制御方法、及びプログラム |
WO2013108746A1 (ja) * | 2012-01-16 | 2013-07-25 | 日本電気株式会社 | 検索システム、その制御方法、及びプログラム |
JP5547814B2 (ja) * | 2010-11-08 | 2014-07-16 | 株式会社日立製作所 | 計算機システム、仮想サーバへのボリューム割り当て方法及び計算機読み取り可能な記憶媒体 |
US9235624B2 (en) | 2012-01-19 | 2016-01-12 | Nec Corporation | Document similarity evaluation system, document similarity evaluation method, and computer program |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8874579B2 (en) | 2011-08-18 | 2014-10-28 | Verisign, Inc. | Systems and methods for identifying associations between malware samples |
JP2014141003A (ja) * | 2013-01-23 | 2014-08-07 | Canon Inc | 画像形成装置及びその制御方法、並びにプログラム |
US9880983B2 (en) * | 2013-06-04 | 2018-01-30 | X1 Discovery, Inc. | Methods and systems for uniquely identifying digital content for eDiscovery |
CN104636480B (zh) * | 2015-02-13 | 2018-09-28 | 华为技术有限公司 | 重建备机数据库的方法及其装置 |
CN104615768B (zh) * | 2015-02-13 | 2017-06-16 | 广州神马移动信息科技有限公司 | 文档的同本识别方法及装置 |
RU2633156C1 (ru) * | 2016-10-12 | 2017-10-11 | Общество с ограниченной ответственностью "Лаборатория ИнфоВотч" | Способ автоматизированного анализа векторных изображений |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04324540A (ja) | 1991-04-25 | 1992-11-13 | Kobe Nippon Denki Software Kk | テキスト変更管理方式 |
JPH06348760A (ja) | 1993-01-08 | 1994-12-22 | Internatl Business Mach Corp <Ibm> | データ・ベースにテキストを貯蔵するのに用いるキーを生成する方法 |
US5465353A (en) * | 1994-04-01 | 1995-11-07 | Ricoh Company, Ltd. | Image matching and retrieval by multi-access redundant hashing |
JPH0858176A (ja) | 1994-08-19 | 1996-03-05 | Fuji Xerox Co Ltd | 画像出力装置 |
JP3577972B2 (ja) | 1998-10-19 | 2004-10-20 | 日本電信電話株式会社 | 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体 |
JP2000357115A (ja) | 1999-06-15 | 2000-12-26 | Nec Corp | ファイル検索装置及びファイル検索方法 |
JP4483049B2 (ja) | 2000-08-18 | 2010-06-16 | ヤマハ株式会社 | マルチメディアコンテンツの登録システム |
JP3899795B2 (ja) | 2000-09-21 | 2007-03-28 | 日本電気株式会社 | ファイル管理システムおよび方法 |
JP2003186714A (ja) | 2001-12-21 | 2003-07-04 | Nec Corp | 文書ファイルの最新版管理装置及びその方法 |
US7490116B2 (en) * | 2003-01-23 | 2009-02-10 | Verdasys, Inc. | Identifying history of modification within large collections of unstructured data |
JP4297345B2 (ja) | 2004-01-14 | 2009-07-15 | Kddi株式会社 | マスメイル検出方式およびメイルサーバ |
JP2006031181A (ja) | 2004-07-13 | 2006-02-02 | Canon Inc | 画像検索装置、方法、記憶媒体及びプログラム |
JP2006164152A (ja) | 2004-12-10 | 2006-06-22 | Canon Inc | 印刷処理方法及びシステム |
JP4445849B2 (ja) | 2004-12-27 | 2010-04-07 | 日本電信電話株式会社 | ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム |
US7565348B1 (en) * | 2005-03-24 | 2009-07-21 | Palamida, Inc. | Determining a document similarity metric |
JP4600665B2 (ja) | 2005-03-24 | 2010-12-15 | 富士ゼロックス株式会社 | 文書管理方法及び文書管理システム |
US20080097972A1 (en) * | 2005-04-18 | 2008-04-24 | Collage Analytics Llc, | System and method for efficiently tracking and dating content in very large dynamic document spaces |
US20080120319A1 (en) * | 2006-11-21 | 2008-05-22 | International Business Machines Corporation | System and method for identifying computer users having files with common attributes |
US9015301B2 (en) * | 2007-01-05 | 2015-04-21 | Digital Doors, Inc. | Information infrastructure management tools with extractor, secure storage, content analysis and classification and method therefor |
-
2007
- 2007-04-04 JP JP2007098386A patent/JP2008257444A/ja active Pending
-
2008
- 2008-04-03 US US12/078,729 patent/US8005830B2/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010231252A (ja) * | 2009-03-25 | 2010-10-14 | Symantec Corp | 電子メールコンテンツ包含を検出するシステム及び方法 |
JP2010256951A (ja) * | 2009-04-21 | 2010-11-11 | Data Henkan Kenkyusho:Kk | 類似データ検索装置及びそのプログラム |
JP5547814B2 (ja) * | 2010-11-08 | 2014-07-16 | 株式会社日立製作所 | 計算機システム、仮想サーバへのボリューム割り当て方法及び計算機読み取り可能な記憶媒体 |
WO2013073999A2 (ru) | 2011-11-18 | 2013-05-23 | Общество С Ограниченной Ответственностью "Центр Инноваций Натальи Касперской" | Способ автоматизированного анализа текстовых документов |
WO2013108745A1 (ja) * | 2012-01-16 | 2013-07-25 | 日本電気株式会社 | ストレージ装置、その制御方法、及びプログラム |
WO2013108746A1 (ja) * | 2012-01-16 | 2013-07-25 | 日本電気株式会社 | 検索システム、その制御方法、及びプログラム |
US9235624B2 (en) | 2012-01-19 | 2016-01-12 | Nec Corporation | Document similarity evaluation system, document similarity evaluation method, and computer program |
Also Published As
Publication number | Publication date |
---|---|
US8005830B2 (en) | 2011-08-23 |
US20080249977A1 (en) | 2008-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008257444A (ja) | 類似ファイル管理装置、その方法及びそのプログラム | |
KR101246996B1 (ko) | 전자 데이터 스냅샷 생성기 | |
JP4869630B2 (ja) | コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム | |
US7797337B2 (en) | Methods, systems, and computer program products for automatically associating data with a resource as metadata based on a characteristic of the resource | |
US8180757B2 (en) | System and method for leveraging tag context | |
KR20080021050A (ko) | 메타데이터를 보고 에디트하기 위하여 개별화된 사용자인터페이스를 제공하기 위한 방법 및 시스템 | |
US20090313539A1 (en) | Information processor, information processing method, and recording medium | |
US20080154869A1 (en) | System and method for constructing a search | |
JP2011191862A (ja) | ファイル管理装置、ファイル管理システム、およびファイル管理プログラム | |
KR101674249B1 (ko) | 컨텍스트-기반 아이템 북마킹 | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
JP2009271659A (ja) | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 | |
JP4288247B2 (ja) | 履歴作成装置、活動履歴作成方法、及び活動履歴作成プログラム | |
US9183507B1 (en) | Context based inference of save location | |
US20140229816A1 (en) | Methods and devices for tagging a document | |
US11163938B2 (en) | Providing semantic based document editor | |
JP6707410B2 (ja) | 文献検索装置、文献検索方法およびコンピュータプログラム | |
JP2009223679A (ja) | 電子文書検索装置、及び電子文書検索プログラム | |
US20140223274A1 (en) | Information processing device and information processing method | |
JP2005085109A (ja) | 情報検索装置及びプログラム | |
JP2018005759A (ja) | 引用マップ生成装置、引用マップ生成方法およびコンピュータプログラム | |
JP2007011721A (ja) | 文書検索装置 | |
JP2023009021A (ja) | 情報処理装置 | |
JP2023104183A (ja) | プログラム及び情報処理方法 | |
JP2021081890A (ja) | 情報処理システム、情報処理装置、および、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090126 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091005 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20091026 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20091204 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101110 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101110 |