TW201415275A - 取證系統、取證方法及取證程式 - Google Patents

取證系統、取證方法及取證程式 Download PDF

Info

Publication number
TW201415275A
TW201415275A TW102136452A TW102136452A TW201415275A TW 201415275 A TW201415275 A TW 201415275A TW 102136452 A TW102136452 A TW 102136452A TW 102136452 A TW102136452 A TW 102136452A TW 201415275 A TW201415275 A TW 201415275A
Authority
TW
Taiwan
Prior art keywords
document
score
unit
information
forensic system
Prior art date
Application number
TW102136452A
Other languages
English (en)
Other versions
TWI556128B (zh
Inventor
Masahiro Morimoto
Yoshikatsu Shirai
Hideki Takeda
Kazumi Hasuko
Original Assignee
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubic Inc filed Critical Ubic Inc
Publication of TW201415275A publication Critical patent/TW201415275A/zh
Application granted granted Critical
Publication of TWI556128B publication Critical patent/TWI556128B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明提供一種能夠減輕檢閱人的檢閱負擔的取證系統,該系統具備:結果資訊接受部,用於接受結果資訊,該結果資訊為使用者對從在數位資訊包含的文檔資料中提取出的、包含規定數量文檔的文檔組、進行的與訴訟之間的關聯性判斷的結果;要素選定部,針對各結果資訊,根據文檔組中共同出現的要素特徵計算該要素的評估值,並基於該評估值選定要素;評分計算部,根據文檔資料中的各文檔所包含的被選定的要素及被選定的要素的評估值計算文檔資料中各文檔的評分;以及重現率計算部,基於評分計算重現率,該重現率與訴訟之間的關聯性的判斷相關。

Description

取證系統、取證方法及取證程式
本發明屬於一種取證系統、取證方法及取證程式,特別關於一種用於收集與訴訟相關的數位文檔資訊的取證系統、取證方法及取證程式。
以往,提出一種裝置或技術,當發生非法訪問或機密資訊的洩露等與電腦相關的犯罪或法律糾紛時,能夠收集並分析原因查明或調查所需的儀器、資料或電子記錄,從而明確其法律證據力。
此外,在美國民事訴訟中,由於需要eDiscovery(電子證據公開)等,該訴訟的原告及被告均有責任提出全部相關數位資訊作為證據。因此必須提出記錄在電腦或伺服器中的數位資訊作為證據。
另一方面,隨著IT的迅猛發展和普及,當今商務世界中幾乎所有的資訊均由計算機制作,因此即便在同一個企業內部,也氾濫著大量的數位資訊。
因此,在為了向法庭提交證據材料而進行準備工作的過程中,容易產生不一定與相應訴訟相關的機密數位資訊也包含在證據材料中的失誤。而且,還存在提交與訴訟無關的機密數位資訊的問題。
近年來,在專利文獻1至專利文獻3中提出了與取證系統中的文檔資料相關的技術。在專利文獻1中公開如下的取證系統:從文檔提出命令物件者資訊中包含的至少一人以上的物件者中,指定特定者,基於與被指定的特定者相關的訪問歷史資訊,僅提取特定者訪問過的數位文檔 資料,並設置用於表示所提取的數位文檔資料中各文檔文件是否為與訴訟相關的檔的附帶資訊,基於附帶資訊輸出與訴訟相關的文檔文件。
此外,在專利文獻2中公開了如下的取證系統:顯示所記錄的數位資訊,各文檔文件中均設有表示是否與物件者資訊中包含的任一物件者相關的物件者特定資訊,並將設置的該物件者特定資訊設置為記錄在存儲部中,指定至少一人以上的對象者,並檢索設有與指定的物件者對應的物件者特定資訊的文檔文件,通過顯示部設置表示所檢索出的文檔文件是否與訴訟相關的附帶資訊,基於附帶資訊輸出與訴訟相關的文檔文件。
進一步地,在專利文獻3中公開如下的取證系統:接受數位文檔資料中包含的至少一個以上文檔文件的指定,接受用何種語言翻譯所指定的文檔文件的指定,將接受指定的文檔文件翻譯成接受指定的語言,從記錄在記錄部中的數位文檔資料中提取出與指定的文檔文件表示同一個內容的共同文檔文件,生成表示所提取的共同文檔文件通過援引已被翻譯的文檔文件的翻譯內容進行翻譯的翻譯相關資訊,基於翻譯相關資訊輸出與訴訟相關的文檔文件。
【現有技術文獻】
【專利文獻】
專利文獻1:日本專利申請公開2011-209930號公報
專利文獻2:日本專利申請公開2011-209931號公報
專利文獻3:日本專利申請公開2012-32859號公報
然而,例如在如專利文獻1至專利文獻3的取證系統中,需要收集使用多台電腦和伺服器的物件者的龐大的文檔資料。
辨別將這種已被數位化的龐大的文檔資料作為訴訟證據材 料是否妥當的工作,是由被稱為「檢閱人」的用戶通過目測來確認,需要一一辨別該文檔資料,因此,存在耗費大量勞力和時間的問題。
因此,鑒於上述情況,本發明的目的在於提供一種能夠減輕檢閱人的檢閱負擔取證系統、取證方法及取證程式。
本發明的取證系統用於獲取記錄在多台電腦或伺服器中的數位資訊,並對所獲取的上述數位資訊進行與訴訟之間的關聯性分析,具備:結果資訊接受部,用於接受結果資訊,該結果資訊為使用者對從在數位資訊包含的文檔資料中提取出的包含規定數量文檔的文檔組進行與訴訟之間的關聯性的判斷的結果;要素選定部,從每個結果資訊在文檔組中共同出現的要素的特徵計算該要素的評估值,並基於該評估值選定要素;評分計算部,從文檔資料中各文檔包含的被選定的要素及被選定的要素的評估值計算出文檔資料中各文檔的評分;及重現率計算部,基於評分計算重現率,該重現率同與訴訟之間的關聯性的判斷相關。
「文檔」是指包含一個以上單詞的資訊。作為文檔的一例,可舉電子郵件、演示資料、試算表計算資料、會談資料、合同、組織圖或事業計畫書等。
「文檔資料」為文檔的集合。
「文檔組」為文檔的集合,是指文檔資料的部分集合。文檔資料也可以指需要進行與訴訟之間的關聯性判斷的全部文檔,文檔組也可以指在文檔資料中使用者進行關聯性判斷的文檔。
「關聯性判斷」為針對文檔進行的有無必要在訴訟中提出的判斷。例如,關聯性判斷也可為根據關聯性程度賦予識別符的行為。
「結果資訊」為表示使用者對文檔所進行的與訴訟之間的關聯性判斷結果的資訊。結果資訊也可以指使用者賦予文檔的表示與訴訟之間的關聯性程度的識別符。
「結果資訊接受部」用於接受與用戶對文檔進行的判斷結果相關的結果資訊。
「要素」為文檔包含的單詞、記號、圖等的文檔的結構要素。例如,要素也可以指在某種語言中分割到繼續分解則失去意義為止所提取的各音素匯總,諸如詞素。
「要素選定部」用於從要素的評估值選定要素。要素選定部也可能夠在用戶進行的與訴訟之間的關聯性判斷中,提取接受了相同判斷的各文檔中共同出現的要素。此外,要素選定部也能夠基於要素攜帶的傳遞信息量計算評估值。此外,要素選定部也能夠基於評估值之和選定要素。此外,要素選定部也能夠按評估值的降冪排序要素,並提取要素直到要素的評估值之和達到固有目標值為止,選定所提取的要素。
「評估值」為表示要素特徵的值。評估值也可為表示要素攜帶的傳遞信息量的值。
「傳遞信息量」為在概率學及資訊理論中,表示兩個概率變數的相互依賴尺度的量。具體來說,傳遞信息量也可為表示針對包含該要素的文檔的關聯性判斷結果和其要素之間的依賴關係的尺度。
「固有目標值」為表示目標重現率的值。固有目標值也可為由百分比表示的值。
「評分計算部」計算文檔評分。例如,評分計算部也能夠將文檔包含的要素的評估值之和作為評分計算的。
「重現率」為與訴訟之間的關聯性判斷相關的值。重現率也可為表示系統自動重現人所做的關聯性判斷的程度的指標。
「重現率計算部」計算重現率。例如,重現率計算部也能夠評估本發明的系統對文檔賦予的評分值,並計算與用戶的關聯性判斷之間的一致率。
此外,重現率計算部也能夠基於文檔組的文檔的所占比例計 算重現率,該文檔組的文檔包含在已計算評分的文檔之中的具有規定評分以上的文檔中。此外,重現率計算部也可為將已計算評分的文檔資料中的各文檔按評分的降冪排序,並從評分的上位提取規定比例的文檔,將文檔組在所提取的文檔中的所占比例作為重現率來計算的部分。
此外,本發明的取證系統可進一步具備自動判斷部,對評分超過規定閾值的文檔與訴訟之間的關聯性進行相關的判斷。
「自動判斷部」自動對文檔進行與訴訟之間的關聯性判斷。例如,自動判斷部也能夠在評分計算部對文檔賦予的評分超過規定閾值時,判斷為具有關聯性。
此外,本發明的取證系統可進一步具備:提取部,從在數位資訊包含的文檔資料提取包含規定數量文檔的文檔組;以及顯示部,在畫面上顯示所提取的文檔組。
「提取部」從數位資訊中的文檔資料提取文檔組。提取部也能夠基於文檔資料的更新日期時間等屬性進行提取。此外,提取部也可具備從文檔資料隨機採樣文檔組並進行提取的功能。
「顯示部」顯示所提取的文檔組。顯示部也可為使用者使用的用戶端等顯示裝置。
此外,本發明的取證系統可進一步具備要素再選定部,在重現率低於固有目標值時使用要素的評估值之和及固有目標值與重現率的差重新選定要素。
「要素再選定部」對要素選定部所選定的要素進行重新選定。
此外,要素再選定部也能夠在重現率低於固有目標值時,從要素集合中提取並選定要素,直到重現率超過固有目標值為止,該要素集合為從要素中去除、直到要素的評估值之和達到固有目標值與重現率的差為止提取出的要素之後的集合。
此外,評分計算部可進一步地:在重現率低於固有目標值時,利用要素再選定部選定的要素和該要素再選定部重新選定的要素的評估值來計算文檔資料中各文檔的第二評分,並通過評分和第二評分的合成,再次計算文檔資料中各文檔的評分。
「第二評分」為評分計算部通過使用要素再選定部重新選定的要素,再次計算的文檔的評分。
此外,本發明的取證方法,獲取記錄在多台電腦或伺服器中的數位資訊,並對所獲取的該數位資訊進行與訴訟之間的關聯性判斷,其中,電腦執行以下的步驟:接受結果資訊,該結果資訊為,使用者對從在數位資訊包含的文檔資料提取的包含規定數量文檔的文檔組,進行與訴訟之間的關聯性判斷的結果;根據每一個結果資訊在文檔組中共同出現的要素的特徵計算該要素的評估值,並根據該評估值選定要素;根據文檔資料中的各文檔包含的被選定的要素及被選定的要素的評估值計算文檔資料中各文檔的評分;及根據評分計算重現率,該重現率同與訴訟之間的關聯性判斷相關。
此外,本發明的取證程式,獲取記錄在多台電腦或伺服器中的數位資訊,並對所獲取的該數位資訊分析與訴訟之間的關聯性,其中,使電腦實現以下的功能:接受結果資訊,該結果資訊為,使用者對從數位資訊包含的文檔資料中提取的包含規定數量文檔的文檔組,進行與訴訟之間的關聯性判斷的結果;根據每一個結果在資訊文檔組中共同出現於的要素的特徵計算該要素的評估值,並根據該評估值選定要素;根據文檔資料中的各文檔包含的被選定的要素及被選定的要素的評估值來計算文檔資料中各文檔的評分;以及根據評分計算重現率,該重現率同與訴訟之間的關聯性判斷相關。
本發明的取證系統、取證方法及取證程式執行如下的步驟: 接受結果資訊,該結果資訊為,使用者對從數位資訊包含的文檔資料提取的包含規定數量文檔的文檔組,進行與訴訟之間的關聯性判斷的結果;根據每一個結果在資訊文檔組中共同出現的要素的特徵計算該要素的評估值,並根據該評估值選定要素;根據文檔資料中的各文檔包含的被選定的要素及被選定的要素的評估值計算文檔資料中各文檔的評分;以及根據評分計算重現率,該重現率同與訴訟之間的關聯性判斷相關。由此,即使在系統自動進行的情況下,也能通過對系統的判斷與人的判斷一致到何種程度進行檢測,從而提高判斷精度。
此外,當本發明的要素選定部用於根據評估值之和選定要素時,能夠抑制系統使用的要素的數量,從而減少噪音(是指被分配到與訴訟無關的文檔的評分)。
此外,當本發明的要素選定部根據評估值的降冪排序要素,並提取要素直到要素的評估值之和達到固有目標值為止,選定所提取的要素。此時,能夠抑制系統使用的要素的數量,從而減少噪音。
此外,當本發明的重現率計算部,根據在已計算評分的文檔之中的具有規定評分以上的文檔中的、文檔組的文檔所占比例、來計算重現率的部分時,能夠根據文檔的評分來評估系統的關聯性判斷的傾向,並判斷與用戶的關聯性判斷的傾向之間的一致程度。
此外,當本發明的重現率計算部將已計算評分的文檔資料中的各文檔按評分的降冪排序,並從評分的上位提取規定比例的文檔,將文檔組在所提取的文檔中的所占比例作為重現率來計算時,能夠根據文檔的評分來評估系統的關聯性判斷的傾向,並判斷與用戶的關聯性判斷傾向之間的一致程度。
此外,當本發明的取證系統進一步具備對評分超過規定閾值的文檔與訴訟之間的關聯性進行相關判斷的自動判斷部時,能夠根據使用者的關聯性判斷的傾向,自動進行文檔與訴訟之間的關聯性判斷。
此外,當本發明的取證系統進一步具備從數位資訊包含的文檔資料提取包含規定數量文檔的文檔組的提取部和在畫面上顯示所提取的文檔組的顯示部時,能夠提取用戶進行關聯性判斷的文檔,並在使用者的終端上顯示。
此外,當本發明的取證系統進一步具備在重現率低於固有目標值時使用要素的評估值之和及固有目標值與重現率的差重新選定要素的要素再選定部時,能夠在重現率未達到目標值時,再次選擇在評分計算中使用的要素,並提高關聯性判斷的精度。
此外,本發明的要素再選定部在重現率低於固有目標值時,從要素集合中提取並選定要素,直到重現率超過固有目標值為止,其中該要素集合為從要素中去除直到要素評估值之和達到固有目標值與重現率之差為止提取出的要素之後的集合。此時,在重現率未達到目標值時,能夠從與上一次使用的要素不同的要素再次選擇用於評分計算的要素,並且能夠提高關聯性判斷的精度。
此外,當本發明的評分計算部進一步在重現率低於固有目標值時,利用要素再選定部選定的要素和該要素再選定部重新選定的要素的評估值來計算文檔資料中各文檔的第二評分,並通過評分和第二評分的合成,再次計算文檔資料中各文檔的評分的部分時,能夠通過將上一次評分與第二評分的合成評分作為評分來使用,從而提高重現率。
100‧‧‧伺服器裝置
111‧‧‧結果資訊接受部
112‧‧‧要素選定部
113‧‧‧評分計算部
114‧‧‧重現率計算部
115‧‧‧要素再選定部
116‧‧‧顯示部
117‧‧‧提取部
118‧‧‧自動判斷部
200‧‧‧用戶端
211‧‧‧畫面顯示部
I1‧‧‧檢閱畫面
圖1為在本發明的第一實施方式中的取證系統的框圖;圖2為採用範本表示在本發明的第一實施方式中的檢閱畫面的圖;圖3為表示本發明的第一實施方式的教師資料製作處理流程的流程圖;圖4為表示本發明的第一實施方式的重現率提高處理流程的流程圖;圖5為表示在本發明的其他實施方式中的取證系統的框圖;以及 圖6為表示在本發明的其他實施方式中的自動判斷部的處理流程的流程圖。
[第一實施方式]
下面,使用圖1至圖4說明本發明的第一實施方式。
本發明的第一實施方式的取證系統,用於獲取記錄在多台電腦或伺服器中的數位資訊,並對獲取的該數位資訊進行與訴訟之間的關聯性分析,具備:用於接受結果資訊,結果資訊接受部111,該結果資訊為使用者對從在數位資訊包含的文檔資料提取的、包含規定數量文檔的文檔組、進行與訴訟之間的關聯性判斷的結果;要素選定部112,針對每個結果資訊,根據文檔組中共同出現的要素的特徵計算該要素的評估值,並根據該評估值選定要素;評分計算部113,根據文檔資料中的各文檔包含的被選定的要素及被選定的要素的評估值計算文檔資料中各文檔的評分;以及重現率計算部114,根據評分計算重現率,該重現率同與訴訟之間的關聯性判斷相關。
此外,取證系統可進一步具備:提取部117,從數位資訊包含的文檔資料提取包含規定數量文檔的文檔組;以及顯示部116,將所提取的文檔組顯示在畫面上。
此外,取證系統可進一步具備要素再選定部115,該要素再選定部115在重現率低於固有目標值時,利用要素評估值之和及固有目標值與重現率的差來重新選定要素。
取證系統具備電腦或伺服器,通過基於各種輸入使CPU執行記錄在ROM中的程式,從而作為各種功能部進行操作。該程式可為存儲在CD-ROM等存儲媒體中的程式,或者也可為通過互聯網等網路發佈並安裝在電腦上的程式。
在本實施方式中,被稱為檢閱人的使用者為了從文檔資料中提取在訴訟中需要提交的文檔而進行與訴訟之間的關聯性判斷。文檔為包 含一個以上單詞的資訊。作為文檔資料的一例,可舉電子郵件、演示資料、試算表計算資料、會談資料、合同、組織圖或事業計畫書等。此外,也可將掃描資料作為文檔資料處理。此時,也可在取證系統內具備OCR(Optical Character Reader)裝置,使得能夠將掃描資料變換為文本資料。通過由OCR裝置變更為文本資料,能夠根據掃描資料進行後述要素的分析和搜索。
文檔資料為文檔的集合體。文檔資料是指需要進行與訴訟之間的關聯性判斷的全部文檔,文檔組是指在文檔資料中,使用者進行關聯性判斷的文檔。系統或使用者所進行的用於判斷是否與訴訟相關的這一行為叫做檢閱。在檢閱中,根據訴訟關聯程度或與訴訟之間的關聯方法,將文檔組分為多個種類,該文檔組為構成檢閱物件的文檔。
圖1表示在第一實施方式中的取證系統的框圖。在本實施方式中,取證系統具備伺服器裝置100和用戶端200。
伺服器裝置100和用戶端200通過通信網路連接。通信網路是指有線或無線通訊線路。例如為電話線路、互聯網線路等。
用戶端200具有顯示圖2所示檢閱畫面I1的畫面顯示部211。檢閱人通過用戶端200連接於伺服器裝置100,並在檢閱畫面I1上進行檢閱。
伺服器裝置100具備結果資訊接受部111、要素選定部112、評分計算部113、重現率計算部114、要素再選定部115、顯示部116和提取部117。
在本實施方式中,各結構搭載在伺服器裝置100上,但也可分別搭載在不同的框架裡。
下面對圖1中記載的各結構進行說明。結果資訊接受部111接受檢閱人對文檔進行的檢閱結果。檢閱結果作為結果資訊來被接受。結果資訊也可為通過符號表示各文檔與訴訟之間的關聯程度的資訊。
要素選定部112提取按每個結果資訊在文檔中共同出現的要素,並從該要素的評估值選定用於後續處理的要素,其中該結果資訊為針 對各文檔的檢閱結果。
要素是指包含在文檔中的單詞、記號、圖等文檔的結構要素。例如,例如,要素也可以指在某種語言中分割到繼續分解則失去意義為止所提取的各音素匯總,諸如詞素。
評估值為表示要素特徵的值。評估值也可為表示要素攜帶的傳遞信息量的值。
此外,要素選定部112也可根據要素攜帶的傳遞信息量計算評估值。
傳遞信息量為在概率學及資訊理論中,表示兩個概率變數的相互依賴尺度的量。具體來說,傳遞信息量也可為表示針對包含該要素的文檔的關聯性進行的判斷結果和該要素之間的依賴關係程度的量。例如要素選定部112可選定傳遞信息量大的要素。
此外,要素選定部112也可以根據評估值之和選定要素。此外,要素選定部112按評估值的降冪排序要素,並提取要素直到要素的評估值之和達到固有目標值為止,選定所提取的該要素的部分。
固有目標值為表示目標重現率值的值。固有目標值也可為以百分比表示的值。
評分計算部113用於計算文檔評分。例如,評分計算部113可將包含在文檔中的要素的評估值之和作為評分來計算。
此外,評分計算部113可進一步為如後述那樣,在重現率低於固有目標值時,使用要素再選定部115選定的要素和該要素再選定部115重新選定的要素的評估值計算文檔資料中各文檔的第二評分,並通過評分和該第二評分的合成來再次計算文檔資料中各文檔的評分的部分。
第二評分為評分計算部113對各文檔計算的第二次以後的評分。
重現率計算部114用於計算評分計算部113的處理重現率。例 如,重現率計算部114也可用於評估伺服器裝置100對文檔賦予的評分值,並計算檢閱人的檢閱結果的重現性。
重現率為同與訴訟之間的關聯性判斷相關的值。重現率也可為表示系統自動重現人的關聯性判斷的程度的指標。
此外,重現率計算部114也可為根據文檔組的文檔在已計算評分的文檔中具有規定評分以上評分的文檔中的所占比例來計算重現率的部分。此外,重現率計算部114也可為將已計算評分的文檔資料中的各文檔按評分的降冪排序,並從評分的上位提取規定比例的文檔,將文檔組在所提取的文檔中的所占比例作為重現率來計算的部分。
提取部117用於從數位資訊中的文檔資料中提取文檔組。也可通過隨機採樣而提取。此外,也可基於文檔的更新日期時間等屬性進行提取。此外,提取部117也可具備從文檔資料隨機採樣文檔組並提取的功能。
顯示部116用於顯示所提取的文檔組。也可為在使用者使用的用戶端200上顯示的部分。
要素再選定部115用於再次選定要素選定部112選定的要素。此外,要素再選定部115也可在重現率低於固有目標值時,並從要素集合中提取並選定要素,直到在重現率超過固有目標值為止。該要素集合為:從要素中去除、直到要素的評估值之和達到固有目標值與重現率的差為止為止已被提取的要素之後的要素集合。
接下來,利用圖3及圖4說明取證系統的處理流程。
圖3為表示與教師資料製作流程相關的處理的圖表。取證系統基於檢閱人對教師資料所進行的檢閱結果特徵,進行其他文檔資料的關聯性判斷處理。
首先,提取部117從聚集的文檔資料隨機採樣用於提示給檢閱人的文檔組,並進行提取(步驟111)。接下來,顯示部116指示用戶端200的畫面顯示部211畫面顯示所提取的文檔組。此時,顯示部116指示得按日期 順序排列文檔並顯示。接受指示的畫面顯示部211在用戶端200上顯示文檔顯示畫面I1(步驟112)。檢閱人觀看顯示在文檔顯示畫面I1上的文檔並進行檢閱。具體來說,根據文檔與訴訟之間的關聯性程度,給文檔賦予識別符。由檢閱人被賦予的識別符作為結果資訊被結果資訊接受部111接受(步驟113)。如此,通過檢閱人檢閱的文檔組作為教師資料轉移到後續處理。
圖4為表示與重現率提高流程相關的處理的圖表。
要素選定部112分析教師資料,進行選定要素的處理。具體來說,將在賦予了共同識別符的文檔中共同出現的詞素作為要素來提取N個(步驟120)。對所提取的詞素,根據各詞素攜帶的傳遞信息量來計算評估值(步驟121)。例如將首次提取的詞素的評估值設為Wgt1,第二個設為Wgt2,第N個設為Wgtn。要素選定部112使用這個從Wgt1到Wgtn的評估值選定用於進行後續處理的詞素。具體來說,按評估值的降冪排序詞素,從評估值的上位按序選擇m個詞素,在滿足以下公式(1)、且直至其總和達到固有目標值(設為K:K為任意常數)為止。
K:固有目標值
wgt i :第i個詞素的評估值
在本實施方式中,固有目標值是指作為目標的重現率。
接下來,評分計算部113從文檔資料提取包含m個詞素的文檔(步驟130),並基於所包含的詞素的評估值,通過以下公式(2)計算各文檔的評分(步驟131)。此時,評分計算部113也對教師資料計算評分。
公式2
S i :第i個評分
m i :第i個詞素
wgt i :第i個詞素的評估值
接下來,重現率計算部114按評分的降冪排序文檔(包含教師資料)(步驟140),並提取被排序的文檔的上位A%(A為任意常數)(步驟141)。重現率計算部114根據教師資料在文檔數量中的所占比例來計算重現率X1(Xn:重現率計算部114第n次計算的重現率)(步驟142),其中,文檔數量包含在A%中。
接下來,要素再選定部115判斷重現率X1是否超過目標值K(步驟150)。當超過時(步驟150:YES)結束處理。當未滿時(步驟150:NO),要素再選定部115重新選定要素(步驟151)。具體來說,在從要素選定部112提取的N個詞素中去除在本次處理中使用的m個詞素後的詞素中,從評估值的上位按序選擇一個詞素,直至滿足以下公式(3)並且其總和達到固有目標值為止。
K:固有目標值
Wi:第i個詞素
Xn:第n個重現率
評分計算部113從包含教師資料的文檔中提取包含要素再選定部115重新選定的詞素的文檔(步驟130:第二輪),利用公式(1)計算各文檔的第二評分S1r;利用首次計算的評分S1和第二評分S1r的差Δ1(Δ1=S1r-S1),通過以下公式(4)計算各文檔的合成評分S2(步驟131:第二輪)。
S i :第i个评分
S i r:第i个第二评分
Δi:第i个评分和第i个第二评分的合成评分
利用合成評分S2,重現率計算部114再次計算重現率,並反復進行步驟130~步驟151的處理,直至超過目標值K為止。由此,能夠提高取證系統的檢閱處理精度,直至達到目標重現率。
[其他實施方式]
下面,利用圖5及圖6說明本發明的其他實施方式。
本發明的其他實施方式的取證系統,用於獲取記錄在多台電腦或伺服器中的數位資訊,並對獲取的該數位資訊進行與訴訟之間的關聯性分析,具備:結果資訊接受部111,用於接受結果資訊,該結果資訊為使用者對從數位資訊包含的文檔資料提取的、包含規定數量文檔的文檔組、進行與訴訟之間的關聯性判斷的結果;要素選定部112,根據按每個結果資訊在文檔組中共同出現的要素特徵,計算該要素的評估值,並基於該評估值選定要素;評分計算部113,根據包含在文檔資料中各文檔中的被選定的要素及被選定的要素的評估值,計算文檔資料中各文檔的評分;及重現率計算部114,根據評分計算重現率,該重現率同與訴訟之間的關聯性的判斷相關。
此外,在本實施方式中的取證系統可進一步具備自動判斷部118,該自動判斷部118針對評分超過規定閾值的文檔進行同與該訴訟之間的關聯性相關的判斷。
圖5表示在其他實施方式中的取證系統的框圖。在本實施方式中,取證系統具備伺服器裝置100和用戶端200。
用戶端200具有用於顯示圖2所示檢閱畫面I1的畫面顯示部211。檢閱人通過用戶端200連接於伺服器裝置100,在檢閱畫面I1上進行檢 閱。
伺服器裝置100具備結果資訊接受部111、要素選定部112、評分計算部113、重現率計算部114、要素再選定部115、顯示部116、提取部117和自動判斷部118。
在本實施方式中,各結構搭載在伺服器裝置100上,但也可分別搭載在不同的框架裡。
自動判斷部118自動對文檔進行與訴訟之間的關聯性判斷。例如,自動判斷部118也可在評分計算部113對文檔賦予的評分超過規定閾值時判斷為具有關聯性。
圖6為表示自動判斷部118的處理流程的圖。自動判斷部的處理在第一實施方式中在圖4所示的步驟150的處理結束後開始。
系統管理者對各個識別符輸入閾值(步驟201)。評分計算部113計算的評分超過該閾值的文檔則被自動判斷部判斷為被賦予與超過的評分相關的識別符的文檔。
例如對某文檔A,當評分計算部113計算的評分超過閾值時(步驟202:YES),自動判斷部118對某文檔A賦予識別符(步驟203)。另一方面,當未超過閾值時(步驟202:NO),不向文檔A賦予識別符。當在文檔資料中殘留有尚未判斷評分是否超過的文檔時(步驟204:YES),自動判斷部118再次執行步驟202的處理。當在文檔資料中沒有殘留尚未判斷評分是否超過的文檔時(步驟204:NO),自動判斷部118結束處理。
關於其他結構和功能,與第一實施方式相同。
取證系統通過執行結果資訊接受部111、要素選定部112、評分計算部113、重現率計算部114,減輕在用戶進行的在訴訟中所利用的文檔資料的關聯性的、判斷作業的負擔,而且能夠通過驗證系統自動執行的判斷與人的判斷一致到何種程度來提高判斷精度。其中,結果資訊接受部111,用於接受結果資訊,該結果資訊為使用者對從數位資訊包含的文檔資 料提取的包含規定數量文檔的文檔組、進行的與訴訟之間的關聯性判斷的結果;要素選定部112,針對每個結果資訊,根據文檔組中共同出現的要素的特徵計算該要素的評估值,並根據該評估值選定要素;評分計算部113,根據文檔資料中的各文檔包含的被選定的要素及被選定的要素的評估值計算該文檔資料中各文檔的評分;以及重現率計算部114,根據評分計算重現率,該重現率同與訴訟之間的關聯性的判斷相關。
此外,當要素選定部112為基於評估值之和來選定要素的部分時,能夠抑制系統使用的要素的數量,由此能夠減少噪音。
此外,當要素選定部112為按評估值的降冪排序要素,並提取要素直到要素的評估值之和達到固有目標值為止,並選定所提取的該要素的部分。此時能夠抑制系統使用的要素的數量,由此能夠減少噪音。
此外,當重現率計算部114根據在具有規定評分以上的文檔中的文檔組的文檔的所占比例來計算重現率時,能夠根據文檔的評分來評估系統的關聯性判斷的傾向,並且判斷與用戶的關聯性判斷傾向之間的一致程度。其中,該具有規定評分以上的文檔為已計算評分的文檔。
此外,當重現率計算部114將已計算評分的文檔資料中的各文檔按該評分的降冪排序,並從評分的上位提取規定比例的文檔,並將該文檔組的在被提取的該文檔中的所占比例作為重現率來計算時,能夠根據文檔的評分來評估系統的關聯性判斷的傾向,並且判斷與用戶的關聯性判斷傾向之間的一致程度。
此外,當取證系統進一步具備針對評分超過規定閾值的文檔進行同與訴訟之間的關聯性相關的判斷的自動判斷部118時,能夠按照用戶的關聯性判斷的傾向,自動進行文檔與訴訟之間的關聯性的判斷。
此外,當取證系統進一步具備從包含在數位資訊的文檔資料提取包含規定數量文檔的文檔組的提取部117和在畫面上顯示所提取的文檔組的顯示部116時,能夠提取用戶進行關聯性判斷的文檔,並在使用者的 終端上顯示。
此外,當取證系統進一步具備在重現率低於固有目標值時使用要素的評估值之和及固有目標值與重現率的差而重新選定要素的要素再選定部115時,能夠在重現率未達到目標值時,再次選擇在評分計算中使用的要素,並且提高關聯性的判斷精度。
此外,當要素再選定部115在重現率低於固有目標值時,從要素集合中提取並選定要素,直到重現率超過固有目標值為止,其中,該要素集合為,從要素中去除、直到要素評估值之和達到固有目標值與重現率之差為止提取出的要素之後的集合。此時,在重現率未達到目標值時,能夠從與上一次使用的要素不同的要素再次選擇在評分計算中使用的要素,並且能夠提高關聯性判斷的精度。
此外,當評分計算部113進一步在重現率低於固有目標值時,使用要素再選定部115選定的要素和該要素再選定部115重新選定的要素的評估值來計算文檔資料中各文檔的第二評分,並通過評分和該第二評分的合成來再次計算文檔資料中各文檔的評分的部分時,通過將上一次評分與第二評分的合成評分作為評分來使用,從而能夠提高重現率。
100‧‧‧伺服器裝置
111‧‧‧結果資訊接受部
112‧‧‧要素選定部
113‧‧‧評分計算部
114‧‧‧重現率計算部
115‧‧‧要素再選定部
116‧‧‧顯示部
117‧‧‧提取部
200‧‧‧用戶端
211‧‧‧畫面顯示部

Claims (14)

  1. 一種獲取記錄在多台電腦或伺服器中的數位資訊,並對所獲取的該數位資訊進行與訴訟之間的關聯性分析的取證系統,具備:結果資訊接受部,用於接受結果資訊,該結果資訊為使用者對從該數位資訊包含的文檔資料中提取出的、包含規定數量文檔的文檔組、進行的與訴訟之間的關聯性判斷的結果;要素選定部,針對每個該結果資訊,根據文檔組中共同出現的要素特徵計算該要素的評估值,並基於該評估值選定該要素;評分計算部,根據該文檔資料的各文檔中包含的該被選定的要素及該被選定的要素的評估值計算該文檔資料中各文檔的評分;以及重現率計算部,基於該評分計算關於與訴訟之間的關聯性的判斷相關的重現率。
  2. 如請求項1所述的取證系統,其中,該要素選定部基於該評估值之和選定該要素。
  3. 如請求項1或2所述的取證系統,其中,該要素選定部按評估值的降冪排序該要素,提取要素直到該要素的評估值之和達到固有目標值為止,並選定該提取的要素。
  4. 如請求項1至3中任一項所述的取證系統,其中,該重現率計算部,根據在該已計算評分的文檔中的具有規定評分以上的文檔中、該文檔組的文檔的所占比例,計算重現率。
  5. 如請求項1至4中任一項所述的取證系統,其中,該重現率計算部將該已計算該評分的文檔資料中的各文檔按該評分的 降冪排序,並從評分的上位提取規定比例的文檔,將該文檔組在該提取的文檔中的所占比例作為重現率來計算。
  6. 如請求項1至5中任一項所述的取證系統,其中,該要素選定部根據該要素攜帶的傳遞信息量計算該評估值。
  7. 如請求項1至6中任一項所述的取證系統,其中,該取證系統還具備自動判斷部,對該評分超過規定閾值的文檔進行與該訴訟之間的關聯性相關的判斷。
  8. 如請求項1至7中任一項所述的取證系統,其中,該取證系統進一步具備:提取部,從該數位資訊包含的文檔資料中提取出包含規定數量文檔的文檔組;以及顯示部,在畫面上顯示所提取的該文檔組。
  9. 如請求項1至8中任一項所述的取證系統,其中,該取證系統還具備要素再選定部,在該重現率低於該固有目標值時,利用該要素的評估值之和及該固有目標值與該重現率的差重新選定該要素。
  10. 如請求項1至9中任一項所述的取證系統,其中,該要素再選定部在該重現率低於該固有目標值時,從要素集合中提取並選定要素,直到該重現率超過該固有目標值為止,其中,該要素集合為從要素中去除直到該要素的評估值之和達到該固有目標值與該重現率的差為止提取出的要素之後的集合。
  11. 如請求項1至10中任一項所述的取證系統,其中, 進一步地,當該評分計算部在該重現率低於該固有目標值時,利用該要素再選定部選定的要素與該要素再選定部重新選定的要素的評估值計算該文檔資料中各文檔的第二評分,並通過該評分和該第二評分的合成,再次計算該文檔資料中各文檔的評分。
  12. 如請求項8所述的取證系統,其中,該提取部具備從該文檔資料隨機採樣並提取文檔組的功能。
  13. 一種獲取記錄在多台電腦或伺服器中的數位資訊,並對所獲取的該數位資訊分析與訴訟之間的關聯性的取證方法,其特徵在於,電腦執行以下的步驟:接受結果資訊,該結果資訊為使用者對從該數位資訊包含的文檔資料中提取出的包含規定數量文檔的文檔組、進行的與該訴訟之間的關聯性判斷的結果;針對每個該結果資訊,根據該文檔組中共同出現的要素的特徵計算該要素的評估值,並基於該評估值選定該要素;根據該文檔資料中各文檔中包含的該被選定的要素及該被選定的要素的評估值計算該文檔資料中各文檔的評分;以及基於該評分計算重現率,該重現率與訴訟之間的關聯性的判斷相關。
  14. 一種取證程式,獲取記錄在多台電腦或伺服器中的數位資訊,並對所獲取的該數位資訊分析與訴訟之間的關聯性,其特徵在於,使電腦實現以下的功能:接受結果資訊,該結果資訊為,使用者對從該數位資訊包含的文檔資料中提取的包含規定數量文檔的文檔組、進行的與該訴訟之間的關聯性 判斷的結果;針對每個該結果資訊,根據該文檔組中共同出現的要素的特徵計算該要素的評估值,並基於該評估值選定該要素;根據該文檔資料中各文檔包含的該被選定的要素及該被選定的要素的評估值計算該文檔資料中各文檔的評分;以及基於該評分計算重現率,該重現率同與訴訟之間的關聯性的判斷相關。
TW102136452A 2012-10-09 2013-10-09 Forensic system, forensic method and evidence collection program TWI556128B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012224587A JP5526209B2 (ja) 2012-10-09 2012-10-09 フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム

Publications (2)

Publication Number Publication Date
TW201415275A true TW201415275A (zh) 2014-04-16
TWI556128B TWI556128B (zh) 2016-11-01

Family

ID=50477432

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102136452A TWI556128B (zh) 2012-10-09 2013-10-09 Forensic system, forensic method and evidence collection program

Country Status (8)

Country Link
US (2) US9396273B2 (zh)
EP (1) EP2908283A4 (zh)
JP (1) JP5526209B2 (zh)
KR (1) KR101566153B1 (zh)
CN (1) CN104871201A (zh)
HK (1) HK1212799A1 (zh)
TW (1) TWI556128B (zh)
WO (1) WO2014057964A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10552459B2 (en) * 2013-10-31 2020-02-04 Micro Focus Llc Classifying a document using patterns
KR101981075B1 (ko) * 2015-03-31 2019-05-22 가부시키가이샤 프론테오 데이터 분석 시스템, 데이터 분석 방법, 데이터 분석 프로그램, 및 기록매체
CN106302608B (zh) * 2015-06-08 2020-02-04 阿里巴巴集团控股有限公司 一种信息处理方法及装置
CN108255926A (zh) * 2017-11-14 2018-07-06 宫辉 一种基于甘特图的法律事务管理方法和系统
CN111444438B (zh) * 2020-03-24 2023-09-01 北京百度网讯科技有限公司 召回策略的准召率的确定方法、装置、设备及存储介质

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5642520A (en) * 1993-12-07 1997-06-24 Nippon Telegraph And Telephone Corporation Method and apparatus for recognizing topic structure of language data
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
US5794236A (en) 1996-05-29 1998-08-11 Lexis-Nexis Computer-based system for classifying documents into a hierarchy and linking the classifications to the hierarchy
JP4034037B2 (ja) * 1998-09-10 2008-01-16 富士通株式会社 書面審議装置および書面審議システム、並びにコンピュータを書面審議装置として動作させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US6128620A (en) * 1999-02-02 2000-10-03 Lemed Inc Medical database for litigation
US7024416B1 (en) * 1999-03-31 2006-04-04 Verizon Laboratories Inc. Semi-automatic index term augmentation in document retrieval
US7197716B2 (en) * 2000-12-22 2007-03-27 Merchant & Gould, P.C. Litigation management system and method
US6658423B1 (en) * 2001-01-24 2003-12-02 Google, Inc. Detecting duplicate and near-duplicate files
US7062498B2 (en) * 2001-11-02 2006-06-13 Thomson Legal Regulatory Global Ag Systems, methods, and software for classifying text from judicial opinions and other documents
JP2003167914A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd マルチメディア情報検索方法、プログラム、記録媒体及びシステム
US6946715B2 (en) * 2003-02-19 2005-09-20 Micron Technology, Inc. CMOS image sensor and method of fabrication
US7912842B1 (en) * 2003-02-04 2011-03-22 Lexisnexis Risk Data Management Inc. Method and system for processing and linking data records
KR100515641B1 (ko) * 2003-04-24 2005-09-22 우순조 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법
JP4333229B2 (ja) * 2003-06-23 2009-09-16 沖電気工業株式会社 固有表現文字列の評価装置および評価方法
US7493322B2 (en) * 2003-10-15 2009-02-17 Xerox Corporation System and method for computing a measure of similarity between documents
US8612411B1 (en) * 2003-12-31 2013-12-17 Google Inc. Clustering documents using citation patterns
US20080195595A1 (en) * 2004-11-05 2008-08-14 Intellectual Property Bank Corp. Keyword Extracting Device
JP2006235716A (ja) * 2005-02-22 2006-09-07 Hitachi Ltd 文書フィルタリングシステム
US7937579B2 (en) * 2005-03-16 2011-05-03 Dt Labs, Llc System, method and apparatus for electronically protecting data and digital content
EP1881423A4 (en) * 2005-04-25 2009-05-06 Intellectual Property Bank DEVICE FOR AUTOMATICALLY GENERATING AN INFORMATION ANALYSIS REPORT, A PROGRAM FOR AUTOMATICALLY GENERATING AN INFORMATION ANALYSIS REPORT AND A METHOD FOR AUTOMATICALLY GENERATING A REPORT OF ANALYSIS
JP2007047575A (ja) * 2005-08-11 2007-02-22 Canon Inc パターンマッチング方法およびその装置、および音声情報検索システム
US20070139231A1 (en) * 2005-10-19 2007-06-21 Advanced Digital Forensic Solutions, Inc. Systems and methods for enterprise-wide data identification, sharing and management in a commercial context
US20070198594A1 (en) * 2005-11-16 2007-08-23 Lunt Tracy T Transferring electronic file constituents contained in an electronic compound file using a forensic file copy
US7814102B2 (en) * 2005-12-07 2010-10-12 Lexisnexis, A Division Of Reed Elsevier Inc. Method and system for linking documents with multiple topics to related documents
US7689559B2 (en) * 2006-02-08 2010-03-30 Telenor Asa Document similarity scoring and ranking method, device and computer program product
JP2007219880A (ja) * 2006-02-17 2007-08-30 Fujitsu Ltd 評判情報処理プログラム、方法及び装置
JP5010885B2 (ja) * 2006-09-29 2012-08-29 株式会社ジャストシステム 文書検索装置、文書検索方法および文書検索プログラム
JP5011947B2 (ja) * 2006-10-19 2012-08-29 オムロン株式会社 Fmeaシートの作成方法およびfmeaシート自動作成装置
US8386264B2 (en) * 2007-04-13 2013-02-26 Nippon Telegraph And Telephone Corporation Speech data retrieval apparatus, speech data retrieval method, speech data retrieval program and computer usable medium having computer readable speech data retrieval program embodied therein
JP4342575B2 (ja) * 2007-06-25 2009-10-14 株式会社東芝 キーワード提示のための装置、方法、及びプログラム
KR101008877B1 (ko) 2007-12-06 2011-01-17 한국전자통신연구원 디지털 포렌식에서의 검색 및 검색 결과를 제시하는 방법, 그리고 그 장치
US8312023B2 (en) * 2007-12-21 2012-11-13 Georgetown University Automated forensic document signatures
JP5316158B2 (ja) * 2008-05-28 2013-10-16 株式会社リコー 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
TWI476689B (zh) * 2008-08-25 2015-03-11 Ind Tech Res Inst 智慧型專利監控及警示系統與方法
GB0816556D0 (en) * 2008-09-10 2008-10-15 Univ Napier Improvements in or relating to digital forensics
KR101082024B1 (ko) 2008-12-08 2011-11-10 한국전자통신연구원 디지털 포렌식 시스템에서 증거 이미지의 색인 관리 장치 및 방법
US8290961B2 (en) * 2009-01-13 2012-10-16 Sandia Corporation Technique for information retrieval using enhanced latent semantic analysis generating rank approximation matrix by factorizing the weighted morpheme-by-document matrix
US20100205014A1 (en) * 2009-02-06 2010-08-12 Cary Sholer Method and system for providing response services
US20100205020A1 (en) * 2009-02-09 2010-08-12 Losey Ralph C System and method for establishing, managing, and controlling the time, cost, and quality of information retrieval and production in electronic discovery
KR101065091B1 (ko) * 2009-02-17 2011-09-16 엔에이치엔(주) 기여 점수에 기초한 문서 순위 결정 시스템 및 방법
KR101481680B1 (ko) * 2009-07-22 2015-01-12 파운데이션아이피 엘엘씨 전자적 문서 집합으로부터 질의의 결과를 산출하는 방법, 시스템 및 장치
JP2011076408A (ja) * 2009-09-30 2011-04-14 Brother Industries Ltd データ管理装置、データ管理方法、およびデータ管理プログラム
EP2354971A1 (en) * 2010-01-29 2011-08-10 E-Therapeutics plc Document analysis system
JP4868191B2 (ja) * 2010-03-29 2012-02-01 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4898934B2 (ja) * 2010-03-29 2012-03-21 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4995950B2 (ja) 2010-07-28 2012-08-08 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
EP2625655A4 (en) * 2010-10-06 2014-04-16 Planet Data Solutions SYSTEM AND METHOD FOR INDEXING ELECTRONIC DETECTION DATA
US8775341B1 (en) * 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US9037630B2 (en) * 2012-02-21 2015-05-19 Matthew Martin Shannon Systems and methods for provisioning digital forensics services remotely over public and private networks
US9146981B2 (en) * 2012-07-06 2015-09-29 International Business Machines Corporation Automated electronic discovery collections and preservations

Also Published As

Publication number Publication date
US9396273B2 (en) 2016-07-19
JP5526209B2 (ja) 2014-06-18
US10073891B2 (en) 2018-09-11
CN104871201A (zh) 2015-08-26
KR101566153B1 (ko) 2015-11-04
US20160246795A1 (en) 2016-08-25
EP2908283A4 (en) 2016-04-20
US20150088876A1 (en) 2015-03-26
KR20150056878A (ko) 2015-05-27
JP2014078084A (ja) 2014-05-01
WO2014057964A1 (ja) 2014-04-17
TWI556128B (zh) 2016-11-01
EP2908283A1 (en) 2015-08-19
HK1212799A1 (zh) 2016-06-17

Similar Documents

Publication Publication Date Title
JP5567049B2 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
TWI532001B (zh) 文件分類系統及文件分類方法以及文件分類程式
TW201415264A (zh) 取證系統、取證方法及取證程式
JP5603468B1 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
TWI556128B (zh) Forensic system, forensic method and evidence collection program
TW201421414A (zh) 文件管理系統及文件管理方法以及文件管理程式
TW201415402A (zh) 取證系統、取證方法及取證程式
JPWO2015118617A1 (ja) データ分析システム、データ分析方法、および、データ分析プログラム
JP5986687B2 (ja) データ分別システム、データ分別方法、データ分別のためのプログラム、及び、このプログラムの記録媒体
JP5683749B1 (ja) 文書分析システム、文書分析方法、および、文書分析プログラム
JP5622969B1 (ja) 文書分析システム、文書分析方法、および、文書分析プログラム
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム
JP5592552B1 (ja) 文書分別調査システム及び文書分別調査方法並びに文書分別調査プログラム
TW201513036A (zh) 文件分類系統、文件分類方法及文件分類程式
JP5685675B2 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
JP2015172952A (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム
JP5745676B1 (ja) 文書分析システム、文書分析方法、および、文書分析プログラム
JP5829768B2 (ja) 電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム
JP5746403B2 (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム
JP2016027510A (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム