TW201415263A - 取證系統、取證方法及取證程式 - Google Patents

取證系統、取證方法及取證程式 Download PDF

Info

Publication number
TW201415263A
TW201415263A TW102136451A TW102136451A TW201415263A TW 201415263 A TW201415263 A TW 201415263A TW 102136451 A TW102136451 A TW 102136451A TW 102136451 A TW102136451 A TW 102136451A TW 201415263 A TW201415263 A TW 201415263A
Authority
TW
Taiwan
Prior art keywords
information
result
unit
user
progress
Prior art date
Application number
TW102136451A
Other languages
English (en)
Inventor
Masahiro Morimoto
Yoshikatsu Shirai
Hideki Takeda
Kazumi Hasuko
Original Assignee
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubic Inc filed Critical Ubic Inc
Publication of TW201415263A publication Critical patent/TW201415263A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

圖示根據使用者的進展情況或者在檢閱中的文檔資料,實施適當的回饋,從而能夠保持用戶的動力,並能夠實現檢閱的效率化。具備:判斷獲取部,將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄部,用於記錄判斷獲取部獲取的績效資訊;預測資訊生成部,用於生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;資訊比較部,用於比較績效資訊及預測資訊;及圖示生成部,根據資訊比較部的比較結果生成用於顯示對使用者的關聯性判斷的評估的圖示。

Description

取證系統、取證方法及取證程式
本發明屬於一種取證系統、取證方法及取證程式,特別關於一種用於收集與訴訟相關的數位文檔資訊的取證系統、取證方法及取證程式。
以往,提出一種裝置或技術,當發生非法訪問或機密資訊的洩露等與電腦相關的犯罪或法律糾紛時,能夠收集並分析原因查明或調查所需的儀器、資料或電子記錄,從而明確其法律證據力。
此外,在美國民事訴訟中,由於需要eDiscovery(電子證據公開)等,該訴訟的原告及被告均有責任提出全部相關數位資訊作為證據。因此必須提出記錄在電腦或伺服器中的數位資訊作為證據。
另一方面,隨著IT的迅猛發展和普及,當今商務世界中幾乎所有的資訊均由計算機制作,因此即便在同一個企業內部,也氾濫著大量的數位資訊。
因此,在為了向法庭提交證據材料而進行準備工作的過程中,容易產生不一定與相應訴訟相關的機密數位資訊也包含在證據材料中的失誤。而且,還存在提交與訴訟無關的機密數位資訊的問題。
近年來,在專利文獻1至專利文獻3中提出了與取證系統中的文檔資料相關的技術。在專利文獻1中公開如下的取證系統:從文檔提出命令物件者資訊中包含的至少一人以上的物件者中,指定特定者,基於與被指定的特定者相關的訪問歷史資訊,僅提取特定者訪問過的數位文檔 資料,並設置用於表示所提取的數位文檔資料中各文檔文件是否為與訴訟相關的檔的附帶資訊,基於附帶資訊輸出與訴訟相關的文檔文件。
此外,在專利文獻2中公開了如下的取證系統:顯示所記錄的數位資訊,各文檔文件中均設有表示是否與物件者資訊中包含的任一物件者相關的物件者特定資訊,並將設置的該物件者特定資訊設置為記錄在存儲部中,指定至少一人以上的對象者,並檢索設有與指定的物件者對應的物件者特定資訊的文檔文件,通過顯示部設置表示所檢索出的文檔文件是否與訴訟相關的附帶資訊,基於附帶資訊輸出與訴訟相關的文檔文件。
進一步地,在專利文獻3中公開如下的取證系統:接受數位文檔資料中包含的至少一個以上文檔文件的指定,接受用何種語言翻譯所指定的文檔文件的指定,將接受指定的文檔文件翻譯成接受指定的語言,從記錄在記錄部中的數位文檔資料提取出與指定的文檔文件表示同一個內容的共同文檔文件,生成表示所提取的共同文檔文件通過援引已被翻譯的文檔文件的翻譯內容進行翻譯的翻譯相關資訊,基於翻譯相關資訊輸出與訴訟相關的文檔文件。
【現有技術文獻】 【專利文獻】
專利文獻1:日本專利申請公開2011-209930號公報
專利文獻2:日本專利申請公開2011-209931號公報
專利文獻3:日本專利申請公開2012-32859號公報
然而,例如在如專利文獻1至專利文獻3的取證系統中,需要收集利用多台電腦以及伺服器的物件者的龐大的文檔資料。
對這種已被數位化的龐大的文檔資料進行識別判斷是否適合作為訴訟證據材料的叫做「檢閱」的工作,則由被稱為「檢閱人」的用 戶通過目測來確認,需要對該文檔資料一一進行識別,而且根據檢閱人的能力或身體狀況,決定識別工作的精度和效率。解決技術問題的技術手段
因此,鑒於上述情況,本發明的目的在與提供一種取證系統、取證方法及取證程式,在該取證系統、取證方法及取證程式中,圖示根據被稱為「檢閱人」的使用者的進展情況或者在檢閱中的文檔資料與訴訟之間的關聯度,實施適當的回饋,從而能夠保持用戶的動力,並能夠實現檢閱的效率化。
本發明的取證系統,用於獲取記錄在多台電腦或伺服器中的數位資訊,並對獲取的該數位資訊進行分析,具備:判斷獲取部,將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄部,用於記錄判斷獲取部獲取的績效資訊;預測資訊生成部,用於生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;資訊比較部,用於比較績效資訊及預測資訊;以及圖示生成部,基於資訊比較部的比較結果生成用於顯示對使用者的關聯性判斷的評估的圖示。
「文檔資料」為包含一個以上單詞的資訊。作為文檔資料的一例,可舉電子郵件、演示資料、試算表計算資料、會談資料、合同、組織圖或事業計畫書等。
「關聯性判斷」為對文檔資料進行有無必要在訴訟中提出的判斷的行為。關聯性判斷也可為根據關聯性程度賦予識別符的行為。
「結果資訊」為表示使用者對文檔資料進行的與訴訟之間的關聯性判斷結果的資訊。結果資訊也可以指使用者對文檔資料賦予的表示與訴訟之間的關聯性程度的識別符。
「進展資訊」為與使用者的關聯性判斷速度相關的資訊。進 展資訊也可以指使用者在單位時間內進行關聯性判斷的文檔資料數量。此外,進展資訊也可為相對於需要進行關聯性判斷的全部文檔資料的在單位時間內進行關聯性判斷的文檔資料的數量。
「績效資訊」為與結果資訊或進展資訊中的至少任一個相關的信息。績效資訊也可為包含結果資訊及進展資訊這兩者的資訊。
「判斷獲取部」為用於獲取與使用者對文檔資料所進行的判斷結果相關的資訊的部分。
「記錄部」為用於記錄績效資訊的部分。
「預測資訊」為用於預測使用者的關聯性判斷的資訊。預測資訊也可為與結果資訊或進展資訊中的至少任一個相關的信息。
「預測資訊生成部」用於生成預測資訊。預測資訊生成部也可用於生成與結果資訊或進展資訊中的至少任一個相關的預測資訊。而且預測資訊生成部也可根據獲取的結果資訊分析使用者的關聯性判斷的特徵,並基於該分析結果生成與結果資訊相關的預測資訊。此外,預測資訊生成部可為進一步分析其他用戶的關聯性判斷的進展情況,並根據該分析結果生成與關聯性判斷的進展速度相關的預測資訊的部分。此外,預測資訊生成部可進一步分析用戶的過去的關聯性判斷的進展情況,並基於該分析結果生成與關聯性判斷的進展速度相關的預測資訊的部分。
「資訊比較部」用於比較多個資訊。資訊比較部也可為在預測資訊和績效資訊包含相同資訊的情況下進行比較。具體來說,資訊比較部也可用於比較分別包含結果資訊的預測資訊和績效資訊,也可用於比較分別包含進展資訊的預測資訊和績效資訊。此外,資訊比較部也可用於比較分別包含結果資訊及進展資訊這兩者的預測資訊和績效資訊。
「評估」為對用戶進行的關聯性判斷的回饋。評估也可為根據比較結果所進行的評估。具體來說,例如在相比作為預測資訊來預測的進展資訊,作為績效資訊來獲取的進展資訊明顯慢時,可將敦促提高判斷 速度的意見作為評估來顯示。此外,在預測的結果資訊和作為績效來獲取的結果資訊不同時,也可顯示引起注意的評估。
「圖示」為用於顯示對使用者的評估的由簡單的圖畫表現出的內容。例如,圖示也可為如人物那樣的易於感到親近的內容。
「圖示生成部」基於比較結果生成圖示。此外,圖示生成部也可基於比較結果,變更圖示的動作、言詞和表情中的至少任一個的顯示形式。此外,圖示生成部也可根據使用者進行關聯性判斷的文檔資料的內容而顯示評估。例如,也可在用戶針對在特定年代製作的文檔資料進行關聯性判斷時,顯示引起注意的評估。
此外,本發明的取證系統可進一步具備:提取部,從數位資訊提取規定數量的文檔資料;顯示部,在畫面上顯示所提取的文檔資料;結果接受部,用於接受使用者對顯示出的文檔資料所進行的關聯性判斷的結果;選定部,基於判斷結果,按判斷結果識別所提取的文檔資料,並且分析並選定在被識別的該文檔資料中共同出現的關鍵字;關鍵字記錄部,記錄所選定的關鍵字;搜索部,從文檔資料搜索記錄在關鍵字記錄部中的關鍵字;以及評分計算部,使用搜索部的搜索結果和選定部的分析結果,計算表示判斷結果和文檔資料之間的關聯性的評分,預測資訊生成部使用評分生成與結果資訊相關的預測資訊。
「提取部」從數位資訊提取文檔資料。提取部可通過隨機採樣而進行提取。此外,也可基於文檔資料的更新日期時間等屬性進行提取。
「顯示部」顯示所提取的文檔資料。顯示部也可為在用戶使用的用戶端上進行顯示的部分。
「結果接受部」為接受用戶的關聯性判斷結果的部分。
「選定部」用於選定關鍵字的分。選定部也可分析在構成同一個判斷結果的文檔資料中共同出現的關鍵字並進行選定。
「關鍵字」為在某種語言中,具有一定含義的文字列的匯 總。例如,「對文檔進行識別」這一句子的關鍵字可為「文檔」、「識別」和「進行」。
「關鍵字記錄部」用於記錄關鍵字。關鍵字記錄部也可為資料庫。
「搜索部」用於在文檔資料中搜索關鍵字。
「評分計算部」用於計算文檔資料評分。評分計算部也可基於包含在文檔資料中的關鍵字的評估值計算評分。就評分計算部而言,評估值也可為各關鍵字在某文檔資料中發揮的信息量。評估值也可根據文檔資料中的關鍵字的出現頻度或傳遞信息量來計算。
「評分」為表示在某文檔資料中與訴訟之間的關聯程度的值。評分根據包含在文檔資料中的關鍵字計算。例如,可設為越是包含訴訟時提出的必要性高的關鍵字的文檔資料,越具有高的評分。文檔資料也可根據規定的條件,被賦予評分的起始值。例如,也可基於出現在文檔資料中的關鍵字和各關鍵字所持有的評估值來計算起始評分。
此外,本發明的取證方法,用於獲取記錄在多台電腦或伺服器中的數位資訊,並分析所獲取的該數位資訊,其中,電腦實現以下的步驟:將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄所獲取的績效資訊;生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;比較績效資訊及預測資訊;以及依據資訊比較部的比較結果,生成用於顯示對使用者的關聯性判斷的評估的圖示。
此外,本發明的取證程式,獲取記錄在多台電腦或伺服器中的數位資訊,並分析所獲取的該數位資訊,使電腦實現以下的功能:將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判 斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄所獲取的績效資訊;生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;比較績效資訊及預測資訊;以及基於資訊比較部的比較結果,生成用於顯示對使用者的關聯性判斷的評估的圖示。
本發明的取證系統,用於獲取記錄在多台電腦或伺服器中的數位資訊,並對獲取的該數位資訊進行分析,具備:判斷獲取部,將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄部,用於記錄判斷獲取部獲取的績效資訊;預測資訊生成部,用於生成與結果資訊或進展資訊中的至少任一個相關的預測資訊:資訊比較部,用於比較績效資訊及預測資訊;及圖示生成部,基於資訊比較部的比較結果生成用來顯示對使用者的關聯性判斷的評估的圖示。此時,圖示根據檢閱的進展情況或者檢閱中的文檔資料與訴訟之間的關聯程度對用戶實施適當的回饋,從而能夠保持用戶動力,並且實現檢閱的效率化。
此外,當本發明的預測資訊生成部在由所獲取的結果資訊分析使用者的關聯性判斷特徵,並且根據分析結果生成與結果資訊相關的預測資訊時,系統能夠針對某文檔資料預測使用者的關聯性判斷結果,並且在該預測結果和用戶的實際判斷結果不同時,能夠讓用戶引起注意。
此外,當本發明的預測資訊生成部進一步分析其他用戶的關聯性判斷的進展情況,並基於該分析結果生成與關聯性判斷的進展速度相關的預測資訊時,系統能夠由其他使用者的關聯性判斷結果預測特定使用者對某文檔資料的判斷結果,並在該預測結果和用戶的實際判斷結果不同時,能夠讓特定用戶引起注意。
此外,當本發明的預測資訊生成部進一步分析使用者過去的 關聯性判斷的進展情況,並基於該分析結果生成與關聯性判斷的進展速度相關的預測資訊時,能夠由某使用者的過去的進展速度預測檢閱進展速度,並且在預測的進展速度和使用者的實際進展速度不同時,能夠讓用戶引起注意。
此外,當本發明的圖示生成部根據比較結果變更圖示的動作、言詞和表情中的至少任一個顯示形式時,能夠基於使用者情況顯示適當的評估。
100‧‧‧伺服器裝置
111‧‧‧判斷獲取部
112‧‧‧記錄部
113‧‧‧預測資訊生成部
114‧‧‧資訊比較部
115‧‧‧圖示生成部
121‧‧‧提取部
122‧‧‧顯示部
123‧‧‧結果接受部
124‧‧‧選定部
125‧‧‧關鍵字記錄部
126‧‧‧搜索部
127‧‧‧評分計算部
200‧‧‧用戶端
211‧‧‧畫面顯示部
290‧‧‧指示部
I1‧‧‧檢閱畫面
圖1為在本發明的第一實施方式中的取證系統的框圖;圖2為示意地表示在本發明的第一實施方式中的檢閱畫面的圖;圖3為示意地表示在本發明的第一實施方式中的檢閱畫面的圖;圖4為例示出在本發明的第一實施方式中的圖示生成部所生成的圖示的圖;圖5為表示本發明的第一實施方式的處理的流程圖;圖6為在本發明的第二實施方式中的取證系統的框圖;圖7為表示在本發明的第二實施方式中的選定部的分析結果的曲線圖;圖8為表示在本發明的第二實施方式的預測資訊生成處理的流程圖。
[第一實施方式]
下面,使用圖1至圖5說明本發明的第一實施方式。
本發明的第一實施方式的取證系統,用於獲取記錄在多台電腦或伺服器中的數位資訊,並且分析所獲取的該數位資訊,具備:判斷獲取部111,用於將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者針對包含在數位資訊中的多個文檔資料所進行 的與訴訟之間的關聯性判斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄部112,用於記錄由判斷獲取部111獲取的績效資訊;預測資訊生成部113,用於生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;資訊比較部114,用於比較績效資訊及預測資訊;以及圖示生成部115,基於資訊比較部114的比較結果,生成用於顯示針對使用者的關聯性判斷的評估的圖示。
取證系統具備電腦或伺服器,基於各種輸人,CPU執行記錄在ROM中的程式,從而作為各種功能部進行操作。該程式可為存儲在CD-ROM等存儲媒體中的程式,或者也可為通過互聯網等網路發佈並被安裝在電腦中的程式。
在本實施方式中,被稱為檢閱人的使用者為了從文檔資料中提取在訴訟中需要提出的文檔而進行與訴訟之間的關聯性判斷。關聯性判斷也可為根據關聯性程度賦予識別符的行為。系統或使用者所進行的用於判斷是否與訴訟相關的這一行為叫做檢閱。在檢閱中,根據訴訟關聯程度或與訴訟之間的關聯方法,將作為檢閱物件的文檔資料分為多個種類。
文檔資料為包含一個以上的單詞的資訊。作為文檔資料的一例,可以舉電子郵件、演示資料、試算表計算資料、會談資料、合同、組織圖、事業計畫書等。此外,也可將掃描資料作為文檔資料進行處理。此時,也可在取證系統內具備OCR(Optical Character Reader)裝置,使得能夠將掃描資料變換為文本資料。
圖1表示在第一實施方式中的取證系統的框圖。在本實施方式中,取證系統具備伺服器裝置100和用戶端200。
伺服器裝置100和用戶端200通過通信網路連接。通信網路為有線或無線通訊線路。例如為電話線路、互聯網線路等。
伺服器裝置100具備判斷獲取部111、記錄部112、預測資訊生成部113、資訊比較部114和圖示生成部115。
在本實施方式中,各結構搭載在伺服器裝置100上,但也可分別搭載在不同的框架裡。
用戶端200為電腦,具有顯示圖2所示檢閱畫面I1的畫面顯示部211及指示部290(在圖1中省略圖示)。
畫面顯示部211為顯示用的顯示器(液晶顯示器、CRT顯示器、有機EL顯示器等)。此外,指示部290為滑鼠或鍵盤。
使用者通過用戶端200連接於伺服器裝置100,並且在畫面顯示部211顯示的檢閱畫面I1上進行檢閱。
通過圖1說明各結構要素的功能。
判斷獲取部111獲取使用者對文檔資料進行的關聯性判斷的績效資訊。績效資訊包括結果資訊和進展資訊中的至少任一個。
結果資訊為使用者對文檔資料進行的與訴訟之間的關聯性判斷結果即表示有無關聯性的資訊。也可以指使用者對文檔資料賦予的表示與訴訟之間的關聯性程度的識別符。
進展資訊為與使用者的關聯性判斷速度相關的資訊。具體指使用者在每單位時間進行關聯性判斷的文檔資料的數量。另外,也可為相對於需要關聯性判斷的全部文檔資料的每單位時間進行關聯性判斷的文檔資料的數量。在本實施方式中,判斷資訊獲取部獲取某使用者對某文檔資料進行的關聯性判斷中所花的時間及該文檔資料的資料容量,並且由容量除以時間的值獲取進展資訊。
記錄部112記錄判斷獲取部111獲取的績效資訊。在本實施方式中,記錄在伺服器裝置100內的硬碟上,但也可為設置在伺服器裝置100外的資料庫。
預測資訊生成部113生成預測資訊。預測資訊為用於預測使用者的關聯性判斷的資訊。包含結果資訊及進展資訊中的至少任一個。此外,預測資訊生成部113也可由獲取的結果資訊分析使用者的關聯性判斷的 特徵,並根據該分析結果,生成與結果資訊相關的預測資訊。此外,預測資訊生成部113也可進一步分析其他用戶的關聯性判斷的進展情況,並根據該分析結果生成與關聯性判斷的進展速度相關的預測資訊的部分。此外,預測資訊生成部113也可為進一步分析用戶的過去關聯性判斷的進展情況,並根據該分析結果生成與關聯性判斷的進展速度相關的預測資訊的部分。
在本實施方式中,預測資訊生成部113針對使用者進行關聯性判斷的文檔資料的相似文檔資料生成與結果資訊相關的預測資訊。也可為使用後述的實施例2的方法生成與結果資訊相關的預測資訊的部分。此外,預測資訊生成部113也可由判斷獲取部111獲取的到此為止的進展資訊預測使用者在下一個單位時間內進行檢閱的文檔資料的數量及資料容量。
資訊比較部114比較績效資訊和預測資訊。另外,在預測資訊和績效資訊包含相同的資訊的情況下進行比較。具體可為比較分別包含結果資訊的預測資訊和績效資訊的部分,也可為比較分別包含進展資訊的預測資訊和績效資訊的部分。此外,也可為分別包含結果資訊及進展資訊這兩者的預測資訊和績效資訊的部分。
資訊比較部114向圖示生成部115通知比較結果。
圖示生成部115基於比較結果生成圖示。此外,圖示生成部115也可基於比較結果變更圖示的動作、言詞和表情中的至少任一個顯示形式的部分。
圖示為對使用者顯示評估的內容。也可為如人物那樣的易於感到親近的內容。圖3為在本實施方式中的圖示生成部115顯示圖示的狀態下的檢閱畫面11的示意圖。圖3的a1表示圖示生成部115生成的圖示,圖3的b1將其評估內容以言詞來表示。
評估為針對用戶所進行的關聯性判斷的回饋。也可為根據比較結果的回饋。具體來說,例如可為在相比作為預測資訊預測的進展資訊, 作為績效資訊獲取的進展資訊明顯慢的情況下,將敦促提高判斷速度的意見作為評估來顯示的內容。此外,在預測的結果資訊和作為績效來獲取的結果資訊不同的情況下,也可顯示讓人引起注意的評估。
將圖示生成部115的處理,以資訊比較部114針對與進展資訊相關的績效資訊和預測資訊進行比較的情況為例進行具體說明。圖4為圖示生成部115生成的圖示的例。將預測資訊生成部113根據到此為止的績效資訊預測的預測資訊設為每單位時間的文檔資料為50件。
圖4的(A1)示出以為難的表情邊做出表示困惑的動作,邊說「今天怎麼啦?」這一言詞的圖示。這在判斷資訊獲取部獲取的績效資訊明顯少於50件時生成。由此,能夠敦促使用者提高檢閱速度。
圖4的(A2)示出以笑的表情邊進行支持,邊說「以這種狀態加油」這一言詞的圖示。該圖示在預測資訊和績效資訊中的任何資訊均為相同的進展資訊時生成。由此,能夠給用戶帶來以目前的步伐進行檢閱沒有問題的信心。
圖4的(A3)示出以痛苦的表情邊跑邊說「也需要謹慎喲」這一言詞的圖示。該圖示在績效資訊超出預測資訊步伐時為了引起使用者注意而生成。由此,能夠阻止用戶不夠細心地閱讀文檔資料而進行關聯性判斷。
接下來,利用圖5對本實施方式的取證系統的處理流程進行說明。
當使用者對某文檔資料(文檔1)判斷有關聯性時(步驟101),判斷資訊獲取部獲取關於文檔1的績效資訊(步驟102)。具體來說,文檔1將認為與訴訟有關聯性的結果資訊和將文檔1的資料大小除以對文檔1進行判斷所花的時間的值來求出的進展資訊作為績效資訊來獲取。所獲取的績效資訊通過記錄部112記錄在伺服器裝置100的硬碟中(步驟103)。
接下來,預測資訊生成部113根據過去的績效資訊或其他使 用者的績效資訊生成預測資訊(步驟104)。資訊比較部114比較績效資訊和預測資訊(步驟105)。圖示生成部115基於比較結果生成圖示,並向使用者隨時顯示關聯性判斷的評估(步驟106)。
[第二實施方式]
下面,利用圖6至圖8說明本發明的第二實施方式。
本發明的第二實施方式的取證系統,獲取記錄在多台電腦或伺服器中的數位資訊,並對獲取的該數位資訊進行分析,具備:判斷獲取部111,將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄部112,用於記錄判斷獲取部111獲取的績效資訊;預測資訊生成部113,用於生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;資訊比較部114,用於比較績效資訊及預測資訊;及圖示生成部115,根據資訊比較部114的比較結果生成用於顯示對使用者的關聯性判斷的評估的圖示。
此外,本實施方式的取證系統進一步具備:提取部121,用於從數位資訊提取規定數量的文檔資料;顯示部122,用於在畫面上顯示所提取的文檔資料;結果接受部123,用於接受使用者對顯示出的文檔資料所進行的關聯性判斷的結果;選定部124,基於判斷結果,按判斷結果識別所提取的文檔資料,並且分析並選定在所識別的該文檔資料中共同出現的關鍵字;關鍵字記錄部125,用於記錄所選定的關鍵字;搜索部126,用於在文檔資料中搜索記錄在關鍵字記錄部125的關鍵字;以及評分計算部127,使用搜索部126的搜索結果和選定部124的分析結果,計算表示判斷結果和文檔資料之間的關聯性的評分,預測資訊生成部113為利用評分來生成與結果資訊相關的預測資訊的部分。
圖6表示本實施方式的取證系統的框圖。
伺服器裝置100具備判斷獲取部111、記錄部112、預測資訊生成部113、資訊比較部114、圖示生成部115、提取部121、顯示部122、結果接受部123、選定部124、關鍵字記錄部125、搜索部126和評分計算部127。
在本實施方式中,各結構搭載在伺服器裝置100上,但也可以分別搭載在不同的框架裡。
用戶端200具有顯示圖2所示檢閱畫面1的畫面顯示部211。被稱為檢閱人的用戶通過用戶端200連接於伺服器裝置100,並在檢閱畫面I1上進行檢閱。
利用圖6對各結構要素的功能進行說明。
提取部121從數位資訊提取文檔資料。在提取時,對數位資訊進行隨機採樣。此外,也可為根據文檔資料的更新日期時間等屬性進行提取的部分。
顯示部122顯示所提取的文檔資料。具體發出指示,從而將提取的文檔資料顯示在用戶使用的用戶端200上。
結果接受部123接受用戶的關聯性判斷結果。
選定部124選定關鍵字。也可為分析並選定在構成同一個判斷結果的文檔資料中共同出現的關鍵字的部分。
圖7為選定部124分析在判斷為具有關聯性的文檔資料中共同地頻繁出現的關鍵字結果的曲線圖。在圖7中,縱軸R_hot表示包含關鍵字並被判斷為具有關聯性的文檔資料在被使用者判斷為具有關聯性的全部文檔資料中的比例,其中該關鍵字為作為與被判斷為具有關聯性的文檔資料關聯的關鍵字來被選定的關鍵字。橫軸R_all表示在使用者實施檢閱的全部文檔資料中,包含被後述的搜索部126搜索出來的關鍵字的文檔資料的比例。在本實施方式中,選定部124將比直線R_hot=R_all更在上部浮動的關鍵字作為與判斷為具有關聯性的文檔資料共同的關鍵字來選定。
關鍵字為在某種語言中具有一定含義的文字列的匯總。
例如,「對文檔進行識別」這一句子的關鍵字可為「文檔」、「識別」和「進行」。
關鍵字記錄部125為用於記錄關鍵字的部分。也可為資料庫。
搜索部126為用於在文檔資料中搜索關鍵字的部分。
評分計算部127為用於計算文檔資料的評分的部分。也可為根據包含在文檔資料中的關鍵字的評估值計算評分的部分。評估值也可根據關鍵字在文檔資料中的出現頻度或傳遞信息量來計算,可為各關鍵字在某文檔資料中發揮的信息量。
評分為表示某文檔資料與訴訟之間的關聯程度的值。根據包含在文檔資料中的關鍵字計算評分。例如,可設為越是包含訴訟時提出的必要性高的關鍵字的文檔資料,越具有高的評分。文檔資料也可根據規定的條件,被賦予評分的起始值。例如,也可根據出現在文檔資料中的關鍵字和各關鍵字所持有的評估值來計算起始評分。
評分計算部127可通過出現在文檔組中的關鍵字和各關鍵字的權值,由以下公式計算評分。
m i :在i個關鍵字或關聯用語的出現頻度
wgt i :在i個關鍵字或關聯用語的權值
各關鍵字所持有的權值取決於該關鍵字所持有的傳遞信息量。該權值可通過以下公式進行學習。
wgt i,0 :學習前的第i個選定關鍵字的權值
wgt i,L :在L次學習後的第i個選定關鍵字的權值
γ L :在L次學習中的學習參數
Θ:學習效果的閾值
預測資訊生成部113根據評分計算部127所計算的評分,生成與結果資訊相關的預測資訊。具體來說,針對評分超出規定閾值的文檔資料預測為具有關聯性,針對未超出閾值的文檔資料預測為不具有關聯性,從而生成預測資訊。
利用圖8,對本實施方式中的預測資訊生成處理流程進行說明。首先,提取部121從數位資訊提取規定數量的文檔資料(步驟201)。顯示部122在用戶端200的畫面上顯示所提取的文檔資料(步驟202)。結果接受部123接受用戶的關聯性判斷的結果(步驟203),並且選定部124由用戶的關聯性判斷的結果分析文檔資料並選定關鍵字(步驟204)。被選定的關鍵字被記錄在關鍵字記錄部125(步驟205)。接下來,搜索部126在各文檔資料中搜索被記錄的關鍵字(步驟206),評分計算部127使用公式(1)計算各文檔資料的評分(步驟207)。根據計算出的評分,預測資訊生成部113生成與結果資訊相關的預測資訊(步驟208)。
其他結構和功能與第一實施方式相同。
[其他實施方式]
圖示生成部115除了在第一實施方式及第二實施方式所示以外,也可根據使用者在當前進行檢閱的文檔資料的內容顯示評估。
例如,也可根據文檔資料的製作日期時間、製作人、安全等級進行顯示。具體來說,也可在用戶針對與訴訟的關聯性的高的人製作的文檔資料進行檢閱時,生成敦促引起特別注意的圖示並顯示評估。
其他結構和功能與第一實施方式相同。
取證系統,獲取記錄在多台電腦或伺服器中的數位資訊,並對獲取的該數位資訊進行分析,具備:判斷獲取部111,將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄部112, 用於記錄判斷獲取部111獲取的績效資訊;預測資訊生成部113,用於生成與結果資訊或進展資訊中的至少任一個相關的預測資訊:資訊比較部114,用於比較績效資訊及預測資訊;以及圖示生成部115,基於資訊比較部114的比較結果生成用於顯示對使用者的關聯性判斷的評估的圖示。此時,圖示基於檢閱的進展情況或者檢閱中的文檔資料與訴訟之間的關聯程度對用戶進行適當的回饋,從而能夠保持用戶動力,並且實現檢閱的效率化。
此外,當預測資訊生成部113在由所獲取的結果資訊分析使用者的關聯性判斷特徵,並且基於分析結果生成與結果資訊相關的預測資訊時,系統能夠針對某文檔資料預測使用者的關聯性判斷結果,並且在該預測結果和用戶的實際判斷結果不同時,能夠讓用戶引起注意。
此外,當預測資訊生成部113進一步分析其他用戶的關聯性判斷的進展情況,並根據該分析結果生成與關聯性判斷的進展速度相關的預測資訊時,系統能夠從其他使用者的關聯性判斷結果預測特定使用者對某文檔資料的判斷結果,並且在該預測結果和用戶的實際判斷結果不同時,能夠使特定用戶引起注意。
此外,當預測資訊生成部113進一步分析用戶過去的關聯性判斷的進展況,並基於該分析結果生成與關聯性判斷的進展速度相關的預測資訊時,能夠根據某使用者過去的進展速度預測檢閱進展速度,並且在預測的進展速度和使用者的實際進展速度不同時,能夠使用戶引起注意。
此外,當圖示生成部115根據比較結果變更圖示動作、言詞和表情中的至少任一個顯示形式時,能夠基於使用者情況顯示適當的評估。
100‧‧‧伺服器裝置
111‧‧‧判斷獲取部
112‧‧‧記錄部
113‧‧‧預測資訊生成部
114‧‧‧資訊比較部
115‧‧‧圖示生成部
200‧‧‧用戶端
211‧‧‧畫面顯示部

Claims (8)

  1. 一種獲取記錄在多台電腦或伺服器中的數位資訊,並對獲取的該數位資訊進行分析的取證系統,具備:判斷獲取部,將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在該數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與該使用者的關聯性判斷的進展速度相關的資訊;記錄部,用於記錄該判斷獲取部獲取的績效資訊;預測資訊生成部,用於生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;資訊比較部,用於比較該績效資訊及該預測資訊;以及圖示生成部,基於該資訊比較部的比較結果生成用於顯示對使用者的關聯性判斷的評估的圖示。
  2. 如請求項1所述的取證系統,其中,該預測資訊生成部根據獲取的該結果資訊分析該使用者的關聯性判斷的特徵,並基於該分析結果生成與結果資訊相關的預測資訊。
  3. 如請求項1或2所述的取證系統,其中,該預測資訊生成部進一步分析其他用戶的關聯性判斷的進展情況,並基於該分析結果生成與關聯性判斷的進展速度相關的預測資訊。
  4. 如請求項1到3中的任一項所述的取證系統,其中,該預測資訊生成部進一步分析該用戶的過去的關聯性判斷的進展情況,並基於該分析結果生成與關聯性判斷的進展速度相關的預測資訊。
  5. 如請求項1到4中的任一項所述的取證系統,其中,該圖示生成部基於該比較結果,變更該圖示的動作、言詞和表情中的至少任一個表現形式。
  6. 如請求項1到5中的任一項所述的取證系統,其中,該取證系統進一步具備:提取部,從該數位資訊中提取規定數量的文檔資料;顯示部,在畫面上顯示所提取的該文檔資料;結果接受部,用於接受使用者對被顯示出的該資料進行的關聯性判斷結果;選定部,基於該判斷結果,按每個判斷結果識別被提取的該文檔資料,並且分析並選定在被識別的該文檔資料中共同出現的關鍵字;關鍵字記錄部,記錄被選定的該關鍵字;搜索部,在該文檔資料中搜索記錄在該關鍵字記錄部中的關鍵字;以及評分計算部,使用該搜索部的搜索結果和該選定部的分析結果,計算表示判斷結果與文檔資料之間的關聯性的評分,該預測資訊生成部使用該評分來生成與該結果資訊相關的預測資訊。
  7. 一種獲取記錄在多台電腦或伺服器中的數位資訊,並分析所獲取的該數位資訊的取證方法,其中,電腦實現以下的步驟:將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在該數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與該使用者的關聯性判斷的進 展速度相關的資訊;記錄所獲取的該績效資訊;生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;比較該績效資訊及該預測資訊;以及基於該資訊比較部的比較結果,生成用於顯示對該使用者的關聯性判斷的評估的圖示。
  8. 一種獲取記錄在多台電腦或伺服器中的數位資訊,並分析所獲取的該數位資訊的取證程式,使電腦實現以下的功能:將結果資訊或進展資訊中的至少任一個作為績效資訊來獲取,該結果資訊表示使用者對包含在數位資訊中的多個文檔資料進行的與訴訟之間的關聯性判斷的結果,該進展資訊表示與使用者的關聯性判斷的進展速度相關的資訊;記錄所獲取的該績效資訊;生成與結果資訊或進展資訊中的至少任一個相關的預測資訊;比較該績效資訊及該預測資訊;以及基於該資訊比較部的比較結果,生成用於顯示對該使用者的關聯性判斷的評估的圖示。
TW102136451A 2012-10-09 2013-10-09 取證系統、取證方法及取證程式 TW201415263A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012224584A JP6025487B2 (ja) 2012-10-09 2012-10-09 フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム

Publications (1)

Publication Number Publication Date
TW201415263A true TW201415263A (zh) 2014-04-16

Family

ID=50477433

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102136451A TW201415263A (zh) 2012-10-09 2013-10-09 取證系統、取證方法及取證程式

Country Status (4)

Country Link
US (1) US20150339786A1 (zh)
JP (1) JP6025487B2 (zh)
TW (1) TW201415263A (zh)
WO (1) WO2014057965A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5815911B1 (ja) * 2014-05-13 2015-11-17 株式会社Ubic 文書分析システム、文書分析システムの制御方法、および、文書分析システムの制御プログラム
WO2016203652A1 (ja) * 2015-06-19 2016-12-22 株式会社Ubic データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体
US11449218B2 (en) * 2015-07-17 2022-09-20 Thomson Reuters Enterprise Centre Gmbh Systems and methods for data evaluation and classification
JP6404294B2 (ja) * 2016-10-11 2018-10-10 株式会社Ubic フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP6937520B2 (ja) * 2019-02-12 2021-09-22 Gva Tech株式会社 法律文書レビュー支援システム、法律文書レビュー支援プログラム及び法律文書レビュー支援システムの動作方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1196225A (ja) * 1997-09-17 1999-04-09 N Plan:Kk 進捗状況管理表
US20060020503A1 (en) * 2004-04-07 2006-01-26 Harris John F Systems and methods for tracking employee job performance
JP2007109184A (ja) * 2005-10-17 2007-04-26 Jsi:Kk 目標管理システムとその方法及びそのプログラム、及び、人事システム
US20080091692A1 (en) * 2006-06-09 2008-04-17 Christopher Keith Information collection in multi-participant online communities
US8661031B2 (en) * 2006-06-23 2014-02-25 Rohit Chandra Method and apparatus for determining the significance and relevance of a web page, or a portion thereof
JP2008234254A (ja) * 2007-03-20 2008-10-02 Tss:Kk 管理システム
JP5001746B2 (ja) * 2007-08-16 2012-08-15 株式会社フォーサイト 学習支援システム
US20090150168A1 (en) * 2007-12-07 2009-06-11 Sap Ag Litigation document management
US8165974B2 (en) * 2009-06-08 2012-04-24 Xerox Corporation System and method for assisted document review
JP5401270B2 (ja) * 2009-11-13 2014-01-29 株式会社日立製作所 Id媒体及びセンサを利用した作業進捗推定装置及び方法
JP4898934B2 (ja) * 2010-03-29 2012-03-21 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4868191B2 (ja) * 2010-03-29 2012-02-01 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Also Published As

Publication number Publication date
JP2014078082A (ja) 2014-05-01
WO2014057965A1 (ja) 2014-04-17
JP6025487B2 (ja) 2016-11-16
US20150339786A1 (en) 2015-11-26

Similar Documents

Publication Publication Date Title
JP5827208B2 (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
JP2013182338A (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
JP5823942B2 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
TW201415264A (zh) 取證系統、取證方法及取證程式
JPWO2016125310A1 (ja) データ分析システムおよびデータ分析方法並びにデータ分析プログラム
TW201415263A (zh) 取證系統、取證方法及取證程式
JP5986687B2 (ja) データ分別システム、データ分別方法、データ分別のためのプログラム、及び、このプログラムの記録媒体
TWI556128B (zh) Forensic system, forensic method and evidence collection program
JP5226241B2 (ja) タグを付与する方法
JP5622969B1 (ja) 文書分析システム、文書分析方法、および、文書分析プログラム
US9594757B2 (en) Document management system, document management method, and document management program
TWI518631B (zh) File classification survey system, document classification survey method and file classification survey program
JP2017188025A (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
JP5272615B2 (ja) 検索装置、検索システム及び検索方法
JP2010218216A (ja) 類似文書検索システム、方法及びプログラム
WO2016056095A1 (ja) データ分析システム、データ分析システムの制御方法、およびデータ分析システムの制御プログラム
JP6404294B2 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
KR101078966B1 (ko) 문서 분석 시스템
Bianchi et al. Evaluating Trustworthiness of Online News Publishers via Article Classification
CN118132818B (zh) 基于意象差异的旅游区域资源评估方法
JP6441930B2 (ja) データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム
CN115438151A (zh) 标准条款的确定方法、装置、设备及介质
CN114445182A (zh) 基于用户生成内容的产品机会信息收集方法
Zeng et al. Extraction of relevant snippets from web pages using hybrid features
JP2015149056A (ja) 文書分析システム、文書分析方法、および、文書分析プログラム