TW201415402A - 取證系統、取證方法及取證程式 - Google Patents

取證系統、取證方法及取證程式 Download PDF

Info

Publication number
TW201415402A
TW201415402A TW102136454A TW102136454A TW201415402A TW 201415402 A TW201415402 A TW 201415402A TW 102136454 A TW102136454 A TW 102136454A TW 102136454 A TW102136454 A TW 102136454A TW 201415402 A TW201415402 A TW 201415402A
Authority
TW
Taiwan
Prior art keywords
sentence
information
keyword
document
unit
Prior art date
Application number
TW102136454A
Other languages
English (en)
Inventor
Masahiro Morimoto
Yoshikatsu Shirai
Hideki Takeda
Kazumi Hasuko
Original Assignee
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubic Inc filed Critical Ubic Inc
Publication of TW201415402A publication Critical patent/TW201415402A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/36Combined merging and sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computer Hardware Design (AREA)

Abstract

本發明提供一種取證系統、取證方法以及取證程式,其通過以句子為單位對包含特定的關鍵字的地方進行突出顯示,能夠實現是否應該在訴訟中作為證據被提出的辨別作業的精度的提高以及效率化。該取證系統具有:資訊庫,登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;檢索部,從文檔資訊中檢索被登記在資訊庫中的關鍵字;句子提取部,從文檔資訊中提取包含被檢索到的關鍵字的句子;評分計算部,根據從由句子提取部所提取出的句子中提取的特徵量,來計算表示與訴訟的關聯程度的評分;以及強調部,根據評分來改變句子的強調的程度。

Description

取證系統、取證方法及取證程式
本發明屬於取證系統、取證方法及取證程式,具體地關於用於收集與訴訟關聯的文檔資訊的取證系統、取證方法以及取證程式。
以往,提出一種如下的裝置和技術:當發生不正當訪問或機密資訊洩漏等與電腦相關的犯罪或法律糾紛時,能夠收集和分析原因查明或調查所需的設備、資料、及電子記錄,從而明確其在法律上的證據力。
另外,在美國民事訴訟中,由於需要eDiscovery(電子證據公開)等,該訴訟的原告及被告的任何一方都承擔將全部相關的數位資訊作為證據提出的責任。因此,必須將記錄在電腦或伺服器中的數位資訊作為證據提出。
另一方面,隨著IT的快速發展和普及,在當今的商業世界中幾乎所有的資訊都由電腦來製作,因此即使在同一個企業內部,也氾濫著大量的數位資訊。
因此,在為了向法庭提出證據資訊而進行準備作業的過程中,很容易發生不一定與該訴訟相關聯的機密性數位資訊也作為證據資訊被包含到其中的失誤。另外,存在著提出與該訴訟無關的機密性文檔資訊的問題。
近年來,在專利文獻1至專利文獻3中提出了與取證系統中的文檔資訊相關的技術。專利文獻1中,公開了下述取證系統,從包含在文檔提出命令的物件者資訊中的至少一人以上的物件者中指定特定者,基 於與被指定的特定者相關的訪問歷史資訊,僅提取特定者所訪問的數位文檔資訊,並設定表示所提取的數位文檔資訊的各文檔檔是否與訴訟相關聯的附帶資訊,基於附帶資訊,輸出與訴訟相關聯的文檔檔。
另外,專利文獻2中,公開了下述取證系統:顯示被記錄的 數位資訊,對多個文檔檔中的每一個設定表示是否與包含在物件者資訊中的任一物件者相關聯的物件者特定資訊,並將該被設定的物件者特定資訊以記錄於存儲部中的方式進行設定,指定至少一人以上的對象者,檢索設定有與被指定的物件者對應的物件者特定資訊的文檔檔,並通過顯示部,設定表示被檢索出的文檔檔是否與訴訟相關聯的附帶資訊,基於附帶資訊,輸出與訴訟相關聯的文檔檔。
另外,專利文獻3中,公開了下述取證系統:接受包含在數 位文檔資訊中的至少一個以上的文檔檔的指定,並接受是否將已被指定的文檔檔翻譯成任一種語言的指定,將接受了指定的文檔檔翻譯成接受了指定的語言,並從被記錄在記錄部中的數位文檔資訊中,提取表示與已被指定的文檔檔相同內容的共同文檔檔,並且生成表示所提取的共同文檔檔通過援引已翻譯的文檔檔的翻譯內容而已被翻譯的翻譯關聯資訊,並基於翻譯關聯資訊輸出與訴訟相關聯的文檔檔。
現有技術文獻
專利文獻
專利文獻1:日本特開2011-209930號公報
專利文獻2:日本特開2011-209931號公報
專利文獻3:日本特開2012-32859號公報
但是,例如,在如專利文獻1至專利文獻3那樣的取證系統 中,將要收集利用多個電腦以及伺服器的物件者的龐大的文檔資訊。
對將這樣的被數位化的龐大的文檔資訊作為訴訟的證據資訊是否妥當進行辨別的工作由被稱為檢閱者的使用者通過目視來進行確認,需要一個一個地辨別該文檔資訊,因此存在耗費大量勞力和時間的問題。
因此,本發明鑒於以上問題,其目的在於提供一種取證系統、取證方法以及取證程式,通過以句子為單位來突出顯示顯示包含特定的關鍵字的地方,能夠減輕管理者的負擔並且能夠實現辨別作業的精度的提高以及效率化。
本發明的取證系統獲取被記錄在多個電腦或伺服器中的數位資訊,並對該獲取的數位資訊進行分析,所述取證系統具有:資訊庫,登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;檢索部,從文檔資訊中檢索被登記在資訊庫中的關鍵字;句子提取部,從文檔資訊中提取包含被檢索到的關鍵字的句子;評分計算部,根據從由句子提取部提取出的句子中提取的特徵量,計算表示訴訟的關聯程度的評分;以及強調部,根據評分改變句子的強調的程度。
「文檔資訊」是指包含一個以上的單字的資料。作為文檔資訊的一個例子,可列舉:電子郵件、電子郵件、試算表、會議資訊、合同、組織結構圖以及事業企劃書等。
「關鍵字」是指在某一語言中具有一定的意思的文字列的分組。例如,「對文檔進行辨別」這樣的文章的關鍵字可以是「文檔」、「辨別」、「進行」。
「檢索部」用於從規定的文檔資訊中檢索關鍵字。也可以從文檔資訊中檢索被登記在資訊庫中的關鍵字。
「句子」是指通過標點符號或句號來隔開的一個接連不斷的 語言。在一個文檔資訊中可以包含多個句子。
「句子提取部」用於從文檔資訊中提取句子。也可以提取包含特定的關鍵字的句子。另外,句子提取部也可以基於被檢索到的關鍵字的相近的程度來確定所提取的句子的數量。例如,當在相近的句子中包含相似度高的關鍵字時,也可以提取這兩個句子。
「評分計算部」用於計算句子的評分,也可以基於所提取出的句子的特徵量來計算句子的評分。
「特徵量」是各關鍵字在某一文檔資訊中發揮的信息量。特徵量也可以基於句子中包含的關鍵字被計算出。例如,也可以基於關鍵字的出現頻率或傳達信息量來計算特徵量。
「評分」表示在某一文檔資訊中訴訟與句子的關聯程度。評分基於句子的特徵量被計算出。例如,越是在訴訟時所提出的極度需要的文檔資訊中包含的句子,評分越高。另外,評分也可以根據句子所具有的固有的意思資訊被計算出。具體而言,也可以基於肯定句或否定句和疑問句等句子的性質來計算出。例如,也可以在句子是肯定句的情況下,對根據特徵量計算出的評分進行加分,在句子是否定句的情況下,對評分進行減分。
「強調部」用於改變文檔資訊中的特定的句子的強度的程度。例如,也可以是,以使超過了規定的閾值的句子被突出顯示的方式進行指示。另外,強調部也可以根據特徵量來改變所強調的顏色。
另外,資訊庫可以對使用者在過去判斷是否與訴訟相關聯的文檔資訊中共同並頻繁出現的關鍵字進行分析,並基於與該被分析的關鍵字有關的結果自動地登記關鍵字。具體而言,利用使用者判斷為與訴訟相關聯的文檔資訊組對關鍵字進行加權,並將該加權超過了規定的閾值的關鍵字登記在資訊庫中。例如,可以對被判斷為與訴訟相關聯的文檔資訊組進行分析,並對在該文檔資訊組中共同包含的關鍵字進行加權。
另外,本發明所關於的取證系統還具有:結果接受部,接受 使用者對句子被強調的文檔資訊進行的關聯性的判斷結果;選擇部,基於判斷結果,按每個判斷結果辨別所提取出的文檔資訊,在該被辨別出的文檔資訊中,對共同出現的關鍵字進行分析和選擇;關鍵字記錄部,記錄所選擇的關鍵字;搜索部,從文檔資訊中搜索被記錄在關鍵字記錄部中的關鍵字;文檔評分計算部,使用搜索部的搜索結果和選擇部的分析結果來計算表示判斷結果與文檔資訊的關聯性的文檔評分;以及自動判斷部,基於文檔評分自動地進行關聯性的判斷。
「結果接受部」用於接受使用者的關聯性判斷的結果。
「選擇部」用於選擇關鍵字,也可以對在獲得了相同的判斷結果的文檔資訊中共同出現的關鍵字進行分析和選擇。
「關鍵字記錄部」用於記錄關鍵字,也可以作為資訊庫。
「搜索部」用於從文檔資訊中搜索關鍵字。
「文檔評分計算部」用於計算文檔資訊的文檔評分。也可以基於文檔資訊所包含的關鍵字的評價值來計算文檔評分。評價值也可以基於關鍵字在文檔資訊中的出現頻率或傳達信息量來計算出。
「文檔評分」表示在某一文檔資訊中與訴訟的關聯程度。文檔評分根據文檔資訊所包含的關鍵字被計算出。也可以是,例如,越是訴訟時所提出的極度需要的包含關鍵字的文檔資訊,文檔評分就越高。文檔資訊也可以基於一定的要素賦予文檔評分的初始值。也可以,例如,根據文檔資訊中出現的關鍵字和各關鍵字所具有的評價值來計算初始的文檔評分。
「自動判斷部」用於基於評分計算部所計算出的文檔評分,自動地進行關聯性的判斷。具體而言,也可以針對評分超過了規定的閾值的文檔資訊,判斷為有關聯性,針對評分沒有超過閾值的文檔資訊,判斷為無關聯性。
另外,本發明所關於的取證方法獲取被記錄在多個電腦或伺 服器中的數位資訊,並對所獲取的數位資訊進行分析,在所述取證方法中,使電腦實現以下步驟:登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;從文檔資訊中檢索被登記的關鍵字;從文檔資訊中提取包含被檢索到的關鍵字的句子;根據從由句子提取部所提取出的句子中提取的特徵量,來計算表示與訴訟的關聯程度的評分;以及根據評分來改變句子的強調的程度。
另外,本發明所關於的取證程式獲取被記錄在多個電腦或伺 服器中的數位資訊,並對該所獲取的數位資訊進行分析,所述取證程式使電腦實現以下功能:登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;從文檔資訊中檢索被登記的關鍵字;從文檔資訊中提取包含被檢索到的關鍵字的句子;根據從所提取出的句子中提取出的特徵量,來計算表示與訴訟的關聯程度的評分;以及根據評分來改變句子的強調的程度。
本發明所關於的取證系統獲取被記錄在多個電腦或伺服器 中的數位資訊,並對該獲取的數位資訊進行分析,所述取證系統具有:資訊庫,登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;檢索部,從文檔資訊中檢索被登記在資訊庫中的關鍵字;句子提取部,從文檔資訊中提取包含被檢索到的關鍵字的句子;評分計算部,根據從由句子提取部所提取出的句子中提取的特徵量,來計算表示與訴訟的關聯程度的評分;以及強調部,根據評分來改變句子的強調的程度,在所述取證系統包括上述單元時,通過以句子為單位對包含特定的關鍵字的地方進行突出顯示,能夠減輕管理者的負擔,並且能夠實現辨別作業的精度的提高以及效率化。
另外,在特徵量是基於句子所包含的關鍵字計算出的量時, 本發明的取證系統還能夠以句子為單位強調包含特定的關鍵字的句子。
另外,在評分是根據句子所具有的固有的意思資訊而計算出 的評分時,本發明的取證系統還能夠根據句子所具有的是肯定句還是否定句這樣的固有的性質來改變強調的程度。
另外,在本發明所關於的強調部是根據特徵量來改變所強調 的顏色時,能夠根據句子所具有的固有的意思資訊或關鍵字,來改變進行強調的方法,由此使用者對是否與訴訟相關聯判斷變得更容易。
另外,在本發明所關於的句子提取部是根據被檢索到關鍵字 的相近的程度來確定所提取的句子的數量時,能夠對包含相似的關鍵字的相近的句子進行相同的強調顯示。
另外,在本發明所關於的資訊庫是對使用者在過去判斷是否 與訴訟相關聯的文檔資訊中共同頻繁出現的關鍵字進行分析、並基於與被分析的關鍵字相關的分析結果自動地登記關鍵字時,能夠根據過去的判斷結果,有效地登記有效的關鍵字。
另外,本發明所關於的取證系統還具有:結果接受部,接受 使用者對句子被強調的文檔資訊進行的關聯性的判斷結果;選擇部,基於判斷結果,按每個判斷結果辨別所提取出的文檔資訊,在該被辨別出的文檔資訊中,對共同出現的關鍵字進行分析和選擇;關鍵字記錄部,記錄所選擇的關鍵字;搜索部,從文檔資訊中搜索被記錄在關鍵字記錄部中的關鍵字;文檔評分計算部,使用搜索部的搜索結果和選擇部的分析結果來計算表示判斷結果和文檔資訊的關聯性的文檔評分;以及自動判斷部,基於文檔評分自動地進行關聯性的判斷,在所述取證系統還具有上述單元時,取證系統能夠基於使用者的關聯性判斷的結果,自動地對剩餘的文檔資訊進行關聯性判斷。
100‧‧‧伺服器裝置
101‧‧‧資訊庫
111‧‧‧檢索部
112‧‧‧句子提取部
113‧‧‧評分計算部
114‧‧‧強調部
115‧‧‧登記接受部
123‧‧‧結果接受部
124‧‧‧選擇部
125‧‧‧關鍵字記錄部
126‧‧‧搜索部
127‧‧‧文檔評分計算部
128‧‧‧自動判斷部
200‧‧‧用戶端
211‧‧‧畫面顯示部
I1‧‧‧檢閱畫面
圖1是本發明的第一實施方式中的取證系統的框圖;
圖2是示意性表示本發明的第一實施方式中的檢閱畫面的圖;
圖3是表示本發明的第一實施方式的處理的流程圖;
圖4是表示本發明的第一實施方式的資訊庫的處理的流程圖;
圖5是表示本發明的第一實施方式的資訊庫的分析結果的圖表;
圖6是本發明的第二實施方式中的取證系統的框圖;
圖7是示意性表示本發明的第二實施方式中檢閱畫面的圖;
圖8是表示本發明的第二實施方式的處理的流程圖;
圖9是本發明的第三實施方式中的取證系統的框圖;以及
圖10是表示本發明的第三實施方式的處理的流程圖。
〔第一實施方式〕
以下,參照圖1至圖5對本發明的第一實施進行說明。
本發明的第一實施方式所關於的取證系統具有:資訊庫101,登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;檢索部111,從文檔資訊中檢索被登記在資訊庫101中的關鍵字;句子提取部112,從文檔資訊中提取包含被檢索到的關鍵字的句子;評分計算部113,根據從由句子提取部112提取出的句子中提取的特徵量,來計算表示與訴訟的關聯程度的評分;以及強調部114,根據評分改變句子的強調的程度。
取證系統具有電腦或伺服器,並通過由CPU基於各種輸入執行記錄在ROM中的程式,作為各種功能部進行動作。該程式也可以被存儲於CD-ROM等存儲介質,或經由網際網路等網路進行發佈,安裝至電腦。
在本實施方式中,稱為檢閱者的使用者為了從文檔資訊中提取在訴訟中需要提出的文檔,進行與訴訟的關聯性的判斷。將該系統或使用者判斷是否與訴訟相關聯的行為稱為檢閱。在檢閱中,基於訴訟的關聯 的程度、與訴訟的關聯的方式,將成為檢閱的物件的文檔資訊分類成多個種類。
圖1表示第一實施方式中的取證系統的框圖。在本實施方式中,取證系統具有伺服器裝置100以及用戶端200。
伺服器100和用戶端200經由通信網路連接。通信網路是指有線或無線的通信線路。例如,電話線路、網際網路線路等。
用戶端200是電腦,並分別具有顯示圖2所示的檢閱畫面I1的畫面顯示部211以及指示部(未圖示)。
畫面顯示部211是指顯示用的顯示器(液晶顯示器、CRT顯示器以及有機EL顯示器等)。另外,指示部是指滑鼠或鍵盤。
檢閱者經由用戶端200與伺服器裝置100連接,並在畫面顯示部211所顯示的圖2所示的檢閱畫面I1上進行檢閱。
伺服器裝置100具有檢索部111、句子提取部112、評分計算部113、強調部114以及資訊庫101。
伺服器裝置可以在內部設置有顯示部(未圖示),並顯示通過強調部突出顯示的句子。
在本實施方式中,各構成被搭載於伺服器裝置100上,但也可以分別搭載於不同的框體。
在本實施方式中,系統管理者預先將關鍵字登記於資訊庫101,檢索部111對該登記後的關鍵字是否包含於文檔資訊中進行檢索。檢索結果被作為以句子為單位的強調顯示,提示給使用者。另外,在本實施方式中,如後述那樣,資訊庫還能夠基於過去的檢閱結果,自動地登記關鍵字。由此,當使用者判斷被提示的文檔資訊是否與訴訟相關聯時,能夠將關鍵字隱匿。
資訊庫101是將資料記錄於電子介質的記錄裝置。在本實施方式中,資訊庫101被搭載於伺服器裝置100內部。此外,資訊庫101也能夠 作為保存裝置被設置於單獨框體中。
文檔資訊是指包含一個以上的單字的資料。作為文檔資訊的 一個例子,可例舉出:電子郵件、演示資訊、表計算資訊、會議資訊、合同、組織結構圖以及事業企劃書等。並且,能夠將掃描資料作為文檔來處理。該情況下,為了能夠將掃描資料轉換為文本資料,可以在文檔判別系統內具有OCR(Optical Character Reader:光符閱讀機)裝置。通過由OCR裝置變更為文本資料,能夠從掃描資料中進行關鍵字的分析或檢索。
關鍵字是指在某一語言中具有固定的意思的文字列的集 合。例如,「對文檔進行辨別」這樣的語句中的關鍵字可以是「辨別」、「文檔」、「進行」。
句子是指通過標點符號或句號來隔開的一個接連不斷的語 言。在一個文檔資訊中可以包含多個句子。
對圖1的伺服器裝置100內的各功能進行說明。檢索部111具 有從規定的文檔資訊中檢索被登記在資訊庫101中的關鍵字的功能。
句子提取部112從文檔資訊中提取包含特定的關鍵字的句 子。另外,句子提取部112還能夠基於被檢索到的關鍵字的相近的程度來確定所提取的句子的數量。具體而言,當在相近的句子中包含相似度高的關鍵字時,也可以提取相相近的兩個句子。由此,在具有關聯性高的關鍵字的句子相相近時,能夠以相同的程度來強調。
評分計算部113根據句子提取部112所提取出的句子的特徵 量,來計算評分。評分用於表示在某一文檔資訊中訴訟與句子的關聯程度。 在本實施方式中示出了:評分越高,則與訴訟的關聯性越高。
特徵量是指各關鍵字在某一文檔資訊中發揮的信息量。特徵 量也可以根據句子所包含的關鍵字被計算出。例如,特徵量也可以根據關鍵字的出現頻率或傳達信息量來計算出。
強調部114根據評分改變文檔資訊中的特定的句子的強調的 程度。例如,能夠對評分超過了規定的閾值的句子,使用特定的顏色來突出顯示。另外,強調部114也可以根據特徵量來改變進行強調的顏色。
檢閱者在進行分類時,將在文檔資訊中是否包含特定的關鍵 字、或該特定的關鍵字在什麼樣的上下文中被使用,作為線索。因此,強調部114通過根據評分來改變強調的程度,使得能夠立刻從文檔資訊中立即發現應該注意的句子。由此,能夠實現檢閱的精度的提高和效率化。
圖2是示意性表示在檢閱畫面I1中強調部114所強調顯示的 情形的圖。圖2的(A)以及(B)表示通過強調部114強調的句子。強調部114通過像圖2的(A)和(B)那樣所包含的關鍵字,能夠改變強調的程度。
接著,使用圖3對本實施方式中的取證系統的處理的流程進 行說明。首先,系統管理者登記關鍵字(步驟101)。
圖4是表示資訊庫101自動地登記關鍵字的處理流程的流程 圖。資訊庫101基於使用者在過去判斷是否與訴訟相關聯的結果,自動地登記關鍵字。具體而言,利用使用者判斷為與訴訟相關聯的文檔資訊組對關鍵字進行加權,並將該加權超過了規定的閾值的關鍵字登記於資訊庫101中。例如,可以對被判斷為與訴訟相關聯的文檔資訊組進行分析,並對在該文檔資訊組中共同包含的關鍵字進行加權。
首先,資訊庫101對在過去的檢閱中被判斷為與訴訟相關的 文檔資訊組進行關鍵字分析(步驟151)。
圖5是表示資訊庫10對在過去被檢閱了的文檔資訊進行分析 後的結果的圖表。在圖5中,縱軸R_hot表示包含在被檢閱者判斷為與訴訟相關聯的所有文檔資訊中的、被登記作為與該文檔資訊有關的關鍵字的關鍵字、且被判斷為與訴訟相關聯的文檔資訊的比例。橫軸R_all表示包含在檢閱者實施了檢閱的所有文檔資訊中的、被資訊庫101登記了的關鍵字的文檔資訊的比例。
在本實施方式中,在圖4所示的處理流程中,在資訊庫101 中對在比圖5的直線R_hot=R_all靠上的位置所繪製的那樣的關鍵字進行加權,並登記超過了閾值的關鍵字(步驟152)。
返回至圖3,說明處理的後續。檢索部111從文檔資訊中檢索被登記的關鍵字(步驟102),句子提取部112提取包含被檢索的關鍵字的句子。(步驟103)。
評分計算部113基於關鍵字在句子提取部112提取出的句子中的出現頻率、傳達信息量,來計算該句子的評分。通過此時句子所具有的固有的意思資訊,對所計算出的評分進行得分的加分和減分(步驟104)。強調部114根據所計算出的評分,對句子進行強調(步驟105)。在經由網路對伺服器裝置100進行了訪問的用戶端200中顯示圖2所示的對句子進行了強調顯示的檢閱畫面I1(步驟106)。
〔第二實施方式〕
以下,使用圖6至圖8對本發明的第二實施方式進行說明。
本發明的第二實施方式所關於的取證系統具有:資訊庫101,登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;檢索部111,從文檔資訊中檢索被登記在資訊庫101中的關鍵字;句子提取部112,從文檔資訊中提取包含被檢索到的關鍵字的句子;評分計算部113,根據從由句子提取部112提取出的句子中提取的特徵量,來計算表示訴訟的關聯程度的評;以及強調部114,根據評分改變句子的強調的程度。
圖6表示第二實施方式中的取證系統的框圖。在本實施方式中,取證系統具有伺服器裝置100、用戶端200以及資訊庫101。
伺服器裝置100、用戶端200以及資訊庫101經由通信網路連接。通信網路是指有線或無線的通信線路。例如,電話線路、網際網路線路等。
伺服器裝置100具有:檢索部111、句子提取部112、評分計 算部113、強調部114以及登記接受部115。
在本實施方式中各結構被搭載於伺服器裝置100上,也可以分別被搭載於其他框體。
在本實施方式中,被稱為檢閱者的使用者登記關鍵字。圖7是示意性示出在本實施方式中檢閱者實施檢閱的檢閱畫面I1的圖。
圖7的(A)是檢索窗口。檢閱者將想要檢索的關鍵字輸入至該檢索視窗。被輸入的關鍵字被登記接受部115接受,並被記錄於資訊庫101。圖7的(B)是文檔資訊顯示畫面。檢閱者所輸入的關鍵字的檢索結果如圖7的(B)所示,以句子為單位被強調顯示。在本實施方式中,具有相似的關鍵字的相近的句子使用相同的顏色被強調顯示。
檢索部111從規定的文檔資訊中檢索關鍵字。具體而言,檢閱者從文檔資訊中檢索在圖7的(A)中輸入的關鍵字。
句子提取部112從文檔資訊中提取包含檢閱者所輸入的特定的關鍵字的句子。此時,句子提取部112還能夠基於被檢索到的關鍵字的相近的程度,確定提取的句子的數量。例如,當在相近的句子中包含相似度高的關鍵字的情況下,也可以提取這兩個句子。
評分計算部113基於句子提取部112所提取出的句子特徵量,來計算句子的評分。
評分表示在某一文檔資訊中訴訟與句子的關聯程度。在本實施方式中,根據肯定句或否定句和疑問句等句子的性質,評分被算出。例如,可以在句子是肯定句的情況下,對基於特徵量計算出的評分進行加分,在句子是否定句的情況下,對評分進行減分。
特徵量是指各關鍵字在某一文檔資訊中發揮的信息量。基於句子中包含的關鍵字提取特徵量。在本實施方式中,也可以根據關鍵字的出現頻率或傳達信息量提取特徵量。
強調部114基於評分改變文檔資訊中的特定的句子的強調程 度。在本實施方式中,能夠對評分超過了某一規定的閾值的句子進行突出顯示,並且能夠根據特徵量改變所強調的顏色。
接著,使用圖8對取證系統的處理流程進行說明。首先,檢 閱者從圖7的(A)所示的檢索視窗中輸入關鍵字(步驟201)。接著,登記接受部115接受所輸入的關鍵字(步驟202),資訊庫101記錄關鍵字(步驟203)。檢索部111檢索所記錄的關鍵字(步驟204),句子提取部112提取包含所檢索的關鍵字的句子(步驟205)。
評分計算部113根據關鍵字在句子提取部112所提取出的句 子中的出現頻率、傳達信息量以及句子所具有的固有的意思資訊,計算該句子的評分。(步驟206)。強調部114基於所計算出的評分,對句子進行強調顯示(步驟207)。在經由網路訪問了伺服器裝置100的用戶端200上顯示如圖7的(B)所示的對句子進行了強調顯示的檢閱畫面I1(步驟208)。
關於其他的結構、功能,與第一實施方式相同。
[第三實施方式〕
以下,使用圖9以及圖10對本發明的第三實施方式進行說明。
本發明的第三實施方式所關於的取證系統具有:資訊庫 101,登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;檢索部111,從文檔資訊中檢索被登記在資訊庫101中的關鍵字;句子提取部112,從文檔資訊中提取包含被檢索到的關鍵字的句子;評分計算部113,根據從由句子提取部112提取出的句子中提取的特徵量,來計算表示與訴訟的關聯程度的評分;以及強調部114,根據評分改變句子的強調的程度。
另外,本實施方式所關於的取證系統還具有:結果接受部 123,接受使用者對句子被強調的文檔資訊進行的關聯性的判斷結果;選擇部124,基於判斷結果,按每個判斷結果辨別所提取出的文檔資訊,在該被辨別出的文檔資訊中,對共同出現的關鍵字進行分析和選擇;關鍵字記錄 部125,記錄所選擇的關鍵字;搜索部126,從文檔資訊中搜索被記錄在關鍵字記錄部125的關鍵字;文檔評分計算部127,使用搜索部的搜索結果和選擇部的分析結果來計算表示判斷結果與文檔資訊的關聯性的文檔評分;以及自動判斷部128,基於文檔評分自動地進行關聯性的判斷。
圖9表示本實施方式所關於的取證系統的框圖。
伺服器裝置100具有檢索部111、句子提取部112、評分計算 部113、強調部114、資訊庫101、結果接受部123、選擇部124、關鍵字記錄部125、搜索部126、文檔評分計算部127以及自動判斷部128。
在本實施方式中,各結構搭載於伺服器裝置100上,也可以 分別搭載於其他框體。
用戶端200具有顯示圖2所示的檢閱畫面I1的畫面顯示部 211。被稱為檢閱者的使用者經由用戶端200與伺服器裝置100連接,並在檢閱畫面I1上進行檢閱。
使用圖9對各結構要素的功能進行說明。
選擇部124選擇關鍵字。也可以對在獲得了相同的判斷結果 的文檔資訊中共同出現的關鍵字進行分析和選擇。
關鍵字記錄部125用於記錄關鍵字,但也可以作為資訊庫。
搜索部126從文檔資訊中搜索關鍵字。
文檔評分計算部127計算文檔資訊的文檔評分。也可以基於 文檔資訊所包含的關鍵字的評價值來計算文檔評分。評價值也可以是各關鍵字在某一文檔資訊中發揮的信息量。評價值也可以基於關鍵字在文檔資訊中的出現頻率或傳達資訊來計算出。
文檔評分表示在某一文檔資訊中與訴訟的關聯程度。文檔評 分基於文檔資訊所包含的關鍵字被計算出。例如,越是訴訟時所提出的極度需要的包含關鍵字的文檔資訊,文檔評分就越高。文檔資訊也可以基於一定的要素,賦予文檔評分的初始值。例如,也可以基於文檔資訊中出現 的關鍵字和各關鍵字所具有的評價值來計算初始評分。
文檔評分計算部127可基於文檔群中出現的關鍵字和各關鍵 字所具有的加權,由以下公式計算出文檔評分。
【公式1】
m i :第i個關鍵字或關聯用語的出現頻率
wgt i :第i個關鍵字或關聯用語的權重
各關鍵字所具有的加權基於該關鍵字所具有的傳達信息量來確定。該加權可以基於以下的公式進行學習。
【公式2】
wgt i,0:學習前的第i個選擇關鍵字的權重(初始值)
wgt i,L :第L次學習後的第i個選擇關鍵字的權重
γ L :第L次學習中的學習參數
Θ:學習效果的閾值
自動判斷部128基於評分計算部127所計算出的文檔評分,自動地進行關聯性的判斷。具體而言,針對評分超過了規定的閾值的文檔資訊,判斷為有關聯性,針對評分沒有超過閾值的文檔資訊,判斷為無關聯性。
使用圖10對本實施方式中的關聯性自動判斷的處理流程進行說明。首先,結果接受部123接受使用者參考被強調顯示的句子的同時對文檔資訊進行的關聯性判斷的結果(步驟301)。選擇部124根據使用者的關聯性判斷的結果對文檔資訊進行分析並選擇關鍵字(步驟302)。被選擇的關鍵字通過關鍵字記錄部125被記錄(步驟303)。接下來,搜索部126從各文檔資訊中搜索被記錄的關鍵字(步驟304),文檔評分計算部127使用公式(1)計算各文檔資訊的文檔評分(步驟305)。自動判斷部128基於而計算 出的文檔評分,自動地進行關聯性的判斷(步驟306)。
關於其他的結構、功能,與第一或第二實施方式相同。
取證系統具有:資訊庫101,登記供使用者對數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;檢索部111,從文檔資訊中檢索被登記的關鍵字;句子提取部112,從文檔資訊中提取包含被檢索到的關鍵字的句子;評分計算部113,根據從所提取出的句子中提取的特徵量,來計算表示與訴訟的關聯程度的評分;以及強調部114,根據評分改變句子的強調程度,由此,能夠提高使用者對是否與訴訟關聯的判斷的精度以及速度。
在特徵量是基於句子中包含的關鍵字而計算出的量時,取證系統還能夠以句子為單位強調包含特定的關鍵字的句子。
另外,在評分是根據句子所具有的固有的意思資訊而計算出的評分時,取證系統還能夠根據句子所具有的是肯定句還是否定句這樣的固有的性質來改變強調的程度。
另外,在強調部114是根據特徵量來改變所強調的顏色時,能夠根據句子所具有的固有的意思資訊或關鍵字,來改變進行強調的方法,由此使用者對是否與訴訟相關聯的判斷變得容易。
另外,在句子提取部112是基於被檢索到關鍵字的相近的程度來確定所提取的句子的數量時,對包含相似的關鍵字的相近的句子進行相同的強調顯示。
另外,在資訊庫101是對在使用者在過去判斷是否與訴訟相關聯的文檔資訊中共同並頻繁出現的關鍵字進行分析、並在基於與該被分析的關鍵字有關的結果自動地登記關鍵字時,能夠根據過去的判斷結果,有效地登記有效的關鍵字。
另外,在取證系統還具有:結果接受部123,接受使用者對句子被強調的文檔資訊所進行的關聯性的判斷結果;選擇部124,基於判斷 結果,按每個判斷結果辨別所提取出的文檔資訊,並在該被辨別出的文檔資訊中,對共同出現的關鍵字進行分析和選擇;關鍵字記錄部125,記錄所選擇的關鍵字;搜索部126,從文檔資訊中搜索被記錄在關鍵字記錄部125中的關鍵字;文檔評分計算部127,使用搜索部的搜索結果和選擇部的分析結果,來計算表示判斷結果和文檔資訊的關聯性的文檔評分;以及自動判斷部128,基於文檔評分自動地進行關聯性的判斷,在取證系統還具有上述單元時,取證系統能夠根據使用者的關聯性判斷的結果,自動地對剩餘的文檔資訊進行關聯性判斷。
100‧‧‧伺服器裝置
101‧‧‧資訊庫
111‧‧‧檢索部
112‧‧‧句子提取部
113‧‧‧評分計算部
114‧‧‧強調部
200‧‧‧用戶端
211‧‧‧畫面顯示部

Claims (9)

  1. 一種取證系統,獲取被記錄在多個電腦或伺服器上的數位資訊,並對該獲取的數位資訊進行分析,其特徵在於,具有:資訊庫,登記供使用者對該數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;檢索部,從文檔資訊中檢索被登記在該資訊庫中的該關鍵字;句子提取部,從該文檔資訊中提取包含該被檢索到的關鍵字的句子;評分計算部,根據從由該句子提取部提取出的句子中提取的特徵量,計算表示與訴訟的關聯程度的評分;以及強調部,根據該評分改變該句子的強調程度。
  2. 如請求項1所述的取證系統,其中,該特徵量是基於該句子中包含的關鍵字而計算出的。
  3. 如請求項1或2所述的取證系統,其中,該評分是根據該句子所具有的固有的意思資訊而計算出的。
  4. 如請求項1至3中任一項所述的取證系統,其中,該強調部根據該特徵量來改變所強調的顏色。
  5. 如請求項1至4中任一項所述的取證系統,其中,該句子提取部基於該被檢索到關鍵字的相近的程度,來確定所提取的句子的數量。
  6. 如請求項1至5中任一項所述的取證系統,其中,該資訊庫對使用者在過去判斷為與訴訟相關聯的文檔資訊中共同並頻繁出現的關鍵字進行分析,並基於與該被分析的關鍵字相關的分析結果自動地登記上述關鍵字。
  7. 如請求項1至6中任一項所述的取證系統,其中,該取證系統還具有:結果接受部,接受使用者對該句子被強調的文檔資訊所進行的關聯性的判斷結果;選擇部,基於該判斷結果,按每個判斷結果辨別該所提取出的文檔資訊,並在該被辨別出的文檔資訊中對共同出現的關鍵字進行分析和選擇;關鍵字記錄部,記錄該所選擇的關鍵字;搜索部,從該文檔資訊中搜索被記錄在該關鍵字記錄部中的關鍵字;文檔評分計算部,使用該搜索部的搜索結果和該選擇部的分析結果來計算表示判斷結果與文檔資訊的關聯性的文檔評分;以及自動判斷部,基於該文檔評分自動地進行關聯性的判斷。
  8. 一種取證方法,獲取被記錄在多個電腦或伺服器中的數位資訊,並對該所獲取的數位資訊進行分析,其特徵在於,使電腦實現以下步驟:登記供使用者對該數位資訊所包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;從文檔資訊中檢索該被登記的該關鍵字;從該文檔資訊中提取包含該被檢索到的關鍵字的句子;根據從該提取出的句子中提取的特徵量,來計算表示與訴訟的關聯程度的評分;以及根據該評分來改變該句子的強調的程度。
  9. 一種取證程式,獲取被記錄在多個電腦或伺服器中的數位資訊,並對該 所獲取的數位資訊進行分析,其特徵在於,使電腦實現以下功能:登記供使用者對該數位資訊中包含的多個文檔資訊判斷是否與訴訟相關聯的關鍵字;從文檔資訊中檢索該被登記的該關鍵字;從該文檔資訊中提取包含該被檢索到的關鍵字的句子;根據從該所提取出的句子中提取出的特徵量,來計算表示與訴訟的關聯程度的評分;以及根據該評分來改變該句子的強調的程度。
TW102136454A 2012-10-09 2013-10-09 取證系統、取證方法及取證程式 TW201415402A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012224582A JP5823942B2 (ja) 2012-10-09 2012-10-09 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Publications (1)

Publication Number Publication Date
TW201415402A true TW201415402A (zh) 2014-04-16

Family

ID=50477430

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102136454A TW201415402A (zh) 2012-10-09 2013-10-09 取證系統、取證方法及取證程式

Country Status (4)

Country Link
US (1) US9542474B2 (zh)
JP (1) JP5823942B2 (zh)
TW (1) TW201415402A (zh)
WO (1) WO2014057962A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095270A (zh) * 2016-06-06 2016-11-09 北京京东尚科信息技术有限公司 展示重点语句及确定标记范围的方法和终端装置及服务器
CN111127183A (zh) * 2018-10-31 2020-05-08 重庆小雨点小额贷款有限公司 数据处理方法、装置、服务器及计算机可读存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3279804A4 (en) 2015-03-31 2018-10-31 Fronteo, Inc. Data analysis system, data analysis method, data analysis program, and recording medium
JP6604024B2 (ja) * 2015-04-27 2019-11-13 アイ・ピー・ファイン株式会社 情報処理装置
JPWO2017061253A1 (ja) * 2015-10-09 2018-08-16 アイビーリサーチ株式会社 表示制御装置、表示制御方法及び表示制御プログラム
JP2018013893A (ja) * 2016-07-19 2018-01-25 Necパーソナルコンピュータ株式会社 情報処理装置、情報処理方法、およびプログラム
JP6868186B2 (ja) * 2017-03-24 2021-05-12 富士フイルムビジネスイノベーション株式会社 検索情報生成装置、画像処理装置、検索情報生成プログラム
US10304000B2 (en) * 2017-04-13 2019-05-28 Flatiron Health, Inc. Systems and methods for model-assisted cohort selection

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6721728B2 (en) * 2001-03-02 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for discovering phrases in a database
US20030144970A1 (en) * 2001-12-10 2003-07-31 Coyne Patrick J. Project management database and method of managing project related information
US8090754B2 (en) * 2007-12-07 2012-01-03 Sap Ag Managing relationships of heterogeneous objects
US9501467B2 (en) * 2007-12-21 2016-11-22 Thomson Reuters Global Resources Systems, methods, software and interfaces for entity extraction and resolution and tagging
JP5270199B2 (ja) * 2008-03-19 2013-08-21 克佳 長嶋 テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法
US20100250340A1 (en) * 2009-03-24 2010-09-30 Ip Street, Inc. Processing and Presenting Intellectual Property and Other Information
US8572376B2 (en) * 2009-03-27 2013-10-29 Bank Of America Corporation Decryption of electronic communication in an electronic discovery enterprise system
US8706742B1 (en) * 2009-04-22 2014-04-22 Equivio Ltd. System for enhancing expert-based computerized analysis of a set of digital documents and methods useful in conjunction therewith
NZ601378A (en) * 2010-01-29 2014-06-27 Lexisnexis Division Of Reed Elsevier Inc Systems and methods for providing a validation tool
JP4868191B2 (ja) * 2010-03-29 2012-02-01 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4898934B2 (ja) * 2010-03-29 2012-03-21 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4995950B2 (ja) 2010-07-28 2012-08-08 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US20130231971A1 (en) * 2011-08-23 2013-09-05 Judy Bishop Legal project management system and method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095270A (zh) * 2016-06-06 2016-11-09 北京京东尚科信息技术有限公司 展示重点语句及确定标记范围的方法和终端装置及服务器
CN106095270B (zh) * 2016-06-06 2020-05-01 北京京东尚科信息技术有限公司 展示重点语句及确定标记范围的方法和终端装置及服务器
CN111127183A (zh) * 2018-10-31 2020-05-08 重庆小雨点小额贷款有限公司 数据处理方法、装置、服务器及计算机可读存储介质
CN111127183B (zh) * 2018-10-31 2023-10-17 重庆小雨点小额贷款有限公司 数据处理方法、装置、服务器及计算机可读存储介质

Also Published As

Publication number Publication date
US9542474B2 (en) 2017-01-10
US20150286706A1 (en) 2015-10-08
JP5823942B2 (ja) 2015-11-25
WO2014057962A1 (ja) 2014-04-17
JP2014078081A (ja) 2014-05-01

Similar Documents

Publication Publication Date Title
KR101658794B1 (ko) 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램
TWI552103B (zh) File classification system and file classification method and file classification program
TW201415402A (zh) 取證系統、取證方法及取證程式
JP5596213B1 (ja) 文書分析システム及び文書分析方法並びに文書分析プログラム
TW201415264A (zh) 取證系統、取證方法及取證程式
TW201421414A (zh) 文件管理系統及文件管理方法以及文件管理程式
JP5986687B2 (ja) データ分別システム、データ分別方法、データ分別のためのプログラム、及び、このプログラムの記録媒体
TWI556128B (zh) Forensic system, forensic method and evidence collection program
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム
CN110647504B (zh) 司法文书的检索方法及装置
JP5592552B1 (ja) 文書分別調査システム及び文書分別調査方法並びに文書分別調査プログラム
JP5669904B1 (ja) 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム
WO2015025978A1 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
JP6404294B2 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP5850973B2 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
JP2015172952A (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム
JP5990562B2 (ja) 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム
JP2014167835A (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム