JP5990562B2 - 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム - Google Patents
事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム Download PDFInfo
- Publication number
- JP5990562B2 JP5990562B2 JP2014253818A JP2014253818A JP5990562B2 JP 5990562 B2 JP5990562 B2 JP 5990562B2 JP 2014253818 A JP2014253818 A JP 2014253818A JP 2014253818 A JP2014253818 A JP 2014253818A JP 5990562 B2 JP5990562 B2 JP 5990562B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- survey
- document
- model
- investigation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
「案件調査結果関連情報」とは、分別又は調査が行われた案件毎に収集される案件種別、調査種別、又は言語種別を特定する情報、調査対象ドキュメントの書誌情報、調査対象ドキュメントの統計情報、レビュー関連情報(プロトコル等)、レビュー結果情報、プレディクティブコーディング(PC)パラメータ及び結果情報、又はフィードバック情報の組み合わせをいう。
「調査モデルパラメータ」とは、「調査モデル」を規定する調査モデル内部のパラメータである。「新たな案件」に関する情報が登録される際に、「共通の情報要素」が抽出されるが、「調査モデルパラメータ」はこの「共通の情報要素」に関連する情報に基づいて決定(追加、削除、又は更新)される。
本発明の実施形態に係る文書調査システムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報に含まれる、複数の文書から構成される文書情報を分析し、訴訟との関連度を示す分別符号を文書に付与することにより、訴訟への利用を容易にするものである。
図1は、本発明の本発明の実施形態に係る文書調査システムの構成を示す。図1を参照して、本発明の実施形態に係る文書調査システムの構成について以下に記載する。
そして、データ格納部100は、案件毎の分別及び調査結果に関連する案件調査結果関連情報及び解析結果を格納する調査結果データベース103と、取得されたデジタル情報に含まれる文書の特定の分別符号と、該特定の分別符号と密接な関係を有するキーワード、及び該特定の分別符号と該キーワードとの対応関係を示すキーワード対応情報を登録するキーワードデータベース104と、所定の分別符号と、該所定の分別符号が付与された文書中において出現頻度が高い単語からなる関連用語と、該所定の分別符号と関連用語との対応関係を示す関連用語対応情報とを登録する関連用語データベース105と、文書と分別符号との結びつきの強さを示すスコアを算出するために該文書に含まれるワードの重みづけを登録するスコア算出データベース106とを格納する。更に、データ格納部100は、案件毎に作成されるプレディクティブコーディングに関する情報を登録する事前情報構成データベース107を格納する。このデータ格納部100は、図1に示されるように、文書調査システム1内に設置されても良く、別個のストレージ装置として文書調査システム1の外部に設置されても良い。
更に、本発明の実施形態に係る文書調査システムは、文書分別処理又は予測文書分別処理の結果をもとに、各キーワード又は関連用語の重みづけを学習する学習部601を備えても良い。
「分別符号」とは、文書を分類する際に用いる識別子のことをいい、訴訟への利用が容易になるように、訴訟との関連度を示すものをいう。例えば、訴訟で文書情報を証拠として利用する際において、証拠の種類に応じて付与してもよい。
本実施形態においては、キーワードには形態素が含まれるものとする。
案件調査結果関連情報を解析し、案件調査結果関連情報と案件調査結果関連情報の解析結果をデータベースに登録する(STEP1)。
モデルとモデルパラメータを作成、追加、削除、及び更新し、当該モデルとモデルパラメータをデータベースに登録する(STEP2)。
案件種別・調査種別等、案件や調査内容を特定する入力情報に関連して、データベースを検索して、調査モデルと調査モデルパラメータを抽出し、抽出した調査モデルと調査モデルパラメータを用いて、モデル出力を行い、モデル出力結果から事前情報を構成する(STEP3)。構成された事前情報をデータベースに登録して利用しても良い。
事前情報に基づいて検索ワードを含む調査条件を設定し、抽出デジタル文書情報を分別及び調査する(STEP4)。
分別及び調査結果に関連する案件調査結果関連情報を収集する(STEP5)
そして、新規案件について案件調査結果関連情報を解析し、予測分別を行う場合には案件毎にSTEP1からSTEP5の処理を繰り返す。
すなわち、本発明の実施形態に係る文書調査方法では、蓄積した案件の分別及び調査の解析結果を情報源として、特定の調査モデルに基づき、事前予測情報を構成して出力することにより、提供された事前情報に基づいて文書の分別及び調査を可能とする。
なお、蓄積した分別及び調査の解析結果を情報源として、特定の調査モデルを規定する調査モデルパラメータを更新、修正することもできる。
すなわち、本発明の実施形態に係る文書調査方法では、案件調査結果関連情報を収集し、データベースに登録する。
案件調査結果関連情報をデータベースから読み出して、調査モデルと調査モデルのパラメータを適宜更新、修正する。
新規案件の調査内容を特定する入力情報に対し、調査モデルを構成し、調査モデルに基づいて事前情報を提供する。これにより、新規案件に対して分別及び調査処理を的確に行い、分別及び調査に対する信頼性を向上する利益を得ることができる。
案件調査結果関連情報を収集する(STEP11)。
案件調査結果関連情報には、例えば、案件種別、調査種別、言語種別、調査対象ドキュメントの書誌情報、統計情報、レビュー関連情報(プロトコル等)、レビュー結果情報、プレディクティブコーディング(PC)パラメータ・結果情報、フィードバック情報が含まれる。
案件調査結果関連情報は案件種別、調査種別等に基づいて分類される。プレディクティブコーディング(PC)の結果情報(形態素分析等の分析結果情報)等については階層化されて分類される。
既存情報(当該装置が既に格納している諸情報)との関連性を調べる(STEP13)。
関連性は、例えば、同一・類似の案件種別、調査種別の情報間でチェックされる。
共通の情報要素には、例えば、共通する形態素、メタデータが含まれる。
上述の共通情報要素に関連する諸情報を追加、削除、又は更新する(STEP15)。
共通情報要素に関連する諸情報には例えば、形態素の重みパラメータ等が含まれる。
共通情報要素に関連する諸情報を読み出す(STEP21)。
上述の諸情報を処理し、モデルパラメータに関連する情報を生成する(STEP22)。
上述の調査モデルパラメータに関連する情報に基づいて、調査モデルパラメータを追加、削除、更新する(STEP23)。
上述の調査モデルと調査モデルパラメータに関する情報は、データベースに登録する。
入力情報を収集する(STEP31)。
入力情報とは、案件種別・調査種別等、案件や調査内容を具体的に特定する情報である。また、入力情報は具体的な案件の識別情報等でも良い。
上述のSTEP32の処理は、案件調査結果関連情報の解析処理のステップSTEP13やSTEP14に準じて行っても良く、又は別の関連性に基づいて行っても良い。
例えば、特定の調査種別に関する調査モデルの適切なパラメータを決定しても良い。調査モデルは複数あって、調査種別等に応じて適宜選択されてもよい。
例えば、特定の種別に関して、データベースDBが蓄積した情報から、典型的な特徴的行為(不正行為、準不正行為、危険行為)を示す内容を調査モデルから導出する。
事前情報とは、入力情報に対応した予測情報(不正行為等のパターン等)である。
事前情報を構成した後に、事前情報に基づいて分別及び調査を進める。
<第1段階(STEP100)>
第1段階におけるキーワードデータベース104の詳細な処理フローを図4を用いて説明する。
第2段階における第1自動分別部201の詳細な処理フローを、図6を用いて説明する。本発明の実施形態において、第2段階では、第1自動分別部201によって、分別符号「重要」を文書に付与する処理を行う。
第3段階における第2自動分別部301の詳細な処理フローを、図7を用いて説明する。
本発明の実施形態において、第2自動分別部301では、第2段階(STEP200)で分別符号を付与しなかった文書情報に対して、「製品A」及び「製品B」という分別符号を付与する処理を行う。
第4段階では、図8に示すように、第3段階までの処理において、分別符号が付与されなかった文書情報から抽出した一定の割合の文書情報に対して、レビュワーからの分別符号の付与を受け付け、当該文書情報に受け付けた分別符号を付与する。次に、図9に示すように、レビュワーから受け付けた分別符号を付与された文書情報を解析し、その解析結果に基づいて、分別符号が付与されていない文書情報に分別符号を付与する。なお、本発明の実施形態においては、該文書情報に対して、第4段階では、例えば、「重要」、「製品A」及び「製品B」という分別符号を付与する処理を行う。第4段階について、更に以下に記載する。
図10は、STEP424によって、「重要」という分別符号が付与された文書に共通して頻出する単語を解析した結果のグラフである。
第5段階における品質検査部501の詳細な処理フローを図13を用いて説明する。品質検査部501では、分別符号受付付与部131が、STEP411で受け付けた文書に対して、文書解析部118がSTEP424で解析した傾向情報に基づいて、付与されるべき分別符号を決定する(STEP511)。
分別符号受付付与部131が受け付けた分別符号とSTEP511で決定した分別符号とを比較し(STEP512)、STEP411で受け付けた分別符号の妥当性を検証する(STEP513)。
調査種類によって、調査する内容は異なる。
例えば、カルテル案件であれば、
1.競合の担当者がカルテルに関連する意思疎通(価格の調整)を、いつ・どのように取ったか?
2.関係者はどの組織の誰か?がポイントになる。
また、特許侵害であれば、
1.侵害の対象になっている技術と内容が同じか?
2.誰が、いつ、どのような意図をもって(持たずに)侵害したか、もしくはしていないか?といったことがポイントになる。
このように、調査の種類又はカテゴリーにより調査する内容に相違が生じる。
本発明の実施形態では、調査種別と調査内容に相違があっても、調査種別と調査内容に応じて報告を自動的に作成する。
本発明の実施形態の他の実施例では、類似の検索情報に対応して、既に分別符号を付与した文書を解析し、解析結果に基づいて分別符号を付与する範囲を調整する方法を用いる。
類似の検索情報に対応して分別符号を付与する範囲を調整する方法として、類似の検索情報に対応して類似の検索情報をクラスタリングして分別符号を付与する範囲を調整する方法と、分別結果を学習して予測分別を行う方法がある。類似の検索情報に対応して類似の検索情報をクラスタリングして分別符号を付与する範囲を調整する方法には、例えば、メタデータの共通性に着目して、原文書、原文書の返信文書、原文書の返信文書の返信文書に共通の分別符号を付与する場合がある。分別結果を学習して予測分別を行う方法では、分別結果について類似の検索情報を統合するように学習することによって、類似の検索情報について同一又は類似の分別符号を付与する。
本発明の実施形態の他の実施例では、解析の対象となる文書の件数により、解析結果の信頼性が変化する。分別の対象となる文書の全件数に対して、統計的手法を加えて、どの時点で、全文書のどの割合について、解析結果に基づいて分別符号を付与する範囲を調整するか定めても良い。
本発明の実施形態の他の実施例では、類似の検索情報に対応して分別符号を付与する範囲を調整する方法として、類似の検索情報に対応して検索情報をクラスタリングして分別符号を付与する範囲を調整する方法と、分別結果を学習して予測分別を行う方法の両方を実行して、分別符号を付与する文書の範囲を調整しても良い。これにより、本発明の実施形態の他の実施例では、これにより、迅速で的確な分別符号の付与を可能とすると共に、分別作業に伴う負担を軽減することができる。
本発明の事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラムにおいて、訴訟案件又は不正調査案件に応じて、過去の訴訟案件又は不正調査案件により蓄積して得られた情報を事前情報として収集及び解析し、解析された情報に基づいて訴訟又は不正調査に利用する文書情報の分別作業及び調査作業を行うことにより訴訟案件又は不正調査案件に応じて的確で信頼性を有する分別及び調査を実施することができる。
また、本発明の事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラムにおいて、訴訟案件又は不正調査案件に応じて、過去の訴訟案件又は不正調査案件により蓄積して得られた情報を事前情報として収集及び解析し、解析された情報に基づいて訴訟又は不正調査に利用する文書情報の分別作業及び調査作業を行うことにより、当該文書情報の分別作業及び調査作業の負担を軽減することが可能となる。
201 第1自動分別部
301 第2自動分別部
401 第3自動分別部
501 品質検査部
601 学習部
701 報告作成部
801 調査結果解析部
100 データ格納部
101 デジタル情報格納領域
103 調査結果データベース
104 キーワードデータベース
105 関連用語データベース
106 スコア算出データベース
107 事前情報構成データベース
109 データベース管理部
112 文書抽出部
114 ワード検索部
116 スコア算出部
118 文書解析部
120 事前情報構成部
122 翻訳部
124 傾向情報生成部
130 文書表示部
131 分別符号受付付与部
133 弁護士レビュー受付部
11 文書表示画面
Claims (5)
- 新たな調査のための事前情報を提供する文書調査システムであって、
過去の調査に関する関連情報を収集し、
前記収集した関連情報からプレディクティブコーディングにより解析した結果に基づいて、前記過去の調査における特徴的行為を示す調査モデルと、当該調査モデルを規定するパラメータである調査モデルパラメータとを、過去の調査ごとに調査結果データベースに登録し、
前記新たな調査に関する内容を特定可能な入力情報が受け付けられた場合、前記調査結果データベースを検索して、当該入力情報に応じて前記調査結果データベースから前記調査モデルと前記調査モデルパラメータとを抽出し、
前記抽出した調査モデルと前記調査モデルパラメータとを用いて計算されるモデル出力結果から、前記新たな調査を実施するための事前情報を構成することによって、前記新たな調査の負担を軽減する文書調査システム。 - 前記関連情報は、文書情報を含み、
前記文書調査システムは、
前記文書情報に含まれる文書と、当該文書を分類する際に用いられる識別子との結びつきの強さを示すスコアを算出し、
前記算出したスコアに基づいて前記調査モデルと前記調査モデルパラメータとを、過去の調査ごとに前記調査結果データベースに登録する
請求項1に記載の文書調査システム。 - 前記文書調査システムは、
新たに収集した関連情報と既存情報との関連性にしたがって当該関連情報と既存情報とに共通する情報要素を抽出し、
前記調査モデルパラメータを前記情報要素に基づいて変更する
請求項1または2に記載の文書調査システム。 - 前記文書調査システムは、
前記抽出した調査モデルを規定する調査モデルパラメータを用いて、特徴的行為を示す内容を前記モデル出力結果として当該調査モデルから導出し、
前記導出した結果を前記事前情報として提供する
請求項1〜3のいずれか1項に記載の文書調査システム。 - 新たな調査のための事前情報を提供する文書調査プログラムであって、
コンピュータに、
過去の調査に関する関連情報を収集させ、
前記収集した関連情報からプレディクティブコーディングにより解析した結果に基づいて、前記過去の調査における特徴的行為を示す調査モデルと、当該調査モデルを規定するパラメータである調査モデルパラメータとを、過去の調査ごとに調査結果データベースに登録させ、
前記新たな調査に関する内容を特定可能な入力情報が受け付けられた場合、前記調査結果データベースを検索して、当該入力情報に応じて前記調査結果データベースから前記調査モデルと前記調査モデルパラメータとを抽出させ、
前記抽出した調査モデルと前記調査モデルパラメータとを用いて計算されるモデル出力結果から、前記新たな調査を実施するための事前情報を構成させることによって、前記新たな調査の負担を軽減する文書調査プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014253818A JP5990562B2 (ja) | 2014-12-16 | 2014-12-16 | 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014253818A JP5990562B2 (ja) | 2014-12-16 | 2014-12-16 | 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013184604A Division JP5669904B1 (ja) | 2013-09-06 | 2013-09-06 | 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015084244A JP2015084244A (ja) | 2015-04-30 |
JP2015084244A5 JP2015084244A5 (ja) | 2016-01-21 |
JP5990562B2 true JP5990562B2 (ja) | 2016-09-14 |
Family
ID=53047778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014253818A Active JP5990562B2 (ja) | 2014-12-16 | 2014-12-16 | 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5990562B2 (ja) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3266106B2 (ja) * | 1998-07-17 | 2002-03-18 | 日本電気株式会社 | 文章自動分類装置及び方法 |
JP2001337971A (ja) * | 2000-05-29 | 2001-12-07 | Ricoh Co Ltd | 文書分類装置、文書分類方法及び文書分類方法のプログラムを記録した記憶媒体 |
JP2006338157A (ja) * | 2005-05-31 | 2006-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 文書群処理装置、文書群処理方法、文書群処理プログラム及び文書群処理プログラムを格納した記録媒体 |
US20090150168A1 (en) * | 2007-12-07 | 2009-06-11 | Sap Ag | Litigation document management |
JP5155129B2 (ja) * | 2008-12-12 | 2013-02-27 | ヤフー株式会社 | 文書分類器のパラメータを調整する文書分類装置及び方法 |
US8504489B2 (en) * | 2009-03-27 | 2013-08-06 | Bank Of America Corporation | Predictive coding of documents in an electronic discovery system |
JP4868191B2 (ja) * | 2010-03-29 | 2012-02-01 | 株式会社Ubic | フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム |
US7933859B1 (en) * | 2010-05-25 | 2011-04-26 | Recommind, Inc. | Systems and methods for predictive coding |
US8566903B2 (en) * | 2010-06-29 | 2013-10-22 | International Business Machines Corporation | Enterprise evidence repository providing access control to collected artifacts |
-
2014
- 2014-12-16 JP JP2014253818A patent/JP5990562B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015084244A (ja) | 2015-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5530476B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5596213B1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
KR20150142070A (ko) | 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램 | |
JP5627750B1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
JP5683749B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP5622969B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP5592552B1 (ja) | 文書分別調査システム及び文書分別調査方法並びに文書分別調査プログラム | |
JP5669904B1 (ja) | 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム | |
WO2015118619A1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
WO2015025978A1 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5990562B2 (ja) | 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム | |
JP5850973B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5898371B2 (ja) | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム | |
JP2015056185A (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
JP5745676B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP2015172952A (ja) | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム | |
WO2015145524A1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP2015149066A (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151127 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151127 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20151127 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160516 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20160610 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160815 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5990562 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |