JP2017004571A - データ分析システムおよびデータ分析方法並びにデータ分析プログラム - Google Patents

データ分析システムおよびデータ分析方法並びにデータ分析プログラム Download PDF

Info

Publication number
JP2017004571A
JP2017004571A JP2016200476A JP2016200476A JP2017004571A JP 2017004571 A JP2017004571 A JP 2017004571A JP 2016200476 A JP2016200476 A JP 2016200476A JP 2016200476 A JP2016200476 A JP 2016200476A JP 2017004571 A JP2017004571 A JP 2017004571A
Authority
JP
Japan
Prior art keywords
information
result
user
unit
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016200476A
Other languages
English (en)
Other versions
JP6404294B2 (ja
Inventor
守本 正宏
Masahiro Morimoto
正宏 守本
喜勝 白井
Yoshikatsu Shirai
喜勝 白井
秀樹 武田
Hideki Takeda
秀樹 武田
和巳 蓮子
Kazumi Hasuko
和巳 蓮子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ubic Inc
Original Assignee
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubic Inc filed Critical Ubic Inc
Priority to JP2016200476A priority Critical patent/JP6404294B2/ja
Publication of JP2017004571A publication Critical patent/JP2017004571A/ja
Application granted granted Critical
Publication of JP6404294B2 publication Critical patent/JP6404294B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】アイコンが利用者の進捗状況またはレビュー中の文書データに応じて適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能とする。
【解決手段】デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える。
【選択図】図1

Description

本発明は、フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラムに関するものであって、特に、訴訟に関連する文書データを収集するためのフォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラムに関する。
従来、不正アクセスや機密情報漏洩などコンピュータに関する犯罪や法的紛争が生じた際に、原因究明や捜査に必要な機器やデータ、電子的記録を収集・分析し、その法的な証拠性を明らかにする手段や技術が提案されている。
また、米国民事訴訟では、eDiscovery(電子証拠開示)等が求められており、当該訴訟の原告および被告のいずれもが、関連するデジタル情報をすべて証拠として提出する責任を負う。そのため、コンピュータやサーバに記録されたデジタル情報を証拠として、提出しなければならない。
一方、ITの急速な発達と普及に伴い、今日のビジネスの世界ではほとんどの情報がコンピュータで作成されているため、同一企業内であっても多くのデジタル情報が氾濫している。
そのため、法廷への証拠資料提出のための準備作業を行う過程において、当該訴訟に必ずしも関連しない機密なデジタル情報までも証拠資料として含めてしまうミスが生じやすい。また、当該訴訟に関連しない機密な文書データを提出してしまうことが問題になっていた。
近年、フォレンジックシステムにおける文書データに関する技術が、特許文献1乃至特許文献3に提案されている。特許文献1には、文書提出命令の対象者情報に含まれる少なくとも1人以上の対象者から、特定の者を指定し、指定された特定の者に関するアクセス履歴情報に基づいて、特定の者がアクセスしたデジタル文書データのみを抽出し、抽出されたデジタル文書データの文書ファイルそれぞれが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
また、特許文献2には、記録されたデジタル情報を表示し、複数の文書ファイル毎に、対象者情報に含まれる対象者のうちいずれの対象者に関連するものであるかを示す対象者特定情報を設定し、該設定された対象者特定情報を記憶部に記録するように設定し、少なくとも一人以上の対象者を指定し、指定された対象者に対応する対象者特定情報が設定された文書ファイルを検索し、表示部を介して、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
さらに、特許文献3には、デジタル文書データに含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書データから、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
特開2011−209930号公報 特開2011−209931号公報 特開2012−32859号公報
しかしながら、例えば、特許文献1乃至特許文献3のようなフォレンジックシステムおいては、複数のコンピュータおよびサーバを利用した対象者の膨大な文書データを収集することになる。
このようなデジタル化された膨大な文書データを訴訟の証拠資料として妥当であるか否かの分別を行う、「レビュー」と言われる作業は、「レビュワー」と呼ばれる利用者が目視により確認し、当該文書データをひとつひとつ分別していく必要があり、レビュワーの能力や体調に応じて、分別作業の精度や効率が左右されるという問題があった。
そこで、本発明は、上記事情に鑑み、アイコンがレビュワーと呼ばれる利用者の進捗状況または、レビュー中の文書データの訴訟との関連度合に応じて適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能とするフォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラムを提供することを目的とするものである。
本発明のフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える。
「文書データ」は、1つ以上の単語を含む情報をいう。文書データの一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。
「関連性判断」は、文書データに対して、訴訟への提出の必要の有無を判断するものをいう。関連性判断は、関連性の度合いに応じて分別符号を付与するものとしてもよい。
「結果情報」は、利用者が文書データに対して行った、訴訟との関連性判断の結果を示すものをいう。結果情報は、利用者が文書データに付与した、訴訟との関連性の度合いを表す分別符号を指してもよい。
「進捗情報」は、利用者の関連性判断の速度に関するものをいう。進捗情報は、単位時間当たりに利用者が関連性判断を行った文書データ数を指してもよい。また、進捗情報は、関連性判断が必要な全文書データに対する、単位時間当たりの関連性判断を行った文書データ数としてもよい。
「実績情報」は、結果情報または進捗情報のうち少なくともいずれか1つに関するものをいう。実績情報は、結果情報および進捗情報の双方を含むものとしてもよい。
「判断取得部」は、利用者が文書データに対して行った判断結果に関する情報を取得するものをいう。
「記録部」は、実績情報を記録するものをいう。
「予測情報」は、利用者の関連性判断を予測したものをいう。予測情報は、結果情報または進捗情報のうち少なくともいずれか1つに関するものとしてもよい。
「予測情報生成部」は、予測情報を生成するものをいう。予測情報生成部は、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するものとしてもよい。また予測情報生成部は、取得した結果情報から利用者の関連性判断の特徴を解析し、該解析の結果に基づいて、結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部は、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。また、予測情報生成部は、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。
「情報比較部」は、複数の情報を比較するものをいう。情報比較部は、予測情報と実績情報が同じ情報を含む場合に比較するものとしてもよい。具体的には、情報比較部は、それぞれが結果情報を含む予測情報と実績情報とを比較するものとしてもよいし、それぞれが進捗情報を含む予測情報と実績情報とを比較するものとしてもよい。また、情報比較部は、それぞれが結果情報および進捗情報の双方を含む予測情報と実績情報とを比較するものとしてもよい。
「評価」は、利用者が行った関連性判断に対するフィードバックをいう。評価は、比較結果に基づくものとしてもよい。具体的には、例えば、予測情報として予測した進捗情報よりも実績情報として取得した進捗情報が有意に遅い場合に、判断速度の向上を促すコメントを評価として呈示するものとしてもよい。また、予測した結果情報と実績として取得した結果情報が異なる場合に、注意喚起する評価を呈示してもよい。
「アイコン」は、利用者に対して評価を呈示する簡単な絵柄で表現されたものをいう。例えば、アイコンは、キャラクターのような親しみを感じやすいものとしてもよい。
「アイコン生成部」は、比較結果に基づいてアイコンを生成するものをいう。また、アイコン生成部は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更するものとしてもよい。また、アイコン生成部は、利用者が関連性判断を行っている文書データの内容に応じても評価を呈示するものとしてもよい。例えば、特定の年代に作成された文書データに対して利用者が関連性判断を行っている場合に、注意を喚起するような評価を呈示するものとしてもよい。
また、本発明に係るフォレンジックシステムは、更に、デジタル情報から所定数の文書データを抽出する抽出部と、抽出された文書データを画面上に表示する表示部と、表示された文書データに対して、利用者が行った関連性の判断結果を受け付ける結果受付部と、判断結果に基づいて、抽出された文書データを判断結果ごとに分別し、該分別された文書データにおいて、共通して出現するキーワードを解析し、選定する選定部と、選定したキーワードを記録するキーワード記録部と、キーワード記録部に記録されたキーワードを文書データから探索する探索部と、探索部の探索結果と選定部の解析結果を用いて、判断結果と文書データとの関連性を示すスコアを算出するスコア算出部とを備え、予測情報生成部は、スコアを用いて結果情報に関する予測情報を生成するものとしてもよい。
「抽出部」は、デジタル情報から文書データを抽出するものをいう。抽出部は、ランダムにサンプリングし抽出するものとしてもよい。また、文書データの更新日時等の属性に基づいて抽出するものとしてもよい。
「表示部」は、抽出した文書データを表示する。表示部は、利用者が利用するクライアント端末上に表示するものとしてもよい。
「結果受付部」は、利用者の関連性判断の結果を受け付けるものをいう。
「選定部」は、キーワードを選定するものをいう。選定部は、同一の判断結果がなされた文書データに共通して出現するキーワードを解析し、選定するものとしてもよい。
「キーワード」は、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
「キーワード記録部」は、キーワードを記録するものをいう。キーワード記録部は、データベースとしてもよい。
「探索部」は、キーワードを文書データから探索するものをいう。
「スコア算出部」は、文書データのスコアを算出するものをいう。スコア算出部は、文書データに含まれるキーワードの評価値に基づいてスコアを算出するものとしてもよい。スコア算出部は、評価値は各キーワードが、ある文書データ中で発揮する情報量をいってもよい。評価値は、文書データ中のキーワードの出現頻度や伝達情報量に基づいて算出するとしてもよい。
「スコア」は、ある文書データにおいて、訴訟との関連度合を示すものをいう。スコアは文書データに含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書データほど、高いスコアを有するとしてもよい。文書データは、一定の要件に基づいてスコアの初期値を与えられるものとしてもよい。例えば、文書データに出現するキーワードと、各キーワードの持つ評価値とにより初期スコアを算出するものとしてもよい。
また、本発明に係るフォレンジック方法は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック方法において、コンピュータが、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得するステップと、取得した、実績情報を記録するステップと、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するステップと、実績情報および予測情報を比較するステップと、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するステップとを実行する。
また、本発明に係るフォレンジックプログラムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックプログラムにおいて、コンピュータに、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得させる機能と、取得した、実績情報を記録させる機能と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成させる機能と、実績情報および予測情報を比較させる機能と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成させる機能とを実現する。
本発明のフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える際には、アイコンがレビューの進捗状況または、レビュー中の文書データの訴訟との関連度合に応じて、利用者に適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能となる。
また、本発明に係る予測情報生成部が、取得した結果情報から利用者の関連性判断の特徴を解析し、解析の結果に基づいて、結果情報に関する予測情報を生成する際においては、ある文書データに対して、利用者の関連性判断の結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、本発明に係る予測情報生成部が、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、他の利用者の関連性判断の結果から、ある文書データに対しての特定の利用者の判断結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、特定の利用者に対して注意喚起を行うことが可能となる。
また、本発明に係る予測情報生成部が、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、ある利用者の過去の進捗速度からレビューの進捗速度を予測し、予測した進捗速度と実際の利用者の進捗速度が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、本発明に係るアイコン生成部は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更する際においては、利用者の状況に応じて適切な評価を呈示することが可能となる。
本発明の第1の実施形態におけるフォレンジックシステムのブロック図 本発明の第1の実施形態におけるレビュー画面を模式的に示した図 本発明の第1の実施形態におけるレビュー画面を模式的に示した図 本発明の第1の実施形態におけるアイコン生成部が生成するアイコンを例示した図 本発明の第1の実施形態の処理を表すフローチャート 本発明の第2の実施形態におけるフォレンジックシステムのブロック図 本発明の第2の実施形態における選定部での解析結果を示したグラフ 本発明の第2の実施形態の予測情報生成処理を表すフローチャート
[第1の実施形態]
以下、本発明の第1の実施形態を図1乃至図5を用いて説明する。
本発明の第1の実施形態に係るフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える。
フォレンジックシステムは、コンピュータまたはサーバを備え、各種入力に基づきCPUがROMに記録されたプログラムを実行することで、各種機能部として動作する。該プログラムは、CD−ROM等の記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされるものであってもよい。
本実施形態においては、レビュワーと呼ばれる利用者が、文書データの中から、訴訟に提出が必要な文書を抽出するために、訴訟との関連性の判断を行う。関連性判断は、関連性の度合いに応じて分別符号を付与するものとしてもよい。この、システム又は利用者が訴訟に関連するか否かを判断する行為をレビューという。レビューでは、レビューの対象となる文書データを、訴訟の関連の度合いや、訴訟との関連の仕方に基づいて、複数の種類に分類を行う。
文書データは、1つ以上の単語を含む情報をいう。文書データの一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。また、スキャンデータを文書データとして扱うことも可能である。この場合、スキャンデータをテキストデータへと変換できるように、フォレンジックシステム内にOCR(Optical Character Reader)装置を備えてもよい。
図1は、第1の実施形態におけるフォレンジックシステムのブロック図を示している。本実施形態において、フォレンジックシステムは、サーバ装置100と、クライアント端末200とを備えている。
サーバ装置100とクライアント端末200とは通信ネットワークを介して接続されている。通信ネットワークは、有線あるいは無線の通信回線をいう。例えば、電話回線、インターネット回線等である。
サーバ装置100は、判断取得部111と、記録部112と、予測情報生成部113と、情報比較部114と、アイコン生成部115とを備えている。
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
クライアント端末200は、コンピュータであり、図2に示すレビュー画面I1を表示する画面表示部211および指示部290(図1では図示を省略)を有している。
画面表示部211は、表示用のディスプレイ(液晶ディスプレイ、CRTモニター、有機ELディスプレイ等)をいう。また、指示部290はマウスまたはキーボードをいう。
利用者は、クライアント端末200を介して、サーバ装置100と接続し、画面表示部211が表示するレビュー画面I1上でレビューを行う。
図1を用いて各構成要素の機能について説明する。
判断取得部111は、利用者が文書データに行った関連性判断の実績情報を取得する。実績情報は、結果情報および進捗情報のうち少なくともいずれかを含んでいる。
結果情報は、利用者が文書データに対して行った、訴訟との関連性判断の結果、つまり関連性の有無を示すものをいう。利用者が文書データに付与した、訴訟との関連性の度合いを表す分別符号を指してもよい。
進捗情報は、利用者の関連性判断の速度に関するものをいう。具体的には、単位時間当たりに利用者が関連性判断を行った文書データ数を指す。なお、関連性判断が必要な全文書データに対する、単位時間当たりの関連性判断を行った文書データ数としてもよい。本実施形態では、判断情報取得部は、ある利用者がある文書データの関連性判断にかかった時間および、該文書データのデータ容量を取得し、時間で容量を割った値から、進捗情報を取得する。
記録部112は、判断取得部111が取得した実績情報を記録する。本実施形態においては、サーバ装置100内のハードディスク上に記録するが、サーバ装置100外に設置されたデータベースとしてもよい。
予測情報生成部113は、予測情報を生成する。予測情報は、利用者の関連性判断を予測したものをいう。結果情報および進捗情報のうち少なくともいずれか1つを含んでいる。また予測情報生成部113は、取得した結果情報から利用者の関連性判断の特徴を解析し、該解析の結果に基づいて、結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。
本実施形態において、予測情報生成部113は、利用者が関連性の判断を行った文書データの類似の文書データに対して、結果情報に関する予測情報を生成する。後述する実施例2の方法を用いて結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、判断取得部111が取得したこれまでの進捗情報から、次の単位時間あたりに利用者がレビューする文書データ数およびデータ容量を予測することも可能である。
情報比較部114は、実績情報と予測情報とを比較する。なお、予測情報と実績情報が同じ情報を含む場合に比較する。具体的には、それぞれが結果情報を含む予測情報と実績情報とを比較するものとしてもよいし、それぞれが進捗情報を含む予測情報と実績情報とを比較するものとしてもよい。また、それぞれが結果情報および進捗情報の双方を含む予測情報と実績情報とを比較するものとしてもよい。
情報比較部114は、比較した結果をアイコン生成部115に通知する。
アイコン生成部115は、比較結果に基づいてアイコンを生成する。また、アイコン生成部115は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更するものとしてもよい。
アイコンは、利用者に対して評価を呈示するものをいう。キャラクターのような親しみを感じやすいものとしてもよい。図3は、本実施形態におけるアイコン生成部115がアイコンを呈示した状態のレビュー画面I1の模式図である。図3のa1は、アイコン生成部115が生成したアイコンを、図3のb1はその評価内容をセリフとして表している。
評価は、利用者が行った関連性判断に対するフィードバックをいう。比較結果に基づくものとしてもよい。具体的には、例えば、予測情報として予測した進捗情報よりも実績情報として取得した進捗情報が有意に遅い場合に、判断速度の向上を促すコメントを評価として呈示するものとしてもよい。また、予測した結果情報と実績として取得した結果情報が異なる場合に、注意喚起する評価を呈示してもよい。
アイコン生成部115の処理を、情報比較部114が、進捗情報に関する実績情報と予測情報とを比較した場合を例にして具体的に説明する。図4はアイコン生成部115が生成するアイコンの例である。これまでの実績情報から、予測情報生成部113の予測した予測情報が単位時間当たり文書データ50件とする。
図4の(A1)は、困った表情で、首をかしげるという動作をしながら、「今日はどうしたの?」というセリフを言うアイコンを示している。これは、判断情報取得部が取得した実績情報が、50件より有意に少なかった場合に、生成される。これによって、利用者にレビュー速度の向上を促すことが可能となる。
図4の(A2)は、笑った表情で、応援しながら、「その調子で頑張って」というセリフを言うアイコンを示している。このアイコンは、予測情報と実績情報のどちらも同じ進捗情報であった場合に生成される。これにより、利用者に現状のペースでレビューを行っていれば問題ない、と自信を持たせることが可能となる。
図4の(A3)は、苦しそうな表情で、走りながら、「しっかり注意も必要だよ」というセリフを言うアイコンを示している。このアイコンは、実績情報が予測情報のペースを上回っている場合に、利用者の注意を喚起するために生成される。これにより、利用者が文書データを注意深く読まずに関連性判断を行うことを抑止することが可能となる。
次に、図5を用いて、本実施形態に係るフォレンジックシステムの処理フローについて説明する。
利用者がある文書データ(文書1)について関連性ありと判断を行うと(STEP101)、判断情報取得部が文書1についての実績情報を取得する(STEP102)。具体的には、文書1が訴訟と関連性がある、という結果情報と、文書1について判断するのにかかった時間で文書1のデータサイズを割った値から求められる進捗情報を実績情報として取得する。取得された実績情報は、記録部112によってサーバ装置100のハードディスクに記録される(STEP103)。
次に、予測情報生成部113が、過去の実績情報や他の利用者の実績情報から予測情報を生成する(STEP104)。情報比較部114が、実績情報と予測情報を比較する(STEP105)。アイコン生成部115が、比較結果をもとにアイコンを生成し、利用者に対して関連性判断の評価を随時呈示する(STEP106)。
[第2の実施形態]
以下、本発明の第2の実施形態を図6乃至図8を用いて説明する。
本発明の第2の実施形態に係るフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える。
また、本実施形態に係るフォレンジックシステムは、更に、デジタル情報から所定数の文書データを抽出する抽出部121と、抽出された文書データを画面上に表示する表示部122と、表示された文書データに対して、利用者が行った関連性の判断結果を受け付ける結果受付部123と、判断結果に基づいて、抽出された文書データを判断結果ごとに分別し、該分別された文書データにおいて、共通して出現するキーワードを解析し、選定する選定部124と、選定したキーワードを記録するキーワード記録部125と、キーワード記録部125に記録されたキーワードを文書データから探索する探索部126と、探索部126の探索結果と選定部124の解析結果を用いて、判断結果と文書データとの関連性を示すスコアを算出するスコア算出部127とを備え、予測情報生成部113は、スコアを用いて結果情報に関する予測情報を生成するものである。
図6は、本実施形態に係るフォレンジックシステムのブロック図を示している。
サーバ装置100は、判断取得部111と、記録部112と、予測情報生成部113と、情報比較部114と、アイコン生成部115と、抽出部121と、表示部122と、結果受付部123と、選定部124と、キーワード記録部125と、探索部126と、スコア算出部127とを備えている。
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
クライアント端末200は、図2に示すレビュー画面I1を表示する画面表示部211を有している。レビュワーと呼ばれる利用者は、クライアント端末200を介して、サーバ装置100と接続し、レビュー画面I1上でレビューを行う。
図6を用いて各構成要素の機能について説明する。
抽出部121は、デジタル情報から文書データを抽出する。抽出する際には、デジタル情報からランダムにサンプリングする。また、文書データの更新日時等の属性に基づいて抽出するものとしてもよい。
表示部122は、抽出した文書データを表示する。具体的には、抽出した文書データを利用者が利用するクライアント端末200上に表示するよう指示を出す。
結果受付部123は、利用者の関連性判断の結果を受け付ける。
選定部124は、キーワードを選定する。同一の判断結果がなされた文書データに共通して出現するキーワードを解析し、選定するものとしてもよい。
図7は、関連性ありと判断された文書データに共通して頻出するキーワードを選定部124が解析した結果のグラフである。図7において、縦軸R_hotは、ユーザによって関連性がありと判断された全文書データのうち、関連性がありと判断される文書データに紐づくキーワードとして選定されたキーワードを含み、かつ関連性がありと判断された文書データの割合を示している。横軸R_allは、利用者がレビューを実施した全文書データのうち、後述する探索部126によって探索されたキーワードを含む文書データの割合を示している。本実施形態において、選定部124では、直線R_hot=R_allよりも上部にプロットされるキーワードを、関連性ありと判断される文書データに共通のキーワードとして選定する。
キーワードは、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
キーワード記録部125は、キーワードを記録するものをいう。データベースとしてもよい。
探索部126は、キーワードを文書データから探索するものをいう。
スコア算出部127は、文書データのスコアを算出するものをいう。文書データに含まれるキーワードの評価値に基づいてスコアを算出するものとしてもよい。評価値は、文書データ中のキーワードの出現頻度や伝達情報量に基づいて算出され、各キーワードがある文書データ中で発揮する情報量をいってもよい。
スコアは、ある文書データにおいて、訴訟との関連度合を示すものをいう。スコアは文書データに含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書データほど、高いスコアを有するとしてもよい。文書データは、一定の要件に基づいてスコアの初期値を与えられるものとしてもよい。例えば、文書データに出現するキーワードと、各キーワードの持つ評価値とにより初期スコアを算出するものとしてもよい。
スコア算出部127は、文書群中に出現するキーワードと、各キーワードの持つ重みづけにより、以下の式からスコアを算出することが可能である。
各キーワードがもつ重みづけは、該キーワードが持つ伝達情報量をもとに決定する。該重みづけは以下の式により、学習することが可能である。
予測情報生成部113は、スコア算出部127が算出したスコアに基づいて、結果情報に関する予測情報を生成する。具体的には、所定の閾値をスコアが超過した文書データについては、関連性ありと予測し、閾値を超過しない文書データに対しては関連性なしと予測して予測情報を生成する。
図8を用いて、本実施形態における予測情報生成処理のフローについて説明する。まず、抽出部121が、デジタル情報から所定数の文書データを抽出する(STEP201)。抽出された文書データを、表示部122がクライアント端末200の画面上に表示させる(STEP202)。結果受付部123が利用者の関連性判断の結果を受け付け(STEP203)、選定部124が利用者の関連性判断の結果から文書データを解析し、キーワードを選定する(STEP204)。選定されたキーワードはキーワード記録部125によって記録される(STEP205)。次に、各文書データから記録されたキーワードを探索部126が探索し(STEP206)、スコア算出部127が式(1)を用いて各文書データのスコアを算出する(STEP207)。算出されたスコアに基づいて、予測情報生成部113が、結果情報に関する予測情報を生成する(STEP208)。
その他の構成、機能については第1の実施形態と同様である。
[その他の実施形態]
アイコン生成部115は、第1の実施形態および第2の実施形態で示した以外にも、利用者が現在レビューを行っている文書データの内容に基づいても評価を呈示することが可能である。
例えば、文書データの作成日時、作成者、セキュリティレベルに基づいて呈示するものとしてもよい。具体的には、訴訟と関連性の高い人物が作成した文書データに対して、利用者がレビューを行う際に、特に注意喚起を促すようなアイコンを生成し、評価を呈示するものとしてもよい。
その他の構成、機能については第1の実施形態と同様である。
フォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える際には、アイコンがレビューの進捗状況または、レビュー中の文書データの訴訟との関連度合に応じて、利用者に適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能となる。
また、予測情報生成部113が、取得した結果情報から利用者の関連性判断の特徴を解析し、解析の結果に基づいて、結果情報に関する予測情報を生成する際においては、ある文書データに対して、利用者の関連性判断の結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、予測情報生成部113が、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、他の利用者の関連性判断の結果から、ある文書データに対しての特定の利用者の判断結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、特定の利用者に対して注意喚起を行うことが可能となる。
また、予測情報生成部113が、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、ある利用者の過去の進捗速度からレビューの進捗速度を予測し、予測した進捗速度と実際の利用者の進捗速度が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、アイコン生成部115が、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更する際においては、利用者の状況に応じて適切な評価を呈示することが可能となる。
100 サーバ装置
111 判断取得部
112 記録部
113 予測情報生成部
114 情報比較部
115 アイコン生成部
121 抽出部
122 表示部
123 結果受付部
124 選定部
125 キーワード記録部
126 探索部
127 スコア算出部
200 クライアント端末
211 画面表示部
290 指示部
I1 レビュー画面
本発明は、データ分析システムおよびデータ分析方法並びにデータ分析プログラムに関する。
このようなデジタル化された膨大な文書データの分別を行う、「レビュー」と言われる作業は、「レビュワー」と呼ばれる利用者が目視により確認し、当該文書データをひとつひとつ分別していく必要があり、レビュワーの能力や体調に応じて、分別作業の精度や効率が左右されるという問題があった。
そこで、本発明は、上記事情に鑑み、利用者のモチベーションを維持し、レビューの効率化を図ることを可能とするデータ分析システムおよびデータ分析方法並びにデータ分析プログラムを提供することを目的とするものである。
本発明は、デジタル情報を記録するメモリと、前記デジタル情報を分析するコントローラと、を備えるデータ分析システムであって、前記コントローラは、前記デジタル情報から複数の文書データを抽出し、前記複数の文書データに対して、レビュー目的との関連性に関する入力を利用者に実行させ、前記入力に基づいて、前記関連性を複数の種類のうち何れかの種類に分別する第1の情報と、前記入力の速度に関する第2の情報と、のうち少なくとも1つを、前記利用者の実績情報として前記入力に係る文書データに設定し、前記設定された実績情報に基づいて、前記利用者にレビューされる文書データについて前記関連性の入力に関する予測情報を生成し、前記文書データに実績情報が設定された場合、当該実績情報と前記予測情報とを比較し、前記実績情報と、前記予測情報と、が異なる場合、前記利用者に注意を喚起するデータを生成して出力する、ことを特徴とする。本発明はさらにデータ分析方法、及び、データ分析プログラムである。
本発明によれば、実績情報と予測情報とが異なる場合、利用者に注意を喚起するデータを生成して出力することにより、利用者のモチベーションを維持し、レビューの効率化を図ることが可能になる。
また、アイコン生成部115が、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更する際においては、利用者の状況に応じて適切な評価を呈示することが可能となる。
以上説明したように、本願発明に係るフォレンジック分析システムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析システムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える。
「文書データ」は、1つ以上の単語を含む情報をいう。文書データの一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。
「関連性判断」は、文書データに対して、訴訟への提出の必要の有無を判断するものをいう。関連性判断は、関連性の度合いに応じて分別符号を付与するものとしてもよい。
「結果情報」は、利用者が文書データに対して行った、訴訟との関連性判断の結果を示すものをいう。結果情報は、利用者が文書データに付与した、訴訟との関連性の度合いを表す分別符号を指してもよい。
「進捗情報」は、利用者の関連性判断の速度に関するものをいう。進捗情報は、単位時間当たりに利用者が関連性判断を行った文書データ数を指してもよい。また、進捗情報は、関連性判断が必要な全文書データに対する、単位時間当たりの関連性判断を行った文書データ数としてもよい。
「実績情報」は、結果情報または進捗情報のうち少なくともいずれか1つに関するものをいう。実績情報は、結果情報および進捗情報の双方を含むものとしてもよい。
「判断取得部」は、利用者が文書データに対して行った判断結果に関する情報を取得するものをいう。
「記録部」は、実績情報を記録するものをいう。
「予測情報」は、利用者の関連性判断を予測したものをいう。予測情報は、結果情報または進捗情報のうち少なくともいずれか1つに関するものとしてもよい。
「予測情報生成部」は、予測情報を生成するものをいう。予測情報生成部は、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するものとしてもよい。また予測情報生成部は、取得した結果情報から利用者の関連性判断の特徴を解析し、該解析の結果に基づいて、結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部は、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。また、予測情報生成部は、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。
「情報比較部」は、複数の情報を比較するものをいう。情報比較部は、予測情報と実績情報が同じ情報を含む場合に比較するものとしてもよい。具体的には、情報比較部は、それぞれが結果情報を含む予測情報と実績情報とを比較するものとしてもよいし、それぞれが進捗情報を含む予測情報と実績情報とを比較するものとしてもよい。また、情報比較部は、それぞれが結果情報および進捗情報の双方を含む予測情報と実績情報とを比較するものとしてもよい。
「評価」は、利用者が行った関連性判断に対するフィードバックをいう。評価は、比較結果に基づくものとしてもよい。具体的には、例えば、予測情報として予測した進捗情報よりも実績情報として取得した進捗情報が有意に遅い場合に、判断速度の向上を促すコメントを評価として呈示するものとしてもよい。また、予測した結果情報と実績として取得した結果情報が異なる場合に、注意喚起する評価を呈示してもよい。
「アイコン」は、利用者に対して評価を呈示する簡単な絵柄で表現されたものをいう。例えば、アイコンは、キャラクターのような親しみを感じやすいものとしてもよい。
「アイコン生成部」は、比較結果に基づいてアイコンを生成するものをいう。また、アイコン生成部は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更するものとしてもよい。また、アイコン生成部は、利用者が関連性判断を行っている文書データの内容に応じても評価を呈示するものとしてもよい。例えば、特定の年代に作成された文書データに対して利用者が関連性判断を行っている場合に、注意を喚起するような評価を呈示するものとしてもよい。
また、本発明に係るフォレンジック分析システムは、更に、デジタル情報から所定数の文書データを抽出する抽出部と、抽出された文書データを画面上に表示する表示部と、表示された文書データに対して、利用者が行った関連性の判断結果を受け付ける結果受付部と、判断結果に基づいて、抽出された文書データを判断結果ごとに分別し、該分別された文書データにおいて、共通して出現するキーワードを解析し、選定する選定部と、選定したキーワードを記録するキーワード記録部と、キーワード記録部に記録されたキーワードを文書データから探索する探索部と、探索部の探索結果と選定部の解析結果を用いて、判断結果と文書データとの関連性を示すスコアを算出するスコア算出部とを備え、予測情報生成部は、スコアを用いて結果情報に関する予測情報を生成するものとしてもよい。
「抽出部」は、デジタル情報から文書データを抽出するものをいう。抽出部は、ランダムにサンプリングし抽出するものとしてもよい。また、文書データの更新日時等の属性に基づいて抽出するものとしてもよい。
「表示部」は、抽出した文書データを表示する。表示部は、利用者が利用するクライアント端末上に表示するものとしてもよい。
「結果受付部」は、利用者の関連性判断の結果を受け付けるものをいう。
「選定部」は、キーワードを選定するものをいう。選定部は、同一の判断結果がなされた文書データに共通して出現するキーワードを解析し、選定するものとしてもよい。
「キーワード」は、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
「キーワード記録部」は、キーワードを記録するものをいう。キーワード記録部は、データベースとしてもよい。
「探索部」は、キーワードを文書データから探索するものをいう。
「スコア算出部」は、文書データのスコアを算出するものをいう。スコア算出部は、文書データに含まれるキーワードの評価値に基づいてスコアを算出するものとしてもよい。スコア算出部は、評価値は各キーワードが、ある文書データ中で発揮する情報量をいってもよい。評価値は、文書データ中のキーワードの出現頻度や伝達情報量に基づいて算出するとしてもよい。
「スコア」は、ある文書データにおいて、訴訟との関連度合を示すものをいう。スコアは文書データに含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書データほど、高いスコアを有するとしてもよい。文書データは、一定の要件に基づいてスコアの初期値を与えられるものとしてもよい。例えば、文書データに出現するキーワードと、各キーワードの持つ評価値とにより初期スコアを算出するものとしてもよい。
また、本発明に係るフォレンジック分析方法は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析方法において、コンピュータが、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得するステップと、取得した、実績情報を記録するステップと、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するステップと、実績情報および予測情報を比較するステップと、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するステップとを実行する。
また、本発明に係るフォレンジック分析プログラムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析プログラムにおいて、コンピュータに、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得させる機能と、取得した、実績情報を記録させる機能と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成させる機能と、実績情報および予測情報を比較させる機能と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成させる機能とを実現する。
本発明のフォレンジック分析システムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析システムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える際には、アイコンがレビューの進捗状況または、レビュー中の文書データの訴訟との関連度合に応じて、利用者に適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能となる。
また、本発明に係る予測情報生成部が、取得した結果情報から利用者の関連性判断の特徴を解析し、解析の結果に基づいて、結果情報に関する予測情報を生成する際においては、ある文書データに対して、利用者の関連性判断の結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、本発明に係る予測情報生成部が、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、他の利用者の関連性判断の結果から、ある文書データに対しての特定の利用者の判断結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、特定の利用者に対して注意喚起を行うことが可能となる。
また、本発明に係る予測情報生成部が、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、ある利用者の過去の進捗速度からレビューの進捗速度を予測し、予測した進捗速度と実際の利用者の進捗速度が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、本発明に係るアイコン生成部は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更する際においては、利用者の状況に応じて適切な評価を呈示することが可能となる。

Claims (8)

  1. 複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、
    前記デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、前記利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、
    前記判断取得部が取得した、実績情報を記録する記録部と、
    結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、
    前記実績情報及び前記予測情報を比較する情報比較部と、
    前記情報比較部の比較結果に基づいて、前記利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備えるフォレンジックシステム。
  2. 前記予測情報生成部は、
    前記取得した結果情報から前記利用者の関連性判断の特徴を解析し、該解析の結果に基づいて、結果情報に関する予測情報を生成することを特徴とする請求項1記載のフォレンジックシステム。
  3. 前記予測情報生成部は、更に、
    他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成することを特徴とする請求項1または2記載のフォレンジックシステム。
  4. 前記予測情報生成部は、更に、
    前記利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成することを特徴とする請求項1から3いずれか1項記載のフォレンジックシステム。
  5. 前記アイコン生成部は、
    前記比較結果に基づいて、前記アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更することを特徴とする請求項1から4いずれか1項記載のフォレンジックシステム。
  6. 前記フォレンジックシステムは、更に、
    前記デジタル情報から所定数の文書データを抽出する抽出部と、
    前記抽出された文書データを画面上に表示する表示部と、
    前記表示された文書データに対して、利用者が行った関連性の判断結果を受け付ける結果受付部と、
    前記判断結果に基づいて、前記抽出された文書データを判断結果ごとに分別し、該分別された文書データにおいて、共通して出現するキーワードを解析し、選定する選定部と、
    前記選定したキーワードを記録するキーワード記録部と、
    前記キーワード記録部に記録されたキーワードを前記文書データから探索する探索部と、
    前記探索部の探索結果と前記選定部の解析結果を用いて、判断結果と文書データとの関連性を示すスコアを算出するスコア算出部とを備え、
    前記予測情報生成部は、
    前記スコアを用いて前記結果情報に関する予測情報を生成することを特徴とする請求項1から5いずれか1項記載のフォレンジックシステム。
  7. 複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック方法において、
    コンピュータが、
    前記デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、前記利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得するステップと、
    前記取得した、実績情報を記録するステップと、
    結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するステップと、
    前記実績情報及び前記予測情報を比較するステップと、
    前記情報比較部の比較結果に基づいて、前記利用者の関連性判断に対する評価を呈示するアイコンを生成するステップとを実現するフォレンジック方法。
  8. 複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックプログラムにおいて、
    コンピュータに、
    前記デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、前記利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得させる機能と、
    前記取得した、実績情報を記録させる機能と、
    結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成させる機能と、
    前記実績情報及び前記予測情報を比較させる機能と、
    前記情報比較部の比較結果に基づいて、前記利用者の関連性判断に対する評価を呈示するアイコンを生成させる機能とを実現するフォレンジックプログラム。
JP2016200476A 2016-10-11 2016-10-11 フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム Active JP6404294B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016200476A JP6404294B2 (ja) 2016-10-11 2016-10-11 フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016200476A JP6404294B2 (ja) 2016-10-11 2016-10-11 フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012224584A Division JP6025487B2 (ja) 2012-10-09 2012-10-09 フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム

Publications (2)

Publication Number Publication Date
JP2017004571A true JP2017004571A (ja) 2017-01-05
JP6404294B2 JP6404294B2 (ja) 2018-10-10

Family

ID=57752602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016200476A Active JP6404294B2 (ja) 2016-10-11 2016-10-11 フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム

Country Status (1)

Country Link
JP (1) JP6404294B2 (ja)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1196255A (ja) * 1997-09-18 1999-04-09 Toshiba Tec Corp 商品登録データ管理システム
JP2002334113A (ja) * 2001-05-08 2002-11-22 Yamaha Corp 文書データの表示制御方法および文書データ表示制御装置
JP2003233626A (ja) * 2002-02-06 2003-08-22 Just Syst Corp 関連有無表示装置、関連有無表示方法およびその方法をコンピュータに実行させるプログラム
US20060020503A1 (en) * 2004-04-07 2006-01-26 Harris John F Systems and methods for tracking employee job performance
JP2007109184A (ja) * 2005-10-17 2007-04-26 Jsi:Kk 目標管理システムとその方法及びそのプログラム、及び、人事システム
US20080005101A1 (en) * 2006-06-23 2008-01-03 Rohit Chandra Method and apparatus for determining the significance and relevance of a web page, or a portion thereof
JP2008234254A (ja) * 2007-03-20 2008-10-02 Tss:Kk 管理システム
JP2009047804A (ja) * 2007-08-16 2009-03-05 Foresight:Kk 学習支援システム
US20090150168A1 (en) * 2007-12-07 2009-06-11 Sap Ag Litigation document management
JP2010092099A (ja) * 2008-10-03 2010-04-22 Ricoh Co Ltd 文書レビュー支援装置、文書レビュー支援方法、プログラム、および記録媒体
JP2011107836A (ja) * 2009-11-13 2011-06-02 Hitachi Ltd Id媒体及びセンサを利用した作業進捗推定装置及び方法
JP2011209930A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP2011209931A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US20120233115A1 (en) * 2011-03-08 2012-09-13 Peak Discovery, Inc. Real-time document management system and method
JP2014078082A (ja) * 2012-10-09 2014-05-01 Ubic:Kk フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1196255A (ja) * 1997-09-18 1999-04-09 Toshiba Tec Corp 商品登録データ管理システム
JP2002334113A (ja) * 2001-05-08 2002-11-22 Yamaha Corp 文書データの表示制御方法および文書データ表示制御装置
JP2003233626A (ja) * 2002-02-06 2003-08-22 Just Syst Corp 関連有無表示装置、関連有無表示方法およびその方法をコンピュータに実行させるプログラム
US20060020503A1 (en) * 2004-04-07 2006-01-26 Harris John F Systems and methods for tracking employee job performance
JP2007109184A (ja) * 2005-10-17 2007-04-26 Jsi:Kk 目標管理システムとその方法及びそのプログラム、及び、人事システム
US20080005101A1 (en) * 2006-06-23 2008-01-03 Rohit Chandra Method and apparatus for determining the significance and relevance of a web page, or a portion thereof
JP2008234254A (ja) * 2007-03-20 2008-10-02 Tss:Kk 管理システム
JP2009047804A (ja) * 2007-08-16 2009-03-05 Foresight:Kk 学習支援システム
US20090150168A1 (en) * 2007-12-07 2009-06-11 Sap Ag Litigation document management
JP2010092099A (ja) * 2008-10-03 2010-04-22 Ricoh Co Ltd 文書レビュー支援装置、文書レビュー支援方法、プログラム、および記録媒体
JP2011107836A (ja) * 2009-11-13 2011-06-02 Hitachi Ltd Id媒体及びセンサを利用した作業進捗推定装置及び方法
JP2011209930A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP2011209931A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US20120233115A1 (en) * 2011-03-08 2012-09-13 Peak Discovery, Inc. Real-time document management system and method
JP2014078082A (ja) * 2012-10-09 2014-05-01 Ubic:Kk フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム

Also Published As

Publication number Publication date
JP6404294B2 (ja) 2018-10-10

Similar Documents

Publication Publication Date Title
JP5827208B2 (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
KR101582108B1 (ko) 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램
US11907669B2 (en) Creation of component templates based on semantically similar content
WO2014057963A1 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
US9542474B2 (en) Forensic system, forensic method, and forensic program
US20200342164A1 (en) Passively suggesting text in an electronic document
JP4997892B2 (ja) 検索システム、検索方法及び検索プログラム
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム
JP5905651B1 (ja) 実績評価装置、実績評価装置の制御方法、および実績評価装置の制御プログラム
JP2014056503A (ja) 多言語環境でのコミュニケーションに適する非テキスト要素を特定するためのコンピュータ実装方法、プログラム、および、システム
JP5827206B2 (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
US20240070188A1 (en) System and method for searching media or data based on contextual weighted keywords
JP6404294B2 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
KR101078966B1 (ko) 문서 분석 시스템
JP2020113048A (ja) 情報処理装置及びプログラム
JP2016189036A (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
KR20110010662A (ko) 문서 분석 시스템
Obike et al. Feature Engineering for Agile Requirement Management Using Semantic Analysis
JP2024075335A (ja) 検索装置、検索方法及びプログラム
JP2015172952A (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム
JP2024122097A (ja) 文書分類システム、文書分類方法および文書処理システム
CN115438151A (zh) 标准条款的确定方法、装置、设备及介质
JP2016012365A (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161109

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180912

R150 Certificate of patent or registration of utility model

Ref document number: 6404294

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250