JP5829768B2 - 電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム - Google Patents
電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム Download PDFInfo
- Publication number
- JP5829768B2 JP5829768B2 JP2015004586A JP2015004586A JP5829768B2 JP 5829768 B2 JP5829768 B2 JP 5829768B2 JP 2015004586 A JP2015004586 A JP 2015004586A JP 2015004586 A JP2015004586 A JP 2015004586A JP 5829768 B2 JP5829768 B2 JP 5829768B2
- Authority
- JP
- Japan
- Prior art keywords
- score
- document
- unit
- classification code
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 97
- 238000004364 calculation method Methods 0.000 claims description 32
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 description 41
- 238000011835 investigation Methods 0.000 description 40
- 238000012545 processing Methods 0.000 description 33
- 230000008569 process Effects 0.000 description 29
- 238000011156 evaluation Methods 0.000 description 24
- 238000000605 extraction Methods 0.000 description 16
- 239000000284 extract Substances 0.000 description 15
- 238000007726 management method Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000007689 inspection Methods 0.000 description 7
- 238000012552 review Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 6
- 230000008520 organization Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012550 audit Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000275 quality assurance Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013432 robust analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本発明の実施形態に係る文書分析システム1の構成例を示すブロック図である。文書分析システム1は、複数のコンピュータまたはサーバに記録されたデジタル情報(ビッグデータ)を取得し、当該取得されたデジタル情報に含まれる、複数の文書から構成される文書情報を分析するシステムである。
データ格納部100は、訴訟または不正調査の解析に利用するために、複数のコンピュータまたはサーバから取得したデジタル情報を、デジタル情報格納領域101に格納する。また、データ格納部100は、調査基礎データベース103、キーワードデータベース104、関連用語データベース105、スコア算出データベース106、および、報告作成データベース107を含む。なお、データ格納部100は、図1に示されるように、文書分析システム1の内部に含まれる記録媒体であってもよいし、当該文書分析システム1と通信可能に接続された外部の記録媒体であってもよい。
データベース管理部109は、調査基礎データベース103、キーワードデータベース104、関連用語データベース105、スコア算出データベース106、および、報告作成データベース107のデータ内容の更新を管理する。データベース管理部109は、専用接続線またはインターネット回線901を介して情報格納装置902に接続されてよい。この場合、データベース管理部109は、情報格納装置902に格納されるデータの内容に基づいて、調査基礎データベース103、キーワードデータベース104、関連用語データベース105、スコア算出データベース106、および、報告作成データベース107のデータ内容を更新してもよい。
文書抽出部112は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、当該取得されたデジタル情報に含まれる文書情報から複数の文書を抽出する。特に、文書抽出部112は、スコア報告部701によってユーザに報告されたスコアを有する文書を、上記文書情報から抽出できる。
ワード検索部114は、データベースに記録されたキーワードまたは関連用語を、文書情報から検索する。特に、ワード検索部114は、文書抽出部112によって抽出されたキーワードおよび/または文章を、複数の文書の中から検索することができる。
スコア算出部116は、文書情報から抽出された文書(文書情報に含まれる文書)が、当該文書情報と訴訟または不正調査との関連度を示す分別符号と結びつく強さを示すスコアを算出する。上記スコアの算出方法については、後で詳細に説明する。
スコア報告部701は、スコア算出部116によって算出されたスコアに応じて、当該スコアをユーザに報告(レポート)する。ここで、スコア報告部701は、例えば、上記スコアが所定のしきい値を超過した場合、当該スコアを報告してよい。なお、上記所定のしきい値は、ユーザからの入力に基づいて、任意に設定可能である。
文書表示部130は、スコア報告部701によってユーザに報告されるスコアを、文書表示画面11(図17参照)において視認可能に表示する。文書表示部130は、文書情報から抽出された複数の文書を、画面上に表示してもよい。
第1自動分別部201は、ワード検索部114によってキーワードデータベース104に格納されたキーワードが検索され、文書抽出部112によって当該キーワードを含む文書が文書情報から抽出された場合、当該抽出された文書に対して、キーワード対応情報に基づいて特定の分別符号を自動的に付与する。
第2自動分別部301は、関連用語データベースに格納された関連用語を含む文書が文書情報から抽出され、当該抽出された文書に含まれる関連用語の評価値、および当該関連用語の数に基づいて、スコアが算出された場合、上記関連用語を含む文書のうち、当該スコアが一定値を超過した文書に対して、当該スコアおよび関連用語対応情報に基づいて、所定の分別符号を自動的に付与する。
言語判定部120は、抽出された文書の言語の種類を判定する。
翻訳部122は、ユーザから指定を受け付けて、または、自動的に、抽出した文書を翻訳する。この場合、1文多言語の複合言語にも対応できるように、言語判定部における言語の区切りを、1文より小さくすることが望ましい。また、言語の判定に、プレディクティブコーディング、キャラクターコーディングのいずれか、または両方を用いてもよい。さらに、HTML(Hyper Text Markup Language)のヘッダなどを、翻訳の対象から除外する処理を行うようにしてもよい。
分別符号受付付与部131は、文書情報から抽出された、分別符号が付与されていない複数の文書に対して、ユーザが訴訟との関連性に基づいて付与した分別符号を受け付け、当該分別符号を付与する。
文書解析部118は、分別符号受付付与部131によって分別符号を付与された文書を解析する。また、文書解析部118は、訴訟との関連性に基づいて、ユーザから分別符号を受け付けて付与した文書に加え、第1自動分別部201および第2自動分別部301において、キーワード、関連用語、スコアに基づいて自動的に分別符号が付与された文書を解析し、ユーザから分別符号を受け付けて付与した上記文書と、自動的に分別符号が付与された上記文書とを統合して、総合的な解析結果を得てもよい。この場合、第3自動分別部401は、当該総合的な解析結果に基づいて、分別符号を自動的に付与することができる。
第3自動分別部401は、分別符号受付付与部131によって分別符号を付与された文書が、文書解析部118によって解析された結果に基づいて、文書情報から抽出された複数の文書に分別符号を自動的に付与する。
傾向情報生成部124は、文書解析部118が解析するために、各文書が含む単語の種類、出現数、単語の評価値に基づいて、各文書が持つ分別符号が付与された文書との類似の度合いを表す傾向情報を生成する。
品質検査部501は、分別符号受付付与部131によって受け付けられた分別符号と、文書解析部118によって傾向情報により付与された分別符号とを比較し、分別符号受付付与部131によって受け付けられた分別符号の妥当性を検証する。
学習部601は、文書を分別処理した結果をもとに、各キーワードまたは関連用語の重み付けを学習する。学習部601は、第1から第4の処理結果(後述)をもとに、各キーワードまたは関連用語の重みづけを式(2)により学習する。学習部601は、当該学習結果をキーワードデータベース104、関連用語データベース105、またはスコア算出データベース106に反映してもよい。
弁護士レビュー受付部133は、分別調査と報告との質を向上させ、分別調査と報告との責任を明確にするために、主任弁護士または主任弁理士のレビューを受け付ける。
「分別符号」は、文書を分類するために用いられる識別子であって、文書を訴訟に利用することが容易となるように、当該訴訟との関連度を示す識別子である。例えば、訴訟において文書情報を証拠として利用する場合、証拠の種類に応じて付与されてよい。
図2は、文書分析システム1において実行される処理(本発明の実施形態に係る文書分析方法)の一例を示すフローチャートである。なお、以下の説明において、カッコ書きの「〜ステップ」は、上記文書分析方法(文書分析システム1の制御方法)に含まれる各ステップを表す。
図3は、本発明の実施形態に係る文書分析方法の詳細なフローチャートである。なお、図2に示されたフローは、図3に示されるフローから独立した処理として実行されてもよいし、図3に示されるフローの任意の箇所に内包される処理として実行されてもよい。
第1段階におけるキーワードデータベース104の詳細な処理フローを図7を用いて説明する。
第2段階における第1自動分別部201の詳細な処理フローを、図9を用いて説明する。本発明の実施形態において、第2段階では、第1自動分別部201によって、分別符号「重要」を文書に付与する処理を行う。
第3段階における第2自動分別部301の詳細な処理フローを、図10を用いて説明する。
第4段階では、図11に示すように、第3段階までの処理において、分別符号が付与されなかった文書情報から抽出した一定の割合の文書情報に対して、レビュワーからの分別符号の付与を受け付け、当該文書情報に受け付けた分別符号を付与する。次に、図12に示すように、レビュワーから受け付けた分別符号を付与された文書情報を解析し、その解析結果に基づいて、分別符号が付与されていない文書情報に分別符号を付与する。なお、本発明の実施形態においては、該文書情報に対して、第4段階では、例えば、「重要」、「製品A」及び「製品B」という分別符号を付与する処理を行う。第4段階について、更に以下に記載する。
第5段階における品質検査部501の詳細な処理フローを図16を用いて説明する。品質検査部501では、分別符号受付付与部131が、STEP411で受け付けた文書に対して、文書解析部118がSTEP424で解析した傾向情報に基づいて、付与されるべき分別符号を決定する(STEP511)。
2.関係者はどの組織の誰か?
がポイントになる。
1.侵害の対象になっている技術と内容が同じか?
2.誰が、いつ、どのような意図をもって(持たずに)侵害したか、もしくはしていないか?
といったことがポイントになる。
文書分析システム1によれば、文書情報に含まれる文書が、文書情報と訴訟または不正調査との関連度を示す分別符号と結びつく強さを示すスコアを算出し、当該スコアをユーザに報告することができる。すなわち、監視すべき文書の優先度を数値化し、ユーザにフィードバックできるため、文書の監視を効率化できるという効果を奏する。
本発明の実施形態の他の実施例について以下に記載する。本発明の実施形態の他の実施例では、類似の検索情報に対応して、既に分別符号を付与した文書を解析し、解析結果に基づいて分別符号を付与する範囲を調整する方法を用いる。
文書分析システム1の制御ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。後者の場合、文書分析システム1は、各機能を実現するソフトウェアであるプログラム(制御プログラム)の命令を実行するCPU、上記プログラム及び各種データがコンピュータ(又はCPU)で読み取り可能に記録されたROM(Read Only Memory)又は記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(又はCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
201 第1自動分別部
301 第2自動分別部
401 第3自動分別部
501 品質検査部
601 学習部
701 スコア報告部
100 データ格納部
101 デジタル情報格納領域
103 調査基礎データベース
104 キーワードデータベース
105 関連用語データベース
106 スコア算出データベース
107 報告作成データベース
109 データベース管理部
112 文書抽出部
114 ワード検索部
116 スコア算出部
118 文書解析部
120 言語判定部
122 翻訳部
124 傾向情報生成部
130 文書表示部
131 分別符号受付付与部
133 弁護士レビュー受付部
11 文書表示画面
Claims (7)
- 電子メールを分類するために用いられる識別子である分別符号と関係を有するキーワードを保持するキーワードデータベースと、
電子メールと前記分別符号との結びつきの強さを示すスコアであって、監視すべき電子メールの優先度を数値化したスコアを、前記キーワードに基づいて算出するスコア算出部と、
前記算出されたスコアがユーザからの入力に基づいて任意に設定可能な所定のしきい値を超過した場合、当該スコアを用いて調査レポートを作成する報告作成部と、
前記作成された調査レポートを出力し、前記スコアをユーザにフィードバックすることにより、前記電子メールの監視を効率化するスコア報告部と
を備えた電子メール分析システム。 - 前記ユーザにフィードバックされたスコアを有する電子メールを抽出する電子メール抽出部と、
前記抽出された電子メールを文書表示画面に表示する電子メール表示部と
をさらに備えたことを特徴とする請求項1に記載の電子メール分析システム。 - 前記分別符号の入力を受け付ける分別符号受付付与部をさらに備え、
前記分別符号は、前記電子メールに対して、前記ユーザが所定の事案との関連性に基づいて付与したものである
ことを特徴とする請求項1または2に記載の電子メール分析システム。 - 前記所定の事案のカテゴリの入力を受け付ける調査カテゴリ入力受付部
をさらに備えたことを特徴とする請求項3に記載の電子メール分析システム。 - 前記スコア算出部は、さらに、スコアを時系列的に算出し、
時系列的に算出されたスコア群の移動平均を、前記電子メールと前記分別符号との結びつきの強さを示すスコアとして、算出する
ことを特徴とする請求項1から4のいずれか一項に記載の電子メール分析システム。 - 電子メールを分類するために用いられる識別子である分別符号と関係を有するキーワードを保持するキーワードデータベースを参照し、電子メールと当該分別符号との結びつきの強さを示すスコアであって、監視すべき電子メールの優先度を数値化したスコアを、当該キーワードに基づいて算出するスコア算出ステップと、
前記算出したスコアがユーザからの入力に基づいて任意に設定可能な所定のしきい値を超過した場合、当該スコアを用いて調査レポートを作成する報告作成ステップと、
前記作成した調査レポートを出力することによって、前記スコアをユーザにフィードバックすることにより、前記電子メールの監視を効率化するスコア報告ステップとを含む、コンピュータが実行する電子メール分析方法。 - コンピュータに、
電子メールを分類するために用いられる識別子である分別符号と関係を有するキーワードを保持するキーワードデータベースを参照し、電子メールと当該分別符号との結びつきの強さを示すスコアであって、監視すべき電子メールの優先度を数値化したスコアを、当該キーワードに基づいて算出するスコア算出機能と、
前記算出されたスコアがユーザからの入力に基づいて任意に設定可能な所定のしきい値を超過した場合、当該スコアを用いて調査レポートを作成する報告作成機能と、
前記作成された調査レポートを出力することによって、前記スコアをユーザにフィードバックすることにより、前記電子メールの監視を効率化するスコア報告機能と
を実現させる電子メール分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015004586A JP5829768B2 (ja) | 2015-01-13 | 2015-01-13 | 電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015004586A JP5829768B2 (ja) | 2015-01-13 | 2015-01-13 | 電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014511638A Division JP5683749B1 (ja) | 2014-02-04 | 2014-02-04 | 文書分析システム、文書分析方法、および、文書分析プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015149066A JP2015149066A (ja) | 2015-08-20 |
JP2015149066A5 JP2015149066A5 (ja) | 2015-10-01 |
JP5829768B2 true JP5829768B2 (ja) | 2015-12-09 |
Family
ID=53892337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015004586A Active JP5829768B2 (ja) | 2015-01-13 | 2015-01-13 | 電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5829768B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5481965B2 (ja) * | 2009-06-26 | 2014-04-23 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US20120244510A1 (en) * | 2011-03-22 | 2012-09-27 | Watkins Jr Robert Todd | Normalization and Cumulative Analysis of Cognitive Educational Outcome Elements and Related Interactive Report Summaries |
JP5530476B2 (ja) * | 2012-03-30 | 2014-06-25 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
-
2015
- 2015-01-13 JP JP2015004586A patent/JP5829768B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015149066A (ja) | 2015-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5596213B1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
JP5683749B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP5627820B1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
US20150169745A1 (en) | Document Sorting System, Document Sorting Method, and Document Sorting Program | |
JP5627750B1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
JP5723067B1 (ja) | データ分析システム、データ分析方法、および、データ分析プログラム | |
JP5622969B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP5592552B1 (ja) | 文書分別調査システム及び文書分別調査方法並びに文書分別調査プログラム | |
WO2015118619A1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
JP6124936B2 (ja) | データ分析システム、データ分析方法、および、データ分析プログラム | |
JP5669904B1 (ja) | 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム | |
JP5829768B2 (ja) | 電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム | |
JP5815911B1 (ja) | 文書分析システム、文書分析システムの制御方法、および、文書分析システムの制御プログラム | |
JP2016189036A (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5745676B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP2015056185A (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
JP5990562B2 (ja) | 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム | |
JP5851007B2 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
WO2015145524A1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150706 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20150706 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20150723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151022 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5829768 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |