JP2014167835A - 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム - Google Patents
文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム Download PDFInfo
- Publication number
- JP2014167835A JP2014167835A JP2014124951A JP2014124951A JP2014167835A JP 2014167835 A JP2014167835 A JP 2014167835A JP 2014124951 A JP2014124951 A JP 2014124951A JP 2014124951 A JP2014124951 A JP 2014124951A JP 2014167835 A JP2014167835 A JP 2014167835A
- Authority
- JP
- Japan
- Prior art keywords
- document
- unit
- classification
- keyword
- lawsuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明は、訴訟と関係するか否かがユーザによって分別された分別文書に含まれるキーワードの重みづけを学習する学習部と、訴訟と関係するか否かがユーザによって未だ分別されていない未分別文書から、分別文書に含まれるキーワードを探索する探索部と、探索部によって探索されたキーワード、および当該キーワードの重みづけを用いて、未分別文書と分別符号との結びつきの強さを評価したスコアを算出するスコア算出部とを備えている。
【選択図】図1
Description
以下、本発明の実施の形態を添付の図により説明する。図1に第1の実施形態に係る文書判別システムの構成図を示す。
第1段階におけるデータベース201の処理フローを、図4を用いて詳細に説明する。データベース201で何段階目の処理を行うかを判断し、第1段階の処理を選択する(STEP1:第1段階)。本段階ではまず、データベース201でキーワードの事前登録を行う(STEP2)。このとき登録されるのは、過去の分別処理の結果から、製品Aと関連性が高く、文書中に含まれれば、直ちに「重要」符号を付与すると、判断できるキーワードである。また、同様に過去の分別処理の結果から、製品Aと関連性が高いため「重要」符号が付与された文書群と関連性の高い一般用語を抽出し(STEP3)、関連用語として登録を行う(STEP4)。
第2段階におけるデータベース201、探索部106及び自動分別部108の処理フローを、図4、図5及び図7を用いて、詳細に説明する。
第3段階におけるデータベース201、探索部106、スコア算出部107及び自動分別部108の処理フローを、図4、図5、図6及び図7を用いて、詳細に説明する。
第3段階におけるデータベース201、探索部106、スコア算出部107、自動分別部108、抽出部102、文書表示部103、分別符号受付部104及び選定部105の処理フローを、それぞれ図4、図5、図6、図7、図8、図9、図10及び図11を用いて、詳細に説明する。
第5段階での文書排除部109及び学習部110における処理フローを、それぞれ図12及び図13を用いて説明する。
本発明のその他の実施形態を説明する。
本発明の文書判別システムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報に含まれる文書情報を分析し、訴訟への利用が容易になるように分別する文書分別システムに係るものであって、文書情報から所定数の文書を含むデータセットである文書群を抽出する抽出部と、抽出された文書群を画面上に表示する文書表示部と表示された文書群に対して、ユーザが訴訟との関連性に基づいて付与した分別符号を受け付ける分別符号受付部と、分別符号に基づいて、抽出された文書群を分別符号ごとに分別し、該分別された文書群において、共通して出現するキーワードを解析し選定する選定部と、選定したキーワードを記録するデータベースと、データベースに記録されたキーワードを文書情報から探索する探索部と、探索部の探索結果と選定部の解析結果を用いて、分別符号と文書との関連性を示すスコアを算出するスコア算出部と、スコアの結果に基づいて自動で分別符号を付与する自動分別部を備える。
102 抽出部
103 文書表示部
104 分別符号受付部
105 選定部
106 探索部
107 スコア算出部
108 自動分別部
109 文書排除部
110 学習部
201 データベース
301 クライアント装置
I1 文書表示画面
Claims (7)
- 訴訟と関係するか否かがユーザによって分別された分別文書に含まれるキーワードの重みづけを学習する学習部と、
前記訴訟と関係するか否かが前記ユーザによって未だ分別されていない未分別文書から、前記分別文書に含まれるキーワードを探索する探索部と、
前記探索部によって探索されたキーワード、および前記学習部によって学習された当該キーワードの重みづけを用いて、前記未分別文書と分別符号との結びつきの強さを評価したスコアを算出するスコア算出部とを備えた文書分別システム。 - 前記スコア算出部によって算出されたスコアに基づいて、前記未分別文書に前記分別符号を付与する自動分別部をさらに備えたことを特徴とする請求項1に記載の文書分別システム。
- 所定数の文書を含む文書群を、前記ユーザによる分別対象として抽出する抽出部と、
前記抽出部によって抽出された文書群に含まれる文書に対して、前記訴訟との関連性に基づいて、前記ユーザにより付与された前記分別符号をそれぞれ受け付ける分別符号受付部をさらに備え、
前記学習部は、前記分別符号受付部によって受け付けられた分別符号を、前記分別文書が前記訴訟と関連するか否かがユーザによって分別された結果として用いることによって、当該分別文書に含まれるキーワードの重みづけを学習することを特徴とする請求項1または2に記載の文書分別システム。 - 前記抽出部によって抽出された文書群を、前記分別符号受付部によって受け付けられた分別符号ごとに分別し、当該分別された文書群に共通して含まれるキーワードを選定する選定部をさらに備え、
前記学習部は、前記選定部によって選定されたキーワードの重みづけを学習することを特徴とする請求項1から3のいずれか一項に記載の文書分別システム。 - 前記選定部によって選定されたキーワードを記録するデータベースをさらに備えたことを特徴とする請求項1から4のいずれか一項に記載の文書分別システム。
- 訴訟と関係するか否かがユーザによって分別された分別文書に含まれるキーワードの重みづけを学習する学習ステップと、
前記訴訟と関係するか否かが前記ユーザによって未だ分別されていない未分別文書から、前記分別文書に含まれるキーワードを探索する探索ステップと、
前記探索ステップにおいて探索したキーワード、および前記学習ステップにおいて学習した当該キーワードの重みづけを用いて、前記未分別文書と分別符号との結びつきの強さを評価したスコアを算出するスコア算出ステップとを含む文書分別システムの制御方法。 - コンピュータに、
訴訟と関係するか否かがユーザによって分別された分別文書に含まれるキーワードの重みづけを学習する学習機能と、
前記訴訟と関係するか否かが前記ユーザによって未だ分別されていない未分別文書から、前記分別文書に含まれるキーワードを探索する探索機能と、
前記探索機能によって探索されたキーワード、および前記学習機能によって学習された当該キーワードの重みづけを用いて、前記未分別文書と分別符号との結びつきの強さを評価したスコアを算出するスコア算出機能とを実現させる文書分別システムの制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014124951A JP5746403B2 (ja) | 2014-06-18 | 2014-06-18 | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014124951A JP5746403B2 (ja) | 2014-06-18 | 2014-06-18 | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012044382A Division JP5567049B2 (ja) | 2012-02-29 | 2012-02-29 | 文書分別システム及び文書分別方法並びに文書分別プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015095261A Division JP2015172952A (ja) | 2015-05-07 | 2015-05-07 | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014167835A true JP2014167835A (ja) | 2014-09-11 |
JP5746403B2 JP5746403B2 (ja) | 2015-07-08 |
Family
ID=51617443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014124951A Expired - Fee Related JP5746403B2 (ja) | 2014-06-18 | 2014-06-18 | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5746403B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250916A (ja) * | 1999-02-25 | 2000-09-14 | Sumitomo Metal Ind Ltd | 文書分類方法及び装置並びに記録媒体 |
JP2003036261A (ja) * | 2001-07-26 | 2003-02-07 | Kyodo News Service | 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体 |
JP2007334388A (ja) * | 2006-06-12 | 2007-12-27 | Nippon Telegr & Teleph Corp <Ntt> | クラスタリング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
JP2011170786A (ja) * | 2010-02-22 | 2011-09-01 | Nomura Research Institute Ltd | 文書分類システムおよび文書分類プログラムならびに文書分類方法 |
-
2014
- 2014-06-18 JP JP2014124951A patent/JP5746403B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250916A (ja) * | 1999-02-25 | 2000-09-14 | Sumitomo Metal Ind Ltd | 文書分類方法及び装置並びに記録媒体 |
JP2003036261A (ja) * | 2001-07-26 | 2003-02-07 | Kyodo News Service | 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体 |
JP2007334388A (ja) * | 2006-06-12 | 2007-12-27 | Nippon Telegr & Teleph Corp <Ntt> | クラスタリング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
JP2011170786A (ja) * | 2010-02-22 | 2011-09-01 | Nomura Research Institute Ltd | 文書分類システムおよび文書分類プログラムならびに文書分類方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5746403B2 (ja) | 2015-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5567049B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5603468B1 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5530476B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5827208B2 (ja) | 文書管理システムおよび文書管理方法並びに文書管理プログラム | |
JP5823943B2 (ja) | フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム | |
JP5823942B2 (ja) | フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム | |
JP5986687B2 (ja) | データ分別システム、データ分別方法、データ分別のためのプログラム、及び、このプログラムの記録媒体 | |
WO2015118616A1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP5592552B1 (ja) | 文書分別調査システム及び文書分別調査方法並びに文書分別調査プログラム | |
WO2015025978A1 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP2015172952A (ja) | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム | |
JP5685675B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5898371B2 (ja) | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム | |
JP5746403B2 (ja) | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム | |
JP5850973B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5745676B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP2016012365A (ja) | フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140711 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20140711 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20140808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140826 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150120 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5746403 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |