JP5723067B1 - データ分析システム、データ分析方法、および、データ分析プログラム - Google Patents
データ分析システム、データ分析方法、および、データ分析プログラム Download PDFInfo
- Publication number
- JP5723067B1 JP5723067B1 JP2014511637A JP2014511637A JP5723067B1 JP 5723067 B1 JP5723067 B1 JP 5723067B1 JP 2014511637 A JP2014511637 A JP 2014511637A JP 2014511637 A JP2014511637 A JP 2014511637A JP 5723067 B1 JP5723067 B1 JP 5723067B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- document
- unit
- word
- classification code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims description 78
- 230000009471 action Effects 0.000 claims abstract description 42
- 238000011156 evaluation Methods 0.000 claims description 176
- 238000004891 communication Methods 0.000 claims description 164
- 238000004458 analytical method Methods 0.000 claims description 139
- 238000011835 investigation Methods 0.000 claims description 12
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 65
- 230000008569 process Effects 0.000 description 51
- 230000010365 information processing Effects 0.000 description 49
- 230000006870 function Effects 0.000 description 41
- 238000004364 calculation method Methods 0.000 description 26
- 239000000284 extract Substances 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 17
- 238000000605 extraction Methods 0.000 description 13
- 239000000463 material Substances 0.000 description 12
- 238000000926 separation method Methods 0.000 description 12
- 238000003012 network analysis Methods 0.000 description 11
- 238000013500 data storage Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000007689 inspection Methods 0.000 description 9
- 238000013519 translation Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000007717 exclusion Effects 0.000 description 5
- 238000005065 mining Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- VXVIICNFYDEOJG-UHFFFAOYSA-N 2-(4-chloro-2-formylphenoxy)acetic acid Chemical compound OC(=O)COC1=CC=C(Cl)C=C1C=O VXVIICNFYDEOJG-UHFFFAOYSA-N 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 101150068765 fcpA gene Proteins 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/30—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
- H04L63/308—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information retaining data, e.g. retaining successful, unsuccessful communication attempts, internet access, or e-mail, internet telephony, intercept related information or call content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Computer Hardware Design (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Security & Cryptography (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
図1〜図3に基づいて、本発明に係る第1の実施形態(実施形態1)を説明する。
データ分析システム5は、所定のコンピュータに記録されたデータを分析するシステムである。上記データ分析システム5は、最初に、外部(所定のコンピュータ)から取得されたデータの内容を分析する。当該分析において、データ分析システム5は、所定の動作を表す第1の単語が上記データに含まれる場合、当該所定の動作の対象を表す第2の単語を特定する。例えば、「仕様を確定する」という文章が上記データに含まれる場合、当該文章から「仕様」および「確定する」という単語を抽出し、「確定する」という所定の動作を表す第1の単語(動詞)の対象である「仕様」という第2の単語(目的語)を特定する。
図1は、実施形態1に係るデータ分析システム5の要部構成の一例を示すブロック図である。データ分析システム5は、所定のコンピュータに記録されたデータを分析するシステムである。図1に示されるように、データ分析システム5は、分析部12(特定部121、関連付与部122)を備える。また、上記データ分析システム5は、評価部16をさらに備えてよい。
図3は、データ分析システム5が備えた分析部12に含まれる、特定部121および関連付与部122が実行する処理の流れを示すフローチャートである。
図4〜図16に基づいて、本発明に係る第2の実施形態(実施形態2)を説明する。なお、以下の説明では、実施形態1から変わり得る機能・構成のみを説明し、その他の機能・構成については実施形態1と同様として詳細な説明を省略する。
図4は、実施形態2に係る文書分別システム3の要部構成の一例を示すブロック図である。文書分別システム(データ分析システム)3は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報に含まれる、複数の文書から構成される文書情報を分析し、訴訟との関連度を示す分別符号を文書に付与することにより、訴訟への利用を容易にするシステムである。
各実施形態に係る文書分別システムの理解を容易とするために、各実施形態に特有な用語について以下に記載する。
実施形態2では、図5に示すようなフローチャートに従い、第1段階〜第5段階で、登録処理、分別処理、及び検査処理を行う。
第1段階におけるキーワードデータベース101の詳細な処理フローを図6を用いて説明する。
第2段階における第1分別部201の詳細な処理フローを、図8を用いて説明する。実施形態2において、第2段階では、第1分別部201によって、分別符号「重要」を文書に付与する処理を行う。
第3段階における第2分別部301の詳細な処理フローを、図9を用いて説明する。実施形態2において、第2分別部301では、第2段階(STEP200)で分別符号を付与しなかった文書情報に対して、「製品A」及び「製品B」という分別符号を付与する処理を行う。
第4段階では、図10に示すように、第3段階までの処理において、分別符号が付与されなかった文書情報から抽出した一定の割合の文書情報に対して、レビュワーからの分別符号の付与を受け付け、当該文書情報に受け付けた分別符号を付与する。次に、図11に示すように、レビュワーから受け付けた分別符号を付与された文書情報を解析し、その解析結果に基づいて、分別符号が付与されていない文書情報に分別符号を付与する。なお、実施形態2においては、該文書情報に対して、第4段階では、例えば、「重要」、「製品A」及び「製品B」という分別符号を付与する処理を行う。第4段階について、更に以下に記載する。
第5段階における品質検査部501の詳細な処理フローを図15を用いて説明する。品質検査部501では、分別符号受付付与部131が、STEP411で受け付けた文書に対して、分別符号受付文書解析部118がSTEP424で解析した傾向情報に基づいて、付与されるべき分別符号を決定する(STEP511)。
文書分別システム3は、キーワードデータベースに記録したキーワードを含む文書を文書情報から抽出し、該抽出した文書に対して、各キーワードが持つキーワード対応情報に基づき特定の分別符号を付与する第1分別部と、第1分別部において特定の分別符号を付与しなかった文書情報から、関連用語データベースに記録した関連用語を含む文書を抽出し、該抽出した文書に含まれる関連用語の評価値及び該関連用語の数に基づいて、スコアを算出し、関連用語を含む文書のうち、該スコアが一定値を超過した文書に対して、スコアおよび関連用語対応情報に基づいて、所定の分別符号を付与する第2分別部を備えることにより、レビュワーの分別作業の労力の削減を図ることができる。
図17〜図23に基づいて、本発明に係る第3の実施形態(実施形態3)を説明する。なお、以下の説明では、実施形態1および実施形態2から変わり得る機能・構成のみを説明し、その他の機能・構成については実施形態1または実施形態2と同様として詳細な説明を省略する。
図17は、実施形態3に係る文書分別システム4の要部構成の一例を示すブロック図である。文書分別システム(データ分析システム)4は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報に含まれる、複数の文書から構成される文書情報を分析し、訴訟との関連度を示す分別符号を文書に付与することにより、訴訟への利用を容易にするシステムである。
実施形態3では、図18に示すようなフローチャートに従い、5つの段階で登録処理、分別処理、及び学習処理を行う。
第1段階におけるキーワードデータベース151と関連用語データベース152の処理フローを、図19を用いて詳細に説明する。キーワードデータベース151と関連用語データベース152で何段階目の処理を行うかを判断し、第1段階の処理を選択する(STEP1:第1段階)。第1段階ではまず、キーワードデータベース151でキーワードの事前登録を行う(STEP2)。このとき登録されるのは、過去の分別処理の結果から、製品Aと関連性が高く、文書中に含まれれば、直ちに「重要」符号を付与すると、判断できるキーワードである。また、同様に過去の分別処理の結果から、製品Aと関連性が高いため「重要」符号が付与された文書群と関連性の高い一般用語を抽出し(STEP3)、関連用語として登録を行う(STEP4)。
第2段階におけるキーワードデータベース151、ワード検索部164及び第1自動分別部251の処理フローを、図19、図20及び図22を用いて、詳細に説明する。
第3段階における関連用語データベース152、ワード検索部164、スコア算出部166及び第2自動分別部351の処理フローを、図19、図20、図21、及び図22を用いて、詳細に説明する。
第4段階におけるキーワードデータベース151と関連用語データベース152、ワード検索部164、スコア算出部166、及び第3自動分別部451の処理フローを、それぞれ図19、図20、図21及び図22を用いて説明する。
第5段階での文書排除部176及び学習部551における処理を、それぞれ以下に説明する。
本発明に係る文書分別システム及び文書分別方法並びに文書分別プログラムは、文書情報から所定数の文書を含むデータセットである文書群を抽出し、抽出された文書群を画面上に表示し、表示された文書群に対して、ユーザが訴訟との関連性に基づいて付与した分別符号を受け付け、該分別符号に基づいて、抽出された文書群を分別符号ごとに分別し、該分別された文書群において、共通して出現するキーワードを解析し選定し、選定したキーワードを記録し、記録されたキーワードを文書情報ら探索し、探索結果と解析結果を用いて、分別符号と文書との関連性を示すスコアを算出し、スコアの結果に基づいて自動で分別符号を付与することにより、レビュワーの分別作業の労力の軽減を図ることができる。
図24〜図27に基づいて、本発明に係る第4の実施形態(実施形態4)を説明する。なお、以下の説明では、実施形態1〜3から変わり得る機能・構成のみを説明し、その他の機能・構成については実施形態1〜3と同様として詳細な説明を省略する。
図24は、実施形態1に係る相関関係表示システム1の要部構成の一例を示すブロック図である。図25は、上記相関関係表示システム1が備えた表示部の表示態様を示す図である。
実施形態1に係る相関関係表示システム1は、複数の情報処理装置2の間で送受信された通信データを取得する通信データ取得部10と、通信データ取得部10が取得した通信データの内容を分析する分析部12(特定部121、関連付与部122)と、分析部12の分析結果を用い、通信データの内容と予め定められた事案との関係性を評価する評価部16と、評価部16の評価結果に基づいて、複数の人物の間の関係性を表示する表示部18とを備える。また、相関関係表示システム1は、通信データ取得部10が取得した通信データの一部に対し、予め定められた事案との関係性を対応づける情報を取得する入力部11と、複数の端末により構築される通信ネットワークにおける複数の主要端末を決定するネットワーク分析部14とを更に備える。
図26は、相関関係表示システム1が実行する処理の流れを示すフローチャートである。まず、通信データ取得部10は、情報処理装置2若しくは複数の情報処理装置2間で送受信される通信データを格納しているサーバから通信データを取得する(ステップ10。以下、「ステップ」を「S」と表す)。通信データ取得部10は、分析部12、ネットワーク分析部14、および評価部16からの働きかけに応じ、分析部12、ネットワーク分析部14、および/または評価部16に取得した通信データを供給する。
図27は、相関関係表示システム1のハードウェア構成の一例を示す。相関関係表示システム1は、CPU1500と、グラフィックコントローラ1520と、RAM(Random Access Memory)、ROM(Read-Only Memory)および/またはフラッシュROMなどのメモリ1530と、データを記憶する記憶装置1540と、記録媒体からデータを読み込み、および/または、記録媒体にデータを書き込む読込/書込み装置1545と、データを入力する入力装置1560と、外部の通信機器とデータを送受信する通信インターフェース1550と、CPU1500とグラフィックコントローラ1520とメモリ1530と記憶装置1540と読込/書込み装置1545と入力装置1560と通信インターフェース1550とを互いに通信可能に接続するチップセット1510とを備える。
相関関係表示システム1によれば、所定のデータから人物の行為に関連する箇所(第1の単語および第2の単語)を抽出し、当該抽出した箇所を上記メタ情報と関連付けることによって、当該人物の行為を分析することができる。例えば、「技術を交流する」という文章が電子メール(データ、通信情報)に含まれており、「技術」(第2の単語)および「交流する」(第1の単語)という単語が抽出された場合、相関関係表示システム1は、上記「技術」および「交流する」と、上記電子メールを送受信した人物の名前(例えば、「人物A」および「人物B」、すなわち、データの属性を示すメタ情報)とを関連付ける。これにより、「人物A」と「人物B」とが、ある「技術」についての「交流」を企図していることが推測できる。
本発明のその他の実施形態を説明する。
相関関係表示システム1、文書分別システム3、文書分別システム4、および、データ分析システム5が備えた各ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。後者の場合、相関関係表示システム1、文書分別システム3、文書分別システム4、および、データ分析システム5は、各機能を実現するソフトウェアであるプログラム(制御プログラム)の命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(又はCPU)で読み取り可能に記録されたROM(Read Only Memory)又は記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(又はCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
以上、本発明の実施形態を説明したが、上記した実施形態は特許請求の範囲に係る発明を限定するものではない。また、実施形態の中で説明した特徴の組合せのすべてが発明の課題を解決するための手段に必須であるとは限らない点に留意すべきである。さらに、上記した実施形態の技術的要素は、単独で適用されてもよいし、プログラム部品とハードウェア部品とのような複数の部分に分割されて適用されてもよい。
複数の端末間で送受信され、複数の人物のそれぞれに対応づけられる通信データを取得する通信データ取得部と、前記通信データ取得部が取得した前記通信データの内容を分析する分析部と、前記分析部の分析結果を用い、前記通信データの内容と予め定められた事案との関係性を評価する評価部と、前記評価部の評価結果に基づいて、前記事案に関連する前記複数の人物の関係性を表示する表示部とを備える相関関係表示システム。
複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報に含まれる、複数の文書から構成される文書情報を分析し、訴訟への利用が容易になるように、訴訟との関連度を示す分別符号を文書に付与する文書分別システムにおいて、該取得されたデジタル情報に含まれる文書情報を保持する文書データ格納部であって、前記文書情報を格納するとともに、特定の分別符号と、該特定の分別符号を付与した文書中に記述されるキーワードと、前記特定の分別符号と前記キーワードとの対応関係を示すキーワード対応情報とを登録するキーワードデータベースと、所定の分別符号と、該所定の分別符号が付与された文書中において出現頻度が高い単語からなる関連用語と、前記所定の分別符号と前記関連用語との対応関係を示す関連用語対応情報とを登録する関連用語データベースとを格納する文書データ格納部と、前記ワード検索部により前記キーワードデータベースに記録したキーワードを検索し、前記キーワードを含む文書を前記文書情報から抽出し、該抽出した文書に対して、前記キーワード対応情報に基づき前記特定の分別符号を自動的に付与する第1自動分別部と、文書と分別符号との結びつきの強さを示すスコアを算出するスコア算出部と、前記文書情報から、前記関連用語データベースに記録した関連用語を含む文書を抽出し、該抽出した文書に含まれる関連用語の評価値及び該関連用語の数に基づいて、スコアを算出し、前記関連用語を含む文書のうち、該スコアが一定値を超過した文書に対して、前記スコアおよび前記関連用語対応情報に基づいて、前記所定の分別符号を自動的に付与する第2自動分別部と、前記文書情報から抽出された分別符号が付与されていない複数の文書に対して、ユーザが前記訴訟との関連性に基づいて付与した分別符号を受け付け、分別符号を付与する分別符号受付付与部と、前記分別符号受付付与部により分別符号を付与された複数の文書を解析する分別符号受付文書解析部と、前記文書情報から抽出された分別符号が付与されていない複数の文書に対して、前記分別符号受付部により分別符号を付与された文書の解析結果に基づいて、分別符号を自動的に付与する第3自動分別部とを備えることを特徴とする文書分別システム。
2 情報処理装置
3 文書分別システム(データ分析システム)
4 文書分別システム(データ分析システム)
5 データ分析システム
10 通信データ取得部
11 入力部
12 分析部
14 ネットワーク分析部
16 評価部
100 データ格納部
101 キーワードデータベース
102 関連用語データベース
112 文書抽出部
114 ワード検索部
116 スコア算出部
118 分別符号受付文書解析部
120 言語判定部
121 特定部
122 関連付与部
124 傾向情報生成部
126 翻訳部
131 分別符号受付付与部
150 データ格納部
151 キーワードデータベース
152 関連用語データベース
162 文書抽出部
164 ワード検索部
166 スコア算出部
168 分別符号受付文書解析部
170 言語判定部
172 翻訳部
174 ワード選定部
176 文書排除部
181 分別符号受付付与部
201 第1自動分別部
251 第1自動分別部
301 第2自動分別部
351 第2自動分別部
401 第3自動分別部
451 第3自動分別部
501 品質検査部
551 学習部
601 表示部
651 表示部
I1 文書表示画面
Claims (8)
- 所定のコンピュータに記録された、所定の動作を表す第1の単語と、前記所定の動作の対象を表す第2の単語を含む通信に用いられる複数のデータを分析するデータ分析システムであって、
前記複数のデータに対して予め定められた事案に関連する関係性の有無に関する分別符号を付与する分別符号付与部と、
前記第1の単語が前記データに含まれる場合、前記第2の単語を特定する特定部と、
前記第1の単語および第2の単語を含むデータに関係する、前記通信の送受信された両人物の属性を示す属性情報と、当該第1の単語および第2の単語とを関連付ける関連付与部と、
前記分別符号の付与された複数のデータに対して、前記関連付与部によって関連付けられた前記属性情報に含まれる両人物における関係性の強さを、形態素解析に基づいて両人物の間の通信に用いられたデータ内のテキストデータを解析し、予め定められた単語の組合せが含まれていると判断した場合にスコアを対応付けて評価することで、予め定められた事案に関連する複数の人物の関係性を評価する評価部と、
前記評価部の結果を表示する表示部とを備えたことを特徴とするデータ分析システム。 - 前記属性情報は、前記データを送信した人物の名前、受信した人物の名前、前記人物を特定可能なアドレス、当該データが送受信された日時、または作成された日時であることを特徴とする請求項1に記載のデータ分析システム。
- 前記評価部は、人物の関係性を前記通信にもちいられる複数のデータのドメイン間のスコアとして算出するものであって、前記表示部は、前記ドメイン間のノードを表示することを特徴とする請求項1または2に記載のデータ分析システム。
- 前記予め定められた事案は、訴訟または不正調査に関係することを示す情報であることを特徴とする請求項3に記載のデータ分析システム。
- 前記評価部は、形態素解析に基づいてデータ内のテキストデータを解析し、予め定められた事案に関係する単語を示すテキストデータを格納する辞書に格納されている複数の単語の組合せが、選択されたデータ内に含まれているか否かを判断することを特徴とする請求項3または4に記載のデータ分析システム。
- 複数の端末間で送受信され、複数の人物のそれぞれに対応付けられる通信情報を、前記データとして取得する通信データ取得部をさらに備えたことを特徴とする請求項1から5のいずれか1項に記載のデータ分析システム。
- 所定のコンピュータに記録された、所定の動作を表す第1の単語と、前記所定の動作の対象を表す第2の単語を含む通信に用いられる複数のデータを分析するデータ分析方法であって、
コンピュータが、
前記複数のデータに対して予め定められた事案に関連する関係性の有無に関する分別符号を付与するステップと、
前記第1の単語が前記データに含まれる場合、前記第2の単語を特定する特定ステップと、
前記第1の単語および第2の単語を含むデータに関係する、前記通信の送受信された両人物の属性を示す属性情報と、当該第1の単語および第2の単語とを関連付ける関連付与ステップと、
前記分別符号の付与された複数のデータに対して、前記関連付けられた前記属性情報に含まれる両人物における関係性の強さを、形態素解析に基づいて両人物の間の通信に用いられたデータ内のテキストデータを解析し、予め定められた単語の組合せが含まれていると判断した場合にスコアを対応付けて評価するステップと、
前記評価された結果を表示する表示ステップとを実行することを特徴とするデータ分析方法。 - 所定のコンピュータに記録された、所定の動作を表す第1の単語と、前記所定の動作の対象を表す第2の単語を含む通信に用いられる複数のデータを分析するデータ分析プログラムであって、コンピュータに、
前記複数のデータに対して予め定められた事案に関連する関係性の有無に関する分別符号を付与する分別符号付与機能と、
前記第1の単語が前記データに含まれる場合、前記第2の単語を特定させる特定機能と、
前記第1の単語および第2の単語を含むデータに関係する、前記通信の送受信された両人物の属性を示す属性情報と、当該第1の単語および第2の単語とを関連付けさせる関連付与機能と、
前記分別符号の付与された複数のデータに対して、前記関連付けられた前記属性情報に含まれる両人物における関係性の強さを、形態素解析に基づいて両人物の間の通信に用いられたデータ内のテキストデータを解析し、予め定められた単語の組合せが含まれていると判断した場合にスコアを対応付けて評価する評価機能と、
前記評価された結果を表示する表示する表示機能とを実現させることを特徴とするデータ分析プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/052579 WO2015118617A1 (ja) | 2014-02-04 | 2014-02-04 | データ分析システム、データ分析方法、および、データ分析プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015064440A Division JP6124936B2 (ja) | 2015-03-26 | 2015-03-26 | データ分析システム、データ分析方法、および、データ分析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5723067B1 true JP5723067B1 (ja) | 2015-05-27 |
JPWO2015118617A1 JPWO2015118617A1 (ja) | 2017-03-23 |
Family
ID=53277934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014511637A Active JP5723067B1 (ja) | 2014-02-04 | 2014-02-04 | データ分析システム、データ分析方法、および、データ分析プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20170011480A1 (ja) |
JP (1) | JP5723067B1 (ja) |
TW (1) | TW201545104A (ja) |
WO (1) | WO2015118617A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10430454B2 (en) * | 2014-12-23 | 2019-10-01 | Veritas Technologies Llc | Systems and methods for culling search results in electronic discovery |
JP6525624B2 (ja) * | 2015-02-09 | 2019-06-05 | キヤノン株式会社 | 文書管理システム、文書登録装置、文書登録方法 |
DE102016101428A1 (de) * | 2016-01-27 | 2017-07-27 | Rolls-Royce Deutschland Ltd & Co Kg | Nasenkonus für einen Fan eines Flugtriebwerks |
JP7192507B2 (ja) * | 2019-01-09 | 2022-12-20 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
US11573983B2 (en) * | 2020-07-02 | 2023-02-07 | International Business Machines Corporation | Data classification |
US11281858B1 (en) * | 2021-07-13 | 2022-03-22 | Exceed AI Ltd | Systems and methods for data classification |
TWI811179B (zh) * | 2023-02-09 | 2023-08-01 | 國立中山大學 | 提供文字探勘工作流程編輯的方法與系統 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612451A (ja) * | 1992-06-29 | 1994-01-21 | Hitachi Ltd | 例文検索システム |
JP2010146217A (ja) * | 2008-12-17 | 2010-07-01 | Canon It Solutions Inc | 情報処理装置、その制御方法及びプログラム |
WO2011001584A1 (ja) * | 2009-06-29 | 2011-01-06 | 日本電気株式会社 | 情報分類装置、情報分類方法及び情報分類プログラム |
JP2013008335A (ja) * | 2011-06-27 | 2013-01-10 | Yahoo Japan Corp | 関係性作成装置及び方法 |
JP2013214152A (ja) * | 2012-03-30 | 2013-10-17 | Ubic:Kk | 文書分別システム及び文書分別方法並びに文書分別プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050154690A1 (en) * | 2002-02-04 | 2005-07-14 | Celestar Lexico-Sciences, Inc | Document knowledge management apparatus and method |
JP4082059B2 (ja) * | 2002-03-29 | 2008-04-30 | ソニー株式会社 | 情報処理装置および方法、記録媒体、並びにプログラム |
US8312023B2 (en) * | 2007-12-21 | 2012-11-13 | Georgetown University | Automated forensic document signatures |
JP4868191B2 (ja) * | 2010-03-29 | 2012-02-01 | 株式会社Ubic | フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム |
JP4995950B2 (ja) * | 2010-07-28 | 2012-08-08 | 株式会社Ubic | フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム |
US8316030B2 (en) * | 2010-11-05 | 2012-11-20 | Nextgen Datacom, Inc. | Method and system for document classification or search using discrete words |
US9400778B2 (en) * | 2011-02-01 | 2016-07-26 | Accenture Global Services Limited | System for identifying textual relationships |
-
2014
- 2014-02-04 US US15/116,211 patent/US20170011480A1/en not_active Abandoned
- 2014-02-04 JP JP2014511637A patent/JP5723067B1/ja active Active
- 2014-02-04 WO PCT/JP2014/052579 patent/WO2015118617A1/ja active Application Filing
-
2015
- 2015-02-04 TW TW104103851A patent/TW201545104A/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612451A (ja) * | 1992-06-29 | 1994-01-21 | Hitachi Ltd | 例文検索システム |
JP2010146217A (ja) * | 2008-12-17 | 2010-07-01 | Canon It Solutions Inc | 情報処理装置、その制御方法及びプログラム |
WO2011001584A1 (ja) * | 2009-06-29 | 2011-01-06 | 日本電気株式会社 | 情報分類装置、情報分類方法及び情報分類プログラム |
JP2013008335A (ja) * | 2011-06-27 | 2013-01-10 | Yahoo Japan Corp | 関係性作成装置及び方法 |
JP2013214152A (ja) * | 2012-03-30 | 2013-10-17 | Ubic:Kk | 文書分別システム及び文書分別方法並びに文書分別プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20170011480A1 (en) | 2017-01-12 |
WO2015118617A1 (ja) | 2015-08-13 |
TW201545104A (zh) | 2015-12-01 |
JPWO2015118617A1 (ja) | 2017-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5723067B1 (ja) | データ分析システム、データ分析方法、および、データ分析プログラム | |
JP5530476B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5567049B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5603468B1 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5627820B1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
JP5986687B2 (ja) | データ分別システム、データ分別方法、データ分別のためのプログラム、及び、このプログラムの記録媒体 | |
JP5683749B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP5622969B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP6124936B2 (ja) | データ分析システム、データ分析方法、および、データ分析プログラム | |
WO2015118619A1 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
WO2015025978A1 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5685675B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP5745676B1 (ja) | 文書分析システム、文書分析方法、および、文書分析プログラム | |
JP5850973B2 (ja) | 文書分別システム及び文書分別方法並びに文書分別プログラム | |
JP2015172952A (ja) | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム | |
JP5898371B2 (ja) | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム | |
JP5829768B2 (ja) | 電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム | |
JP6441930B2 (ja) | データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム | |
JP5851007B2 (ja) | 文書分析システム及び文書分析方法並びに文書分析プログラム | |
JP5746403B2 (ja) | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150317 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150326 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5723067 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |