JP2016162116A - データ分析システム、データ分析方法、およびデータ分析プログラム - Google Patents
データ分析システム、データ分析方法、およびデータ分析プログラム Download PDFInfo
- Publication number
- JP2016162116A JP2016162116A JP2015039278A JP2015039278A JP2016162116A JP 2016162116 A JP2016162116 A JP 2016162116A JP 2015039278 A JP2015039278 A JP 2015039278A JP 2015039278 A JP2015039278 A JP 2015039278A JP 2016162116 A JP2016162116 A JP 2016162116A
- Authority
- JP
- Japan
- Prior art keywords
- data
- data element
- frequency
- unit
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明に係るデータ分析システムは、データから、当該データの一部であるデータ要素を抽出するデータ分析システムであって、前記データを受け付ける受付部と、前記受付部により受け付けたデータから、データ要素を抽出する抽出部と、前記抽出部により抽出されたデータ要素である第1データ要素と第2データ要素とが前記データに共起する頻度に応じて、当該第1データ要素と当該第2データ要素とを一つのデータ要素として扱うべきか否かを判定するための指標を算出する算出部と、前記指標を提示する提示部とを備える。
【選択図】図1
Description
そして、例えば、特許文献2には、事前に与えられた基準に従って、文字列を高精度に分割する技術が開示されている。
これにより、データ分析システムは、データ要素とデータ要素とを結合すべきか否かの指標を算出することができる。
<実施の形態>
<構成>
図1は、データ分析システム100の機能構成を示すブロック図である。
図1に示すように、データ分析システム100は、受付部110と、表示部120と、入力部130と、記憶部140と、制御部150とを含む。
制御部150は、データ要素抽出部151と、指標算出部152と、提示部153と、結合部154とを含む。
結合部154は、入力部130から伝達された第1データ要素と第2データ要素とを結合して、記憶部140に記憶する機能を有する。
図2は、データ分析システム100の提示部153が提示する結果情報200の一例を示すデータ概念図である。結果情報200は、データ要素とデータ要素とを結合して一つのデータ要素として扱うべきか否かの指標を提示する情報である。
第1データ要素201は、データ中に出現するデータ要素であって、結合の候補となるデータ要素を示す情報である。
第2データ要素202は、データ中に出現するデータ要素であって、結合の候補であり、第1データ要素201に連続するデータ要素を示す情報である。
結果情報200が提示されることによりデータ分析システム100のユーザは、データ要素を結合すべきか否かを容易に判定することができる。
図3は、データ分析システム100の動作を示すフローチャートである。
図3に示すように、データ分析システム100の受付部110は、分析対象のデータの入力を受け付ける(ステップS301)。受付部110は、受け付けたデータを、データ要素抽出部151に伝達する。
指標算出部152は、伝達されたデータ要素について、他のデータ要素と結合すべきか否かを判定するための指標を算出する。
<変形例>
以下、重み付け部および評価部における処理を簡単に説明する。
上記実施の形態に係るデータ分析システム100は、例えば、ディスカバリー支援システムとして活用することができる。
ディスカバリー支援システムは、受け付けるデータとして、例えば、訴訟関連のメールデータ、書籍などの文書データを受け付け、そこから必要な関連データを検索するにあたって、データからデータ要素として関連する用語を適切に抽出することができる。
フォレンジックシステムは、受け付けるデータとして、例えば、容疑者がやり取りしている電子メールを受け付け、犯罪に関わりがある可能性が高い電子メールを選定し、犯罪捜査に役立てることができる。その際に、電子メールを評価するために、電子メールからデータ要素を抽出する際に活用することができる。
メール監査システムにおいても、ディスカバリー支援システムやフォレンジックシステムと同様に電子メールからデータ要素を適切に抽出することに活用することができる。
インターネット応用システムとしては、インターネット上に公開されている各種の記事を分析する際に、適切にデータ要素を抽出するシステムとして活用することができる。
知財調査システムとしては、例えば、特許文献の内容分析を行うにあたって、適切にデータ要素を抽出するシステムとして活用することができる。
医療応用システムとしては、例えば、データとして、診療情報(カルテ)を受け付けて、患者の状態分析を行うにあたって、データ要素を抽出するシステムとして活用することができる。
また、データ分析システム100は、その他にも、例えば、実績評価システム、ドライビング支援システム、プロジェクト評価システム、ポータルサイト運営システム、取引管理システム、コールセンターエスカレーションシステム、マーケティングシステムなど、任意のシステムに活用することができる。すなわち、データ分析システム100は、データを受け付け、当該データからデータ要素を抽出し、第1データ要素と第2データ要素とが当該データに共起する頻度に応じて、当該第1データ要素と当該第2データ要素とを一つのデータ要素として扱うべきか否かを判定するための指標を算出し、当該指標を提示するシステムに広く用いることができる。
(8)上記実施の形態および各種変形例に示す構成を適宜組み合わせることとしてもよい。
ここに本発明に係るデータ分析システムの一実施態様とその効果について述べる。
(a)本発明に係るデータ分析システムは、データから、当該データの一部であるデータ要素を抽出するデータ分析システムであって、前記データを受け付ける受付部(110)と、前記受付部により受け付けたデータから、データ要素を抽出する抽出部(151)と、前記抽出部により抽出されたデータ要素である第1データ要素と第2データ要素とが前記データに共起する頻度に応じて、当該第1データ要素と当該第2データ要素とを一つのデータ要素として扱うべきか否かを判定するための指標を算出する算出部(152)と、前記指標を提示する提示部(153)とを備える。
これにより、第1データ要素と第2データ要素との各々が出現する頻度と、双方が共起する頻度に応じて指標を算出することができる。
これにより、データ分析システムは、指標を算出することができる。
これにより、データ分析システムは、ユーザの手によらずに、データ要素を結合すべきか否かを判断することができる。
これにより、データ分析システムは、データ要素同士を結合させることができる。
110 受付部
120 表示部
130 入力部
140 記憶部
150 制御部
151 データ要素抽出部
152 指標算出部
153 提示部
154 結合部
Claims (7)
- データから、当該データの一部であるデータ要素を抽出するデータ分析システムであって、
前記データを受け付ける受付部と、
前記受付部により受け付けたデータから、データ要素を抽出する抽出部と、
前記抽出部により抽出されたデータ要素である第1データ要素と第2データ要素とが前記データに共起する頻度に応じて、当該第1データ要素と当該第2データ要素とを一つのデータ要素として扱うべきか否かを判定するための指標を算出する算出部と、
前記指標を提示する提示部とを備えるデータ分析システム。 - 前記算出部は、更に、
前記第1データ要素が前記データに出現する第1頻度と、前記第2データ要素が前記データに出現する第2頻度と、前記第1データ要素と前記第2データ要素とが前記データに共起する第3頻度とに基づいて、前記指標を算出する
ことを特徴とする請求項1に記載のデータ分析システム。 - 前記第3頻度は、前記第1データ要素と前記第2データ要素とが連続して前記データに出現した頻度であり、
前記算出部は、前記第3頻度を、前記第1頻度と前記第2頻度とを合算した値から前記第3頻度を減算した値で除した値を前記指標として算出する
ことを特徴とする請求項2に記載のデータ分析システム。 - 前記データ分析システムは、さらに、
前記指標に基づいて、前記第1データ要素と前記第2データ要素とを結合すべきか否かを判定する判定部を備える
ことを特徴とする請求項1〜3のいずれか一項に記載のデータ分析システム。 - 前記判定部は、前記指標が、所定の基準を満たしている場合に、前記第1データ要素と前記第2データ要素とを結合すべきであると判定する
ことを特徴とする請求項4に記載のデータ分析システム。 - データを受け付ける受付ステップと、
前記受付ステップにおいて受け付けたデータから、データ要素を抽出する抽出ステップと、
前記抽出ステップにおいて抽出されたデータ要素である第1データ要素と第2データ要素とが前記データに共起する頻度に応じて、当該第1データ要素と当該第2データ要素とを一つのデータ要素として扱うべきか否かを判定するための指標を算出する算出ステップと、
前記指標を提示する提示ステップとを含む、コンピュータが実行するデータ分析方法。 - コンピュータに、
データを受け付ける受付機能と、
前記受付機能により受け付けたデータから、データ要素を抽出する抽出機能と、
前記抽出機能により抽出されたデータ要素である第1データ要素と第2データ要素とが前記データに共起する頻度に応じて、当該第1データ要素と当該第2データ要素とを一つのデータ要素として扱うべきか否かを判定するための指標を算出する算出機能と、
前記指標を提示する提示機能とを実現させるデータ分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015039278A JP6190405B2 (ja) | 2015-02-27 | 2015-02-27 | データ分析システム、データ分析方法、およびデータ分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015039278A JP6190405B2 (ja) | 2015-02-27 | 2015-02-27 | データ分析システム、データ分析方法、およびデータ分析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016162116A true JP2016162116A (ja) | 2016-09-05 |
JP6190405B2 JP6190405B2 (ja) | 2017-08-30 |
Family
ID=56845057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015039278A Active JP6190405B2 (ja) | 2015-02-27 | 2015-02-27 | データ分析システム、データ分析方法、およびデータ分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6190405B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829078A (zh) * | 2017-04-27 | 2018-11-16 | 丰田自动车株式会社 | 分析技术呈现系统、方法和程序 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03116374A (ja) * | 1989-09-29 | 1991-05-17 | Ricoh Co Ltd | 専門用語抽出システム |
JP2008217067A (ja) * | 2007-02-28 | 2008-09-18 | Toshiba Corp | 情報提示装置、プログラム及び情報提示方法 |
JP2013174995A (ja) * | 2012-02-24 | 2013-09-05 | Nippon Hoso Kyokai <Nhk> | 基本語彙抽出装置、及びプログラム |
-
2015
- 2015-02-27 JP JP2015039278A patent/JP6190405B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03116374A (ja) * | 1989-09-29 | 1991-05-17 | Ricoh Co Ltd | 専門用語抽出システム |
JP2008217067A (ja) * | 2007-02-28 | 2008-09-18 | Toshiba Corp | 情報提示装置、プログラム及び情報提示方法 |
JP2013174995A (ja) * | 2012-02-24 | 2013-09-05 | Nippon Hoso Kyokai <Nhk> | 基本語彙抽出装置、及びプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829078A (zh) * | 2017-04-27 | 2018-11-16 | 丰田自动车株式会社 | 分析技术呈现系统、方法和程序 |
CN108829078B (zh) * | 2017-04-27 | 2021-03-12 | 丰田自动车株式会社 | 分析技术呈现系统、方法和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6190405B2 (ja) | 2017-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11625406B2 (en) | Website scoring system | |
US10169706B2 (en) | Corpus quality analysis | |
US9558263B2 (en) | Identifying and displaying relationships between candidate answers | |
US9886159B2 (en) | Selecting portions of computer-accessible documents for post-selection processing | |
US11663417B2 (en) | Data processing method, electronic device, and storage medium | |
US9922383B2 (en) | Patent claims analysis system and method | |
US8272064B2 (en) | Automated rule generation for a secure downgrader | |
US20130159848A1 (en) | Dynamic Personal Dictionaries for Enhanced Collaboration | |
US20140129558A1 (en) | Timeline-Based Data Visualization of Social Media Topic | |
JP6301966B2 (ja) | データ分析システム、データ分析方法、データ分析のためのプログラム、及び、このプログラムの記録媒体 | |
US11042689B2 (en) | Generating a document preview | |
US10282467B2 (en) | Mining product aspects from opinion text | |
JPWO2019224891A1 (ja) | 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム | |
US9064009B2 (en) | Attribute cloud | |
US20110202518A1 (en) | Apparatus and Methods for Providing Assistance in Detecting Mistranslation | |
US9208142B2 (en) | Analyzing documents corresponding to demographics | |
Khemani et al. | A review on reddit news headlines with nltk tool | |
JP5942052B1 (ja) | データ分析システム、データ分析方法、およびデータ分析プログラム | |
TW201500939A (zh) | 數位資訊分析系統、數位資訊分析方法、及數位資訊分析程式 | |
JP6190405B2 (ja) | データ分析システム、データ分析方法、およびデータ分析プログラム | |
JP2017097488A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
WO2010132062A1 (en) | System and methods for sentiment analysis | |
US9558269B2 (en) | Extracting and mining of quote data across multiple languages | |
US10163118B2 (en) | Method and apparatus for associating user engagement data received from a user with portions of a webpage visited by the user | |
JP4550939B1 (ja) | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20160602 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160615 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160712 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170712 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170804 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6190405 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |