JP6490989B2 - データ分析システム、データ分析方法、およびデータ分析プログラム - Google Patents
データ分析システム、データ分析方法、およびデータ分析プログラム Download PDFInfo
- Publication number
- JP6490989B2 JP6490989B2 JP2015039275A JP2015039275A JP6490989B2 JP 6490989 B2 JP6490989 B2 JP 6490989B2 JP 2015039275 A JP2015039275 A JP 2015039275A JP 2015039275 A JP2015039275 A JP 2015039275A JP 6490989 B2 JP6490989 B2 JP 6490989B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- weighting
- unit
- data element
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、前記所定の係数は、前記データに含まれるデータ要素の個数の逆数であることとしてもよい。
また、前記所定の係数は、前記第1データ要素と前記第2データ要素との間の距離に応じた係数であることとしてもよい。
本発明に係るデータ分析システムの一実施態様について、図面を参照しながら説明する。
<概要>
以下、データ分析システムの詳細について説明する。
図1は、データ分析システム100の機能構成を示すブロック図である。
図1に示すように、データ分析システム100は、通信部110と、入力部120と、制御部130と、記憶部140と、表示部150とを含む。
分類情報受付部133は、所定の事案に対する分類情報を、入力部120から受け付ける。
要素評価部136は、第1重み付け部161と、第2重み付け部162とを含む。
第1重み付け部161は、各データ要素の重みの初期値を算出する。以下、その手法を説明する。
第1重み付け部161は、データ要素の重み値wgtについて、例えば、以下の式(1)を用いて算出する。
例えば、第2重み付け部162は、以下の式(2)を用いて、第2重み付け値wi Bを算出することができる。
評価格納部137は、要素評価部136から伝達された各データ要素とその第2重み付け値を対応付けて記憶部140に格納する機能を有する。
<動作>
図2は、データ分析システム100の、分類データを分析し、データ要素の評価を算出する際の動作を示すフローチャートである。
要素抽出部135は、分類データ(例えば、訴訟関連文書、ユーザがアクセスしたウェブページなど)からデータ要素を抽出する(ステップS204)。
評価格納部137は、伝達された第2重み付け値と対応するデータ要素を示す情報とを対応付けて記憶部140に格納する(ステップS207)。
図3は、データ分析システム100の未分類データのスコアを算出する際の動作を示すフローチャートである。
図3に示すように、データ分析システム100の未分類データ評価部138は、データ抽出部132から未分類データを受け付ける(ステップS301)。
<まとめ>
<変形例>
他の式としては、例えば、下記式(4)を用いることとしてもよい。
式(6)を用いることにより、キーワード間の相関関係を考慮したスコアを算出できるため、より高い精度で未分類データのスコアを算出することができる。
上記式(7)におけるTFnormは、以下の式(8)のように算出することができる。
以上のように、データ分析システム100は、データの一部に含まれる意味(例えば、センテンスの文意)を反映したスコアリングを実行できるので、より高い精度で未分類データのスコアを提示することができる。
この場合には、キーワードとして、予め、形容詞や形容動詞を指定しておくとよい。
当該評価方法についての一具体例を説明する。
提示部139は、このようにして算出された感情スコアを、未分類データのスコアとして提示してもよい。
(7)上記実施の形態においては、文書情報(テキスト)を分析する例を説明したが、上述したように、音声や画像、映像に対する分析を行ってもよい。
例えば、音声の場合であれば、音声そのものを分析の対象としてもよいし、音声認識により音声を文書に変換したうえでの分析を実行してもよい。
例えば、ディスカバリー支援システム、フォレンジックシステム、メール監査システム、インターネット応用システム、知財調査システム、医療応用システム、実績評価システム(プロジェクト評価システム)、ドライビング支援システム、ポータルサイト運営システム、取引管理システム、コールセンターエスカレーションシステム、マーケティングシステムなど、少なくとも一部において、構造定義が不完全なデータ(非構造化データ、例えば、自然言語を含む文書データ)を扱う任意のシステムに適用できる。
(11)上記実施の形態および各種変形例に示す構成を適宜組み合わせることとしてもよい。
<補足>
ここに本発明に係るデータ分析システムの一実施態様とその効果について述べる。
(c)上記(b)に係るデータ分析システムにおいて、前記所定の係数は、前記データに含まれるデータ要素の個数の逆数であることとしてもよい。
これにより、データ中のデータ要素の重要度の濃淡に応じて、第2重み付け値を算出することができる。
これにより、データ要素の第2重み付け値を算出するにあたって、データ要素間の距離を考慮して、実行することができる。
これにより、
これにより、従来からある計算手法を用いて、他のデータ要素の第1重み付け値を用いて、第2重み付け値を算出することができる。
110 通信部
120 入力部
130 制御部
131 収集部(取得部)
132 データ抽出部
133 分類情報受付部
134 データ分類部
135 要素抽出部
136 要素評価部
137 評価格納部
138 未分類データ評価部(評価部)
139 提示部
140 記憶部
150 表示部
161 第1重み付け部
162 第2重み付け部
Claims (10)
- データを取得する取得部と、
前記取得したデータから複数のデータ要素を抽出する抽出部と、
前記複数のデータ要素各々に重み付け値を算出する第1重み付け部と、
前記複数のデータ要素のうちの一つである第1データ要素に対して算出された重み付け値に対して、前記複数のデータ要素のうちの他の一つである第2データ要素に対して算出された重み付け値を反映させるように前記第1データ要素に対して算出された重み付け値を更新する第2重み付け部と、
前記更新された重み付け値を前記第1データ要素に対応付けて、前記第1データ要素の重み付け値として、記憶する記憶部とを備えるデータ分析システム。 - 前記第2重み付け部は、前記第1重み付け部により前記第1データ要素に対して算出された重み付け値に対して、前記第1重み付け部により前記第2データ要素に対して算出された重み付け値に所定の係数を乗じた値を加算して、前記第1データ要素に対して算出された重み付け値を更新する
ことを特徴とする請求項1に記載のデータ分析システム。 - 前記所定の係数は、前記データに含まれるデータ要素の個数の逆数である
ことを特徴とする請求項2に記載のデータ分析システム。 - 前記所定の係数は、前記第1データ要素と前記第2データ要素との間の距離に応じた係数である
ことを特徴とする請求項2または3に記載のデータ分析システム。 - 前記第2重み付け部は、前記第1データ要素と前記第2データ要素が所定範囲内に存在する場合にのみ、前記第1重み付け部により前記第1データ要素に対して算出された重み付け値と前記第1重み付け部により前記第2データ要素に対して算出された重み付け値を用いて、前記第1データ要素の前記重み付け値を更新する
ことを特徴とする請求項2〜4のいずれか一項に記載のデータ分析システム。 - 前記第2重み付け部は、前記第1重み付け部により前記第1データ要素に対して算出された重み付け値が前記第1重み付け部により前記第2データ要素に対して算出された重み付け値よりも大きい場合にのみ、前記第2データ要素に対して算出された重み付け値を用いて、前記第1データ要素の前記重み付け値を更新する
ことを特徴とする請求項2〜5のいずれか一項に記載のデータ分析システム。 - 前記第2重み付け部は、前記第1データ要素に対する重み付け値を、前記データ中において、所定範囲内に含まれる複数のデータ要素各々の重み付け値の畳み込み積分により算出する
ことを特徴とする請求項2〜4のいずれか一項に記載のデータ分析システム。 - 前記取得部は、前記データとは異なるデータを取得し、
前記データ分析システムは、さらに、
前記異なるデータを、当該異なるデータに含まれるデータ要素を抽出し、前記記憶部において抽出したデータ要素に対応付けられている重み付け値を用いて、評価する評価部を備える
ことを特徴とする請求項2〜7のいずれか1項に記載のデータ分析システム。 - データを取得する取得ステップと、
前記取得したデータから複数のデータ要素を抽出する抽出ステップと、
前記複数のデータ要素各々に重み付け値を算出する第1重み付けステップと、
前記複数のデータ要素のうちの一つである第1データ要素に対して算出された重み付け値に対して、前記複数のデータ要素のうちの他の一つである第2データ要素に対して算出された重み付け値を反映させるように前記第1データ要素に対して算出された重み付け値を更新する第2重み付けステップと、
前記更新された重み付け値を前記第1データ要素に対応付けて、前記第1データ要素の重み付け値として、記憶部に記憶する記憶ステップとを含む、コンピュータが実行するデータ分析方法。 - コンピュータに、
データを取得する取得機能と、
前記取得したデータから複数のデータ要素を抽出する抽出機能と、
前記複数のデータ要素各々に重み付け値を算出する第1重み付け機能と、
前記複数のデータ要素のうちの一つである第1データ要素に対して算出された重み付け値に対して、前記複数のデータ要素のうちの他の一つである第2データ要素に対して算出された重み付け値を反映させるように前記第1データ要素に対して算出された重み付け値を更新する第2重み付け機能と、
前記更新された重み付け値を前記第1データ要素に対応付けて、前記第1データ要素の重み付け値として、記憶部に記憶する記憶機能とを実現させるデータ分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015039275A JP6490989B2 (ja) | 2015-02-27 | 2015-02-27 | データ分析システム、データ分析方法、およびデータ分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015039275A JP6490989B2 (ja) | 2015-02-27 | 2015-02-27 | データ分析システム、データ分析方法、およびデータ分析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016162114A JP2016162114A (ja) | 2016-09-05 |
JP6490989B2 true JP6490989B2 (ja) | 2019-03-27 |
Family
ID=56845087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015039275A Expired - Fee Related JP6490989B2 (ja) | 2015-02-27 | 2015-02-27 | データ分析システム、データ分析方法、およびデータ分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6490989B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6509391B1 (ja) * | 2018-01-31 | 2019-05-08 | 株式会社Fronteo | 計算機システム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001256253A (ja) * | 2000-03-13 | 2001-09-21 | Kddi Corp | 文書フィルタリング方法および装置 |
JP4989308B2 (ja) * | 2007-05-16 | 2012-08-01 | キヤノン株式会社 | 画像処理装置及び画像検索方法 |
JP5072651B2 (ja) * | 2008-02-29 | 2012-11-14 | 三菱電機株式会社 | 重要語句抽出装置 |
-
2015
- 2015-02-27 JP JP2015039275A patent/JP6490989B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016162114A (ja) | 2016-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230297890A1 (en) | Customizable machine learning models | |
JP6301966B2 (ja) | データ分析システム、データ分析方法、データ分析のためのプログラム、及び、このプログラムの記録媒体 | |
Keuleers et al. | Megastudies, crowdsourcing, and large datasets in psycholinguistics: An overview of recent developments | |
US8306962B1 (en) | Generating targeted paid search campaigns | |
JP2022065108A (ja) | 電子記録の文脈検索のためのシステム及び方法 | |
US8977586B2 (en) | System and method for prioritizing resumes based on a job description | |
US10565265B2 (en) | Accounting for positional bias in a document retrieval system using machine learning | |
US11817081B2 (en) | Learning device, learning method, learning program, retrieval device, retrieval method, and retrieval program | |
US9348901B2 (en) | System and method for rule based classification of a text fragment | |
CN107958014B (zh) | 搜索引擎 | |
US20170046748A1 (en) | Method and system for personifying a brand | |
CN109344246B (zh) | 一种电子问卷生成方法、计算机可读存储介质及终端设备 | |
US10692498B2 (en) | Question urgency in QA system with visual representation in three dimensional space | |
JP5942052B1 (ja) | データ分析システム、データ分析方法、およびデータ分析プログラム | |
US11830478B2 (en) | Learning device, learning method, and learning program for images and sound which uses a similarity matrix | |
JP5905652B1 (ja) | データ評価システム、データ評価方法、およびデータ評価プログラム | |
Field et al. | Assessing the value of removing earthquake-hazard-related epistemic uncertainties, exemplified using average annual loss in California | |
JP6490989B2 (ja) | データ分析システム、データ分析方法、およびデータ分析プログラム | |
WO2021035955A1 (zh) | 文本新闻的处理方法、设备和存储介质 | |
JP6178480B1 (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
JP2006286026A (ja) | 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム | |
JP6509391B1 (ja) | 計算機システム | |
Elyasir et al. | Opinion mining framework in the education domain | |
KR102422844B1 (ko) | 인공지능에 기반하여 영상 컨텐츠의 언어 위기를 관리하는 방법 | |
US11907643B2 (en) | Dynamic persona-based document navigation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20160608 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160615 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190131 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6490989 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
LAPS | Cancellation because of no payment of annual fees |