JP2017152042A - グラフ理論を用いた解析方法、解析プログラムおよび解析システム - Google Patents
グラフ理論を用いた解析方法、解析プログラムおよび解析システム Download PDFInfo
- Publication number
- JP2017152042A JP2017152042A JP2017093522A JP2017093522A JP2017152042A JP 2017152042 A JP2017152042 A JP 2017152042A JP 2017093522 A JP2017093522 A JP 2017093522A JP 2017093522 A JP2017093522 A JP 2017093522A JP 2017152042 A JP2017152042 A JP 2017152042A
- Authority
- JP
- Japan
- Prior art keywords
- data
- graph
- relationship
- vector
- vectorized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2323—Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Discrete Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】グラフ理論を用いた解析方法は、収集した学習用データに基づき辞書を生成するステップS104と、収集した評価用データに基づき従来型のグラフデータを作成するステップS112と。辞書に格納されたベクトルデータを参照し、ノード間の予測した関係をベクトル化するステップS116と、関係ベクトルを作成済みの従来型のグラフに割り当て、N次元のベクトル化グラフデータを生成するステップS118と、を含む。
【選択図】図14
Description
110:学習用データ
120:評価用データ
130:ベクトル化モジュール
140:ベクトル化グラフデータ
150:ベクトル化グラフモジュール
160:グラフ変換モジュール
170:グラフデータ
180:グラフ解析モジュール
Claims (14)
- ノード間の関連性を表すグラフ理論を用いた解析方法であって、
辞書データに基づきノード間の関連性を表すN次元のベクトルを算出するステップと、
算出されたN次元のベクトルによりベクトル化されたグラフデータを作成するステップと、を含む解析方法。 - 前記算出するステップは、テキストデータから単語を抽出し、単語間の意味的な類似度を表すN次元のベクトルを算出する、請求項1に記載の解析方法。
- 前記辞書データは、単語間の類似度を表すベクトルデータを含む、請求項1または2に記載の解析方法。
- 前記算出するステップは、学習用データをword2vecにより処理することで単語間の類似度を表すベクトルデータを生成することを含む、請求項1ないいし3いずれか1つに記載の解析方法。
- 前記算出するステップは、解析対象のデータからノード間の関係を予測し、前記辞書データを参照して予測した関係をベクトル化する、請求項1ないし4いずれか1つに記載の解析方法。
- 前記算出するステップは、解析対象のデータを形態素解析し、解析された単語の平均ベクトルに基づきノード間の関係を予測する、請求項5に記載の解析方法。
- 解析方法はさらに、ベクトル化されたグラフデータを他のグラフデータに変換するステップを含む、請求項1ないし6いずれか1つに記載の解析方法。
- 前記変換するステップは、ベクトル化されたグラフデータのベクトルの内積を計算することで重み付けされたグラフデータに変換することを含む、請求項6に記載の解析方法。
- 解析方法はさらに、ベクトル化されたグラフデータに基づきノード間の関連性を解析するステップを含む、請求項1ないし8いずれか1つに記載の解析方法。
- 前記解析するステップは、人間関係を解析する、請求項9に記載の解析方法。
- 前記解析するステップは、ベクトル化されたグラフデータに基づきノード間の全ベクトルの平均ベクトルを計算し、平均ベクトルと類似する類似のベクトルを辞書から選択し、選択された類似のベクトルの単語を抽出する、請求項9または10に記載の解析方法。
- ノード間の人間関係を表すグラフ理論を用いた解析方法であって、
単語間の類似度を表すベクトルデータを辞書データとして用意し、
解析対象のデータからノード間の人間関係を予測し、
予測した人間関係を前記辞書データを参照してベクトル化し、人間関係をN次元のベクトルによりベクトル化されたグラフデータを作成し、
作成されたベクトル化グラフデータに基づき人間関係を解析する、解析方法。 - コンピュータ装置が実行するグラフ理論を用いた解析プログラムであって、
辞書データに基づきノード間の関連性を表すN次元のベクトルを算出するステップと、
算出されたN次元のベクトルによりベクトル化されたグラフデータを作成するステップと、を含む解析プログラム。 - グラフ理論を用いた解析システムであって、
辞書データに基づきノード間の関連性を表すN次元のベクトルを算出する算出手段と、
算出されたN次元のベクトルによりベクトル化されたグラフデータを作成する作成手段と、を含む解析システム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017093522A JP6370961B2 (ja) | 2017-05-10 | 2017-05-10 | グラフ理論を用いた解析方法、解析プログラムおよび解析システム |
PCT/JP2018/018137 WO2018207874A1 (ja) | 2017-05-10 | 2018-05-10 | グラフ理論を用いた解析方法、解析プログラムおよび解析システム |
CN201880003912.0A CN109844742B (zh) | 2017-05-10 | 2018-05-10 | 分析系统 |
EP18798040.4A EP3506131A4 (en) | 2017-05-10 | 2018-05-10 | ANALYSIS METHOD USING GRAPHICAL THEORY, ANALYSIS PROGRAM AND ANALYSIS SYSTEM |
US16/335,314 US20190370274A1 (en) | 2017-05-10 | 2018-05-10 | Analysis Method Using Graph Theory, Analysis Program, and Analysis System |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017093522A JP6370961B2 (ja) | 2017-05-10 | 2017-05-10 | グラフ理論を用いた解析方法、解析プログラムおよび解析システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017152042A true JP2017152042A (ja) | 2017-08-31 |
JP6370961B2 JP6370961B2 (ja) | 2018-08-08 |
Family
ID=59740869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017093522A Active JP6370961B2 (ja) | 2017-05-10 | 2017-05-10 | グラフ理論を用いた解析方法、解析プログラムおよび解析システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20190370274A1 (ja) |
EP (1) | EP3506131A4 (ja) |
JP (1) | JP6370961B2 (ja) |
CN (1) | CN109844742B (ja) |
WO (1) | WO2018207874A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019074982A (ja) * | 2017-10-18 | 2019-05-16 | 三菱重工業株式会社 | 情報検索装置、検索処理方法、およびプログラム |
WO2020050706A1 (ko) * | 2018-09-06 | 2020-03-12 | 엘지전자 주식회사 | 워드벡터 보정 방법 |
CN111241095A (zh) * | 2020-01-03 | 2020-06-05 | 北京百度网讯科技有限公司 | 用于生成节点的向量表示的方法和装置 |
US11256869B2 (en) | 2018-09-06 | 2022-02-22 | Lg Electronics Inc. | Word vector correction method |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11099975B2 (en) | 2019-01-24 | 2021-08-24 | International Business Machines Corporation | Test space analysis across multiple combinatoric models |
US11106567B2 (en) | 2019-01-24 | 2021-08-31 | International Business Machines Corporation | Combinatoric set completion through unique test case generation |
US11263116B2 (en) | 2019-01-24 | 2022-03-01 | International Business Machines Corporation | Champion test case generation |
US11232020B2 (en) | 2019-06-13 | 2022-01-25 | International Business Machines Corporation | Fault detection using breakpoint value-based fingerprints of failing regression test cases |
US11422924B2 (en) * | 2019-06-13 | 2022-08-23 | International Business Machines Corporation | Customizable test set selection using code flow trees |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
JPH09288675A (ja) * | 1996-04-22 | 1997-11-04 | Sharp Corp | 検索装置 |
JP2005122510A (ja) * | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
JP2008112432A (ja) * | 2006-10-06 | 2008-05-15 | Nippon Hoso Kyokai <Nhk> | 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム |
US20110270604A1 (en) * | 2010-04-28 | 2011-11-03 | Nec Laboratories America, Inc. | Systems and methods for semi-supervised relationship extraction |
JP2012103820A (ja) * | 2010-11-08 | 2012-05-31 | Vri Inc | 情報提供装置、方法およびプログラム |
WO2016093831A1 (en) * | 2014-12-09 | 2016-06-16 | Facebook, Inc. | Generating user notifications using beacons on online social networks |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007062885A1 (en) * | 2005-11-29 | 2007-06-07 | International Business Machines Corporation | Method and system for extracting and visualizing graph-structured relations from unstructured text |
CN103049490B (zh) * | 2012-12-05 | 2016-09-07 | 北京海量融通软件技术有限公司 | 知识网络节点间属性生成系统及生成方法 |
US20140236577A1 (en) * | 2013-02-15 | 2014-08-21 | Nec Laboratories America, Inc. | Semantic Representations of Rare Words in a Neural Probabilistic Language Model |
CN104809108B (zh) * | 2015-05-20 | 2018-10-09 | 元力云网络有限公司 | 信息监测分析系统 |
KR101697875B1 (ko) * | 2015-10-30 | 2017-01-18 | 아주대학교산학협력단 | 그래프 모델에 기반하는 문서 분석 방법 및 그 시스템 |
-
2017
- 2017-05-10 JP JP2017093522A patent/JP6370961B2/ja active Active
-
2018
- 2018-05-10 US US16/335,314 patent/US20190370274A1/en not_active Abandoned
- 2018-05-10 CN CN201880003912.0A patent/CN109844742B/zh active Active
- 2018-05-10 EP EP18798040.4A patent/EP3506131A4/en not_active Ceased
- 2018-05-10 WO PCT/JP2018/018137 patent/WO2018207874A1/ja unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
JPH09288675A (ja) * | 1996-04-22 | 1997-11-04 | Sharp Corp | 検索装置 |
JP2005122510A (ja) * | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
JP2008112432A (ja) * | 2006-10-06 | 2008-05-15 | Nippon Hoso Kyokai <Nhk> | 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム |
US20110270604A1 (en) * | 2010-04-28 | 2011-11-03 | Nec Laboratories America, Inc. | Systems and methods for semi-supervised relationship extraction |
JP2012103820A (ja) * | 2010-11-08 | 2012-05-31 | Vri Inc | 情報提供装置、方法およびプログラム |
WO2016093831A1 (en) * | 2014-12-09 | 2016-06-16 | Facebook, Inc. | Generating user notifications using beacons on online social networks |
Non-Patent Citations (1)
Title |
---|
YUAN, YANHONG ET AL.: "A New Approach to Embedding Semantic Link Network with Word2Vec Binary Code", 2015 11TH INTERNATIONAL CONFERENCE ON SEMANTICS, KNOWLEDGE AND GRIDS(SKG), JPN6018023879, 10 March 2016 (2016-03-10), pages 9 - 16, ISSN: 0003824880 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019074982A (ja) * | 2017-10-18 | 2019-05-16 | 三菱重工業株式会社 | 情報検索装置、検索処理方法、およびプログラム |
JP7016237B2 (ja) | 2017-10-18 | 2022-02-04 | 三菱重工業株式会社 | 情報検索装置、検索処理方法、およびプログラム |
WO2020050706A1 (ko) * | 2018-09-06 | 2020-03-12 | 엘지전자 주식회사 | 워드벡터 보정 방법 |
US11256869B2 (en) | 2018-09-06 | 2022-02-22 | Lg Electronics Inc. | Word vector correction method |
CN111241095A (zh) * | 2020-01-03 | 2020-06-05 | 北京百度网讯科技有限公司 | 用于生成节点的向量表示的方法和装置 |
CN111241095B (zh) * | 2020-01-03 | 2023-06-23 | 北京百度网讯科技有限公司 | 用于生成节点的向量表示的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
EP3506131A4 (en) | 2019-08-21 |
US20190370274A1 (en) | 2019-12-05 |
JP6370961B2 (ja) | 2018-08-08 |
EP3506131A1 (en) | 2019-07-03 |
CN109844742A (zh) | 2019-06-04 |
WO2018207874A1 (ja) | 2018-11-15 |
CN109844742B (zh) | 2020-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6370961B2 (ja) | グラフ理論を用いた解析方法、解析プログラムおよび解析システム | |
Zhou et al. | A machine learning approach to customer needs analysis for product ecosystems | |
Ganganwar et al. | Implicit aspect extraction for sentiment analysis: A survey of recent approaches | |
Kanakaraddi et al. | Comparison study of sentiment analysis of tweets using various machine learning algorithms | |
KR20230104181A (ko) | 의미 맵의 생성 시에 데이터 아이템 지문을 재사용하기 위한 방법 및 시스템 | |
Ramshankar et al. | A novel recommendation system enabled by adaptive fuzzy aided sentiment classification for E-commerce sector using black hole-based grey wolf optimization | |
Iparraguirre-Villanueva et al. | Sentiment analysis of tweets using unsupervised learning techniques and the k-means algorithm | |
Jain et al. | Sentiment analysis: An empirical comparative study of various machine learning approaches | |
Abualigah et al. | Survey on Twitter sentiment analysis: Architecture, classifications, and challenges | |
Shaik et al. | Recurrent neural network with emperor penguin-based Salp swarm (RNN-EPS2) algorithm for emoji based sentiment analysis | |
Mallik et al. | A novel approach to spam filtering using semantic based naive bayesian classifier in text analytics | |
Bakkialakshmi et al. | Anomaly detection in social media using text-mining and emotion classification with emotion detection | |
Masrani | Twitter Sentiment Analysis Using a Modified Naïve Bayes Algorithm | |
Pandey et al. | Improved exponential cuckoo search method for sentiment analysis | |
Sisodia et al. | Performance evaluation of learners for analyzing the hotel customer sentiments based on text reviews | |
Komamizu et al. | Exploring Identical Users on GitHub and Stack Overflow. | |
Wijaya et al. | Sentiment Analysis Covid-19 Spread Tracing on Google Play Store Application | |
Štefánik | Methods for Estimating and improving robustness of language models | |
Hirchoua et al. | Topic hierarchies for knowledge capitalization using hierarchical Dirichlet processes in big data context | |
Soni et al. | Performance improvement of naïve bayes classifier for sentiment estimation in ambiguous tweets of US airlines | |
Xiang et al. | A novel sentiment analysis method based on multi-scale deep learning | |
Pandita et al. | A literature survey of sentiment analysis based on E-commerce reviews | |
Roy et al. | Quantifying semantic proximity between contexts | |
Dutta et al. | Sentiment detection in online content: a WordNet based approach | |
Laurenceau et al. | Examining Bias in Sentiment Analysis Algorithms Interacting with Emojis with Skin Tone Modifiers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171102 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180130 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180327 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180626 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180711 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6370961 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |