JP7099976B2 - 情報管理装置および情報管理方法 - Google Patents
情報管理装置および情報管理方法 Download PDFInfo
- Publication number
- JP7099976B2 JP7099976B2 JP2019054851A JP2019054851A JP7099976B2 JP 7099976 B2 JP7099976 B2 JP 7099976B2 JP 2019054851 A JP2019054851 A JP 2019054851A JP 2019054851 A JP2019054851 A JP 2019054851A JP 7099976 B2 JP7099976 B2 JP 7099976B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- item
- predetermined
- information management
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
図1において、情報管理装置は、項目抽出部1、ノード候補生成部2、ノード抽出部3、ノード統合部4、分類部5、モデル化部6、ノード分割部7、シソーラス辞書8および概念モデル9を備える。
図2は、図1のドキュメントの一例を示す図である。
図2において、ドキュメントD1には、クマノミの生態というタイトルが設けられている。ドキュメントD1は、生息環境、繁殖方法、採食方法、性別および生存期間という項目を含む。生息環境という項目は、水質、水深、温度、共生および生息海域という項目を含む。
図3において、ドキュメントD2には、ドビウオの生態というタイトルが設けられている。ドキュメントD2は、生息環境、繁殖方法、餌接種方法、性別および寿命という項目を含む。生息環境という項目は、水質、水深、温度および生息地域という項目を含む。
図4において、ドキュメントD3には、パンダの生態というタイトルが設けられている。ドキュメントD3は、形態、生息地域、繁殖方法、採食方法および寿命という項目を含む。形態という項目は、大きさ、体毛および鳴き声という項目を含む。大きさという項目は、全長および体重という項目を含む。鳴き声という項目は、おすおよびめすという項目を含む。生息地域という項目は、国名および生息環境という項目を含む。生息環境という項目は、温帯および竹林という項目を含む。
図5において、ドキュメントD4には、ライオンの生態というタイトルが設けられている。ドキュメントD4は、形態、生息地域、繁殖方法、採食方法、社会システムおよび寿命という項目を含む。形態という項目は、大きさ、体毛および鳴き声という項目を含む。大きさという項目は、全長および体重という項目を含む。生息地域という項目は、国名および生息環境という項目を含む。生息環境という項目は、亜熱帯および草地という項目を含む。国名という項目は、アフリカという情報内容を含む。
図6(a)において、項目抽出部1は、図2のドキュメントD1からタイトルおよび項目を抽出する。そして、項目抽出部1は、クマノミの生態というタイトルにノードN111を割り当てる。
図7(a)において、図1のノード候補生成部2は、形態素解析に基づいて、ノードN111のクマノミの生態というタイトルから生態という項目を抽出し、ノードN111の名称を生態という項目に変更する。また、ノード候補生成部2は、類語分析に基づいて、ノードN125の生存期間という項目を寿命という項目に変更する。
図8(a)において、図1のノード抽出部3は、ノード候補生成部2にて図7(b)のノードの階層構造が生成されると、下層構造が1段である下位ノードN231~N234に紐付くノードN221を抽出する。
図10において、概念モデル9は、例えば、海水、汽水および淡水という下位概念を水質という上位概念に関連付け、インド太平洋、赤道付近の海域、インド洋、太平洋、東アジア河川という下位概念を生息地域という上位概念に関連付け、温帯および亜熱帯という下位概念を気候という上位概念に関連付け、草原および竹林という下位概念を植生という上位概念に関連付ける。
図14において、分析対象のノード名Nと、ノード名Nの下位ノード名リストを取得する(S11)。
図15において、kNグループのノードに紐付く下位ノード名数M(Mは正の整数)を取得する(S31)。
図16において、kが異なる複数のグループkNにおいて、それぞれD(Dは正の整数)個以上のデータを有する下位ノードu(u=1,…,U(Uは正の整数))を抽出する(S51)。Dは、任意に設定した閾値である。例えば、D=1としたとき、図11(c)の例では、水質と生息地域のノードが抽出される。
図17において、m=1に設定する(S61)。
図18において、m=1に設定する(S71)。
図19において、情報管理装置101は、プロセッサ11、通信制御デバイス12、通信インタフェース13、主記憶デバイス14および外部記憶デバイス15を備える。プロセッサ11、通信制御デバイス12、通信インタフェース13、主記憶デバイス14および外部記憶デバイス15は、内部バス16を介して相互に接続されている。主記憶デバイス14および外部記憶デバイス15は、プロセッサ11からアクセス可能である。
Claims (12)
- 概念化された情報に割り当てられたノードの階層構造から所定ノードを抽出する抽出部と、
前記抽出部にて抽出された前記所定ノードに紐付けられた下位ノードの情報に基づいて、前記抽出部で抽出された前記所定ノードを分類する分類部と、
前記分類部による分類された前記所定ノードに紐付く前記下位ノードの情報に基づいて、前記下位ノードの紐付き方をモデル化するモデル化部とを備え、
前記モデル化部は、前記分類部にて同一グループに分類された前記所定ノードに紐付く前記下位ノードの紐付き方のパタンを生成する情報管理装置。 - 前記ノードは、ドキュメントの項目が割り当てられる請求項1に記載の情報管理装置。
- 前記所定ノードは、前記下位ノードの階層が1段以下のノードである請求項1に記載の情報管理装置。
- 前記抽出部は、前記分類部で同一グループに分類された前記所定ノードおよび前記所定ノードに紐付く下位ノードを単一ノードとみなす請求項3に記載の情報管理装置。
- 前記分類部は、前記所定ノードに紐付く前記下位ノードの概念の組み合わせに基づいて、前記所定ノードを分類する請求項1に記載の情報管理装置。
- 前記抽出部は、前記所定ノードとして第1ノードおよび第2ノードを抽出し、
前記分類部は、前記第1ノードに紐付く下位ノードの概念が、前記第2ノードに紐付く下位ノードの概念となり得ない場合、前記第1ノードを前記第2ノードと異なるグループに分類する請求項1に記載の情報管理装置。 - 前記所定ノードの分類結果に基づいて、前記所定ノードに紐付く下位ノードの概念を分割する分割部をさらに備える請求項1に記載の情報管理装置。
- 前記分割部は、異なるグループに分類された前記所定ノードにそれぞれ紐付く下位ノードの概念を、各グループに特有の具体化された概念に分割する請求項7に記載の情報管理装置。
- 前記所定ノードに紐付く下位ノードの概念の抽象度を統合する統合部をさらに備える請求項1に記載の情報管理装置。
- 前記統合部は、前記下位ノードの情報内容に基づいて、前記下位ノードの概念を統合する請求項9に記載の情報管理装置。
- 形態素解析および類語分析に基づいて、前記ドキュメントから抽出された同一概念の項目の名称を統一するノード候補生成部をさらに備える請求項2に記載の情報管理装置。
- プロセッサにて実行される情報管理方法であって、
前記プロセッサは、
項目が割り当てられたノードの階層構造から所定ノードを抽出し、
前記所定ノードに紐付けられた下位ノードの項目に基づいて前記所定ノードを分類し、
分類された前記所定ノードに紐付く前記下位ノードの情報に基づいて、前記下位ノードの紐付き方をモデル化し、
同一グループに分類された前記所定ノードに紐付く前記下位ノードの紐付き方のパタンを生成
する情報管理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019054851A JP7099976B2 (ja) | 2019-03-22 | 2019-03-22 | 情報管理装置および情報管理方法 |
PCT/JP2020/008353 WO2020195545A1 (ja) | 2019-03-22 | 2020-02-28 | 情報管理装置および情報管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019054851A JP7099976B2 (ja) | 2019-03-22 | 2019-03-22 | 情報管理装置および情報管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020154991A JP2020154991A (ja) | 2020-09-24 |
JP7099976B2 true JP7099976B2 (ja) | 2022-07-12 |
Family
ID=72559317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019054851A Active JP7099976B2 (ja) | 2019-03-22 | 2019-03-22 | 情報管理装置および情報管理方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7099976B2 (ja) |
WO (1) | WO2020195545A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009136426A1 (ja) | 2008-05-08 | 2009-11-12 | 三菱電機株式会社 | 検索クエリ提供装置 |
JP2010501947A (ja) | 2006-08-31 | 2010-01-21 | スウィーニー,ピーター | 消費者定義の情報アーキテクチャ用のシステム、方法およびコンピュータプログラム |
US20160062993A1 (en) | 2014-08-21 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method and electronic device for classifying contents |
JP2016139229A (ja) | 2015-01-27 | 2016-08-04 | 日本放送協会 | 個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置 |
-
2019
- 2019-03-22 JP JP2019054851A patent/JP7099976B2/ja active Active
-
2020
- 2020-02-28 WO PCT/JP2020/008353 patent/WO2020195545A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010501947A (ja) | 2006-08-31 | 2010-01-21 | スウィーニー,ピーター | 消費者定義の情報アーキテクチャ用のシステム、方法およびコンピュータプログラム |
WO2009136426A1 (ja) | 2008-05-08 | 2009-11-12 | 三菱電機株式会社 | 検索クエリ提供装置 |
US20160062993A1 (en) | 2014-08-21 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method and electronic device for classifying contents |
JP2016139229A (ja) | 2015-01-27 | 2016-08-04 | 日本放送協会 | 個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置 |
Non-Patent Citations (3)
Title |
---|
山本 浩平、外2名,カテゴリ階層の拡張を目的とした階層的トピックモデル,第6回データ工学と情報マネジメントに関するフォーラム (第12回日本データベース学会年次大会),日本,電子情報通信学会データ工学研究専門委員会,2014年05月03日,p.1-8,Internet<URL:http://db-event.jpn.org/deim2014/final/proceedings/C4-6.pdf> |
市瀬 龍太郎、外2名,インスタンスに基づく階層的知識源の統合,AIチャレンジ研究会(第11回) SIG-Challenge-0111,日本,社団法人人工知能学会,2001年03月12日,p.61-66 |
青木 千鶴、外2名,汎用オントロジーと判例群を利用した法的オントロジー構築支援環境,第27回ヒューマンインタフェースと認知モデル研究会資料(SIG-HICG-9503),日本,社団法人人工知能学会,1996年03月25日,p.9-16 |
Also Published As
Publication number | Publication date |
---|---|
JP2020154991A (ja) | 2020-09-24 |
WO2020195545A1 (ja) | 2020-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Javed et al. | Community detection in networks: A multidisciplinary review | |
Dinh et al. | Clustering mixed numerical and categorical data with missing values | |
Vijayarani et al. | Comparative analysis of bayes and lazy classification algorithms | |
ElAlami | A new matching strategy for content based image retrieval system | |
Lee et al. | A survey of algorithms for dense subgraph discovery | |
Qiao et al. | Towards efficient business process clustering and retrieval: combining language modeling and structure matching | |
CN111191466B (zh) | 一种基于网络表征和语义表征的同名作者消歧方法 | |
Liu et al. | Clustering by growing incremental self-organizing neural network | |
Zheng et al. | A framework for hierarchical ensemble clustering | |
Vinokourov et al. | A probabilistic framework for the hierarchic organisation and classification of document collections | |
Praveen et al. | A novel approach to improve the performance of divisive clustering-BST | |
Fawcett | Data mining with cellular automata | |
JP7099976B2 (ja) | 情報管理装置および情報管理方法 | |
Cai et al. | Simultaneous image classification and annotation via biased random walk on tri-relational graph | |
Pratima et al. | Pattern recognition algorithms for cluster identification problem | |
CN110162580A (zh) | 基于分布式预警平台的数据挖掘与深度分析方法及应用 | |
Sundari et al. | A study of various text mining techniques | |
Missaoui et al. | Social network restructuring after a node removal | |
Hao et al. | A Probability‐Based Hybrid User Model for Recommendation System | |
Matharage et al. | A scalable and dynamic self-organizing map for clustering large volumes of text data | |
Beaujean et al. | Graph Homomorphism Features: Why Not Sample? | |
Kolias et al. | A Covering Classification Rule Induction Approach for Big Datasets | |
Czubryt et al. | Efficient Vertical Mining of Frequent Quantitative Patterns | |
Yu et al. | Researcher name disambiguation: feature learning and affinity propagation clustering | |
Jo et al. | Text clustering: Conceptual view |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220630 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7099976 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |