JP2022122029A - データ処理装置、データ処理方法及びデータ処理プログラム - Google Patents
データ処理装置、データ処理方法及びデータ処理プログラム Download PDFInfo
- Publication number
- JP2022122029A JP2022122029A JP2021019078A JP2021019078A JP2022122029A JP 2022122029 A JP2022122029 A JP 2022122029A JP 2021019078 A JP2021019078 A JP 2021019078A JP 2021019078 A JP2021019078 A JP 2021019078A JP 2022122029 A JP2022122029 A JP 2022122029A
- Authority
- JP
- Japan
- Prior art keywords
- data
- event data
- event
- relationship
- relational
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 44
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 239000000284 extract Substances 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 17
- 235000008694 Humulus lupulus Nutrition 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000007704 transition Effects 0.000 abstract description 15
- 238000000034 method Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 8
- 230000000877 morphologic effect Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 7
- 230000001364 causal effect Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 235000019580 granularity Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002253 acid Substances 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/542—Event management; Broadcasting; Multicasting; Notifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/214—Database migration support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
[第1の実施形態]
第1の実施形態を説明する。図1は、第1の実施形態に係るデータ処理装置の一例の構成を示す図である。データ処理装置1は、入力部11と、抽出部12と、関係データ生成部13とを有する。
第2の実施形態を説明する。第1の実施形態は、同一の文書データ内で抽出された出来事データに基づいて新たな関係データが生成される。ここで、出来事の表現が異なるだけでほぼ同一の推移関係を表している文書データも存在し得る。
Claims (9)
- 入力された第1の文書データから、第1の出来事データと、第2の出来事データと、第3の出来事データとを抽出する抽出部と、
前記第1の出来事データと前記第2の出来事データとの間に推移性があることを示す第1の関係データが抽出され、前記第2の出来事データと前記第3の出来事データとの間に推移性があることを示す第2の関係データが抽出されたとき、前記第1の出来事データと前記第3の出来事データに関係があることを示す第3の関係データを生成する関係データ生成部と、
を具備するデータ処理装置。 - 前記関係データ生成部は、前記第1の出来事データと前記第3の出来事データとの間の関係の強さを示す第3の強さデータをさらに前記第3の関係データに含める、
請求項1に記載のデータ処理装置。 - 前記関係データ生成部は、
前記第1の出来事データと前記第2の出来事データとの間の関係の強さを示す第1の強さデータと、前記第2の出来事データと前記第3の出来事データとの間の関係の強さを示す第2の強さデータとに基づいて前記第3の強さデータを生成する、
請求項2に記載のデータ処理装置。 - 出来事の間の類似性を算出する類似性算出部をさらに具備し、
前記関係データ生成部は、前記第1の出来事データと前記第2の出来事データとの類似性が閾値以上であるときに、前記第3の関係データを生成する、
請求項1乃至3の何れか1項に記載のデータ処理装置。 - 前記抽出部は、入力された第2の文書データから、第4の出来事データと第5の出来事データとをさらに抽出し、
前記関係データ生成部は、前記第4の出来事データと前記第5の出来事データとの間に推移性があることを示す第4の関係データが抽出され、かつ、前記第2の出来事データと前記第4の出来事データとの類似性が閾値以上であるときに、前記第1の出来事データと前記第5の出来事データとの間に関係があることを示す第5の関係データを生成する、
請求項4に記載のデータ処理装置。 - 前記抽出部は、入力された第2の文書データから、第6の出来事データと第7の出来事データをさらに抽出し、
前記関係データ生成部は、
前記第6の出来事データと前記第7の出来事データとの間に推移性があることを示す第6の関係データが抽出され、かつ、前記第1の出来事データと前記第6の出来事データとの類似性が閾値以上であるときに、前記第1の出来事データと前記第7の出来事データとの間に関係があることを示す第7の関係データと前記第6の出来事データと前記第2の出来事データとの間に関係があることを示す第8の関係データの一方又は両方を生成する、
請求項4又は5に記載のデータ処理装置。 - 前記関係データ生成部は、
前記第1の出来事データと前記第3の出来事データとの間の関係の距離を表すホップ数を算出し、
前記ホップ数が所定値を超えるときには、前記第3の関係データを採用しない、
請求項1乃至6の何れか1項に記載のデータ処理装置。 - 抽出部において、入力された第1の文書データから、第1の出来事データと、第2の出来事データと、第3の出来事データとを抽出する抽出部と、
関係データ生成部において、前記第1の出来事データと前記第2の出来事データとの間に推移性があることを示す第1の関係データが抽出され、前記第2の出来事データと前記第3の出来事データとの間に推移性があることを示す第2の関係データが抽出されたとき、前記第1の出来事データと前記第3の出来事データに関係があることを示す第3の関係データを生成することと、
を具備するデータ処理方法。 - 抽出部において、入力された第1の文書データから、第1の出来事データと、第2の出来事データと、第3の出来事データとを抽出する抽出部と、
関係データ生成部において、前記第1の出来事データと前記第2の出来事データとの間に推移性があることを示す第1の関係データが抽出され、前記第2の出来事データと前記第3の出来事データとの間に推移性があることを示す第2の関係データが抽出されたとき、前記第1の出来事データと前記第3の出来事データに関係があることを示す第3の関係データを生成することと、
をプロセッサに実行させるためのデータ処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021019078A JP2022122029A (ja) | 2021-02-09 | 2021-02-09 | データ処理装置、データ処理方法及びデータ処理プログラム |
US17/462,470 US11886936B2 (en) | 2021-02-09 | 2021-08-31 | Data processing apparatus, data processing method, and storage medium storing therein data processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021019078A JP2022122029A (ja) | 2021-02-09 | 2021-02-09 | データ処理装置、データ処理方法及びデータ処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022122029A true JP2022122029A (ja) | 2022-08-22 |
Family
ID=82703809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021019078A Pending JP2022122029A (ja) | 2021-02-09 | 2021-02-09 | データ処理装置、データ処理方法及びデータ処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11886936B2 (ja) |
JP (1) | JP2022122029A (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060009966A1 (en) * | 2004-07-12 | 2006-01-12 | International Business Machines Corporation | Method and system for extracting information from unstructured text using symbolic machine learning |
JP2008226168A (ja) * | 2007-03-15 | 2008-09-25 | Omron Corp | 因果推論装置、その制御プログラムおよび制御方法 |
JP2009289020A (ja) * | 2008-05-29 | 2009-12-10 | Omron Corp | Ft図作成プログラム、ft図作成装置、記録媒体及びft図作成方法 |
JP2017037544A (ja) * | 2015-08-12 | 2017-02-16 | 国立研究開発法人情報通信研究機構 | 未来シナリオ生成装置及び方法、並びにコンピュータプログラム |
WO2017104657A1 (ja) * | 2015-12-14 | 2017-06-22 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
JP2018055142A (ja) * | 2016-09-26 | 2018-04-05 | 国立研究開発法人情報通信研究機構 | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム |
JP2020160867A (ja) * | 2019-03-27 | 2020-10-01 | 三菱ロジスネクスト株式会社 | Ft図生成装置、トラブルシューティング用フロー図生成装置およびプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010026900A1 (ja) * | 2008-09-03 | 2010-03-11 | 日本電気株式会社 | 関係性発見装置、関係性発見方法および記録媒体 |
US9152623B2 (en) * | 2012-11-02 | 2015-10-06 | Fido Labs, Inc. | Natural language processing system and method |
US20140372102A1 (en) * | 2013-06-18 | 2014-12-18 | Xerox Corporation | Combining temporal processing and textual entailment to detect temporally anchored events |
JP6602243B2 (ja) * | 2016-03-16 | 2019-11-06 | 株式会社東芝 | 学習装置、方法、及びプログラム |
US11132541B2 (en) * | 2017-09-29 | 2021-09-28 | The Mitre Corporation | Systems and method for generating event timelines using human language technology |
JP6965206B2 (ja) | 2018-05-09 | 2021-11-10 | 株式会社東芝 | クラスタリング装置、クラスタリング方法およびプログラム |
JP7362424B2 (ja) | 2019-10-29 | 2023-10-17 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理システム |
-
2021
- 2021-02-09 JP JP2021019078A patent/JP2022122029A/ja active Pending
- 2021-08-31 US US17/462,470 patent/US11886936B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060009966A1 (en) * | 2004-07-12 | 2006-01-12 | International Business Machines Corporation | Method and system for extracting information from unstructured text using symbolic machine learning |
JP2008226168A (ja) * | 2007-03-15 | 2008-09-25 | Omron Corp | 因果推論装置、その制御プログラムおよび制御方法 |
JP2009289020A (ja) * | 2008-05-29 | 2009-12-10 | Omron Corp | Ft図作成プログラム、ft図作成装置、記録媒体及びft図作成方法 |
JP2017037544A (ja) * | 2015-08-12 | 2017-02-16 | 国立研究開発法人情報通信研究機構 | 未来シナリオ生成装置及び方法、並びにコンピュータプログラム |
WO2017104657A1 (ja) * | 2015-12-14 | 2017-06-22 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
JP2018055142A (ja) * | 2016-09-26 | 2018-04-05 | 国立研究開発法人情報通信研究機構 | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム |
JP2020160867A (ja) * | 2019-03-27 | 2020-10-01 | 三菱ロジスネクスト株式会社 | Ft図生成装置、トラブルシューティング用フロー図生成装置およびプログラム |
Non-Patent Citations (2)
Title |
---|
内藤 稔、外2名: "エンティティ間の類似関係取得のためのWikipedia事象モデル構築手法に関する考察", 第4回データ工学と情報マネジメントに関するフォーラム論文集 (第10回日本データベース学会年次大会), JPN6023047138, 30 August 2012 (2012-08-30), JP, pages 1 - 6, ISSN: 0005200914 * |
旭 直人、外3名: "比較文集約に基づくエンティティ刊の順序関係推定による補完エンティティの発見", 情報処理学会論文誌, vol. 第52巻,第12号, JPN6015041637, 15 December 2011 (2011-12-15), JP, pages 3527 - 3541, ISSN: 0005200915 * |
Also Published As
Publication number | Publication date |
---|---|
US20220253346A1 (en) | 2022-08-11 |
US11886936B2 (en) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10706084B2 (en) | Method and device for parsing question in knowledge base | |
US9727637B2 (en) | Retrieving text from a corpus of documents in an information handling system | |
US9740685B2 (en) | Generation of natural language processing model for an information domain | |
US9318027B2 (en) | Caching natural language questions and results in a question and answer system | |
US10339453B2 (en) | Automatically generating test/training questions and answers through pattern based analysis and natural language processing techniques on the given corpus for quick domain adaptation | |
US20140163951A1 (en) | Hybrid adaptation of named entity recognition | |
US9342561B2 (en) | Creating and using titles in untitled documents to answer questions | |
US10275454B2 (en) | Identifying salient terms for passage justification in a question answering system | |
US20120262461A1 (en) | System and Method for the Normalization of Text | |
CN103646112B (zh) | 利用了网络搜索的依存句法的领域自适应方法 | |
Vlas et al. | A rule-based natural language technique for requirements discovery and classification in open-source software development projects | |
US20190317986A1 (en) | Annotated text data expanding method, annotated text data expanding computer-readable storage medium, annotated text data expanding device, and text classification model training method | |
Slocum | How one might automatically identify and adapt to a sublanguage: An initial exploration | |
JP5331023B2 (ja) | 重要語抽出装置、重要語抽出方法及び重要語抽出プログラム | |
JP2009217689A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US11487817B2 (en) | Index generation method, data retrieval method, apparatus of index generation | |
US9146918B2 (en) | Compressing data for natural language processing | |
JP2022122029A (ja) | データ処理装置、データ処理方法及びデータ処理プログラム | |
KR102519955B1 (ko) | 토픽 키워드의 추출 장치 및 방법 | |
Mammadov et al. | Part-of-speech tagging for azerbaijani language | |
CN115129581A (zh) | 单元测试质量的评估方法、装置及电子设备 | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
Arcan et al. | Otto-ontology translation system | |
JP2010170303A (ja) | 機械翻訳装置及びプログラム | |
JP2020046909A (ja) | 学習装置、抽出装置及び学習方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230105 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240828 |