JP7323669B1 - オントロジー生成方法及び学習方法 - Google Patents
オントロジー生成方法及び学習方法 Download PDFInfo
- Publication number
- JP7323669B1 JP7323669B1 JP2022062071A JP2022062071A JP7323669B1 JP 7323669 B1 JP7323669 B1 JP 7323669B1 JP 2022062071 A JP2022062071 A JP 2022062071A JP 2022062071 A JP2022062071 A JP 2022062071A JP 7323669 B1 JP7323669 B1 JP 7323669B1
- Authority
- JP
- Japan
- Prior art keywords
- domain knowledge
- target text
- occurrence
- text
- generation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims description 4
- 238000003058 natural language processing Methods 0.000 abstract description 12
- 238000012545 processing Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明の一態様に係るオントロジー生成方法は、テキスト分類に用いる複数のドメイン知識が格納されたドメイン知識データベースに、第1のドメイン知識を追加するオントロジー生成方法であって、対象テキストに含まれる各単語間の共起性を用いて、前記ドメイン知識データベースから第2のドメイン知識を決定するドメイン知識決定工程と、前記第2のドメイン知識に含まれる情報であって、当該対象テキストに含まれる各単語に関連付けられた情報を用いて、前記第1のドメイン知識を生成し、前記ドメイン知識データベースに追加するドメイン知識追加工程と、を含む。
【選択図】図1
Description
図1は、本開示に係るオントロジー生成装置1の概略構成の一例を示す図である。図1に示すように、オントロジー生成装置1は、制御部10、記憶部12及び通信部14を備えている。制御部10は、オントロジー生成装置1全体を統括する制御装置であって、例えば1又は複数のプロセッサであり、MPU(Micro Processing Unit)、CPU(Central Processing Unit)、ASIC(Application Specific Integrated Circuit)又はPLD(Programmable Logic Device)等の各種プロセッサを用いることができる。
続いて、オントロジー生成装置1によって実行される処理の一例について説明する。図5は、本例の処理の流れを示すフローチャートの一例である。また、図5は、或るタスクに対応するコーパス情報に基づくドメイン知識をドメイン知識データベースに追加する処理の流れを示している。
続いて、オントロジー生成装置1によって実行される処理の他の一例について説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、重複する説明を繰り返さない。本例においては、タスクに対応するコーパス情報における一部のテキストにラベルが付されていない場合、換言すると前記タスクがFew-Shotタスクである場合等にドメイン知識をドメイン知識データベースに追加する処理の流れについて説明する。図6は、本例の処理の流れを示すフローチャートの一例である。
<コーパス情報に対応する共起性>
[(私,スマートフォン),(私,購入),(私,希望),(スマートフォン,購入),(スマートフォン,希望),(購入,希望)]=[3,3,3,3,3,3]
<タスクAのドメイン知識に対応する共起性>
[(私,スマートフォン),(私,購入),(私,希望),(スマートフォン,購入),(スマートフォン,希望),(購入,希望)]=[100,100,1,1,0,0]
<タスクBのドメイン知識に対応する共起性>
[(私,スマートフォン),(私,購入),(私,希望),(スマートフォン,購入),(スマートフォン,希望),(購入,希望)]=[2,1,1,1,0,1]
前記の場合、コーパス情報に対応する共起性とタスクAのドメイン知識に対応する共起性とのコサイン類似度は0.5831、コーパス情報に対応する共起性とタスクBのドメイン知識に対応する共起性とのコサイン類似度は0.8660となり、後者のコサイン類似度の方が、類似度が高い。
オントロジー生成装置1(以下、「装置」と呼ぶ)の機能は、当該装置としてコンピュータを機能させるためのプログラムであって、当該装置の各制御ブロック(特に制御部10)としてコンピュータを機能させるためのプログラムにより実現することができる。
3 記憶装置(サーバ)
10 制御部
12 記憶部
14 通信部
Claims (9)
- テキスト分類に用いる複数のドメイン知識が格納されたドメイン知識データベースに、第1のドメイン知識を追加する、コンピュータによって実行されるオントロジー生成方法であって、
対象テキストに含まれる各単語間の共起性を用いて、前記ドメイン知識データベースから、前記第1のドメイン知識に類似する第2のドメイン知識を決定するドメイン知識決定工程と、
前記第2のドメイン知識に含まれる情報であって、当該対象テキストに含まれる各単語に関連付けられた情報を用いて、前記第1のドメイン知識を生成し、前記ドメイン知識データベースに追加するドメイン知識追加工程と、
を含むオントロジー生成方法。 - 前記ドメイン知識決定工程においては、
前記ドメイン知識データベースに含まれる複数のドメイン知識のうち、前記第1のドメイン知識とのコサイン類似度が最も類似するドメイン知識が、前記第2のドメイン知識として決定される、請求項1に記載のオントロジー生成方法。 - 前記ドメイン知識決定工程においては、
前記ドメイン知識データベースに含まれる複数のドメイン知識の各々について、当該ドメイン知識に対応する前記各単語間の共起性と、前記対象テキストに含まれる各単語間の共起性との類似度が算出され、前記複数のドメイン知識のうち前記類似度が最も高くなるドメイン知識が、前記第2のドメイン知識として決定される、請求項2に記載のオントロジー生成方法。 - 前記ドメイン知識追加工程においては、
当該対象テキストに含まれる各単語に関連付けられた情報として、前記第2のドメイン知識に含まれるEmbeddingが少なくとも用いられる、請求項1から3までの何れか1項に記載のオントロジー生成方法。 - 前記ドメイン知識追加工程においては、
当該対象テキストに含まれる各単語であって、前記第2のドメイン知識における各単語のEmbeddingと当該対象テキストに対応するラベルとの組が、テキスト分類のための学習モデルに入力されることによって当該Embeddingが更新され、更新された当該Embeddingが、前記第1のドメイン知識として追加される、請求項4に記載のオントロジー生成方法。 - 前記ドメイン知識追加工程においては、
当該対象テキストに含まれる各単語のEmbeddingとTF-IDFとが、前記学習モデルに入力される、請求項5に記載のオントロジー生成方法。 - 前記ドメイン知識追加工程においては、
当該対象テキストに含まれる各単語に関連付けられた情報として、前記第2のドメイン知識に含まれるTF-IDFであって、各単語のTF-IDFが少なくとも用いられる、請求項1から3までの何れか1項に記載のオントロジー生成方法。 - 前記ドメイン知識データベースは、
前記第2のドメイン知識の候補となるデフォルトのドメイン知識であって、当該オントロジー生成方法を実行する装置とは異なるサーバ上に保存されたドメイン知識を含む、請求項1から3までの何れか1項に記載のオントロジー生成方法。 - テキスト分類のための学習モデルを学習させる、コンピュータによって実行される学習方法であって、
対象テキストに含まれる各単語間の共起性を用いて、テキスト分類に用いる複数のドメイン知識が格納されたドメイン知識データベースから類似ドメイン知識を決定するドメイン知識決定工程と、
前記類似ドメイン知識に含まれる情報であって、当該対象テキストに含まれる各単語に関連付けられた情報を用いて、前記学習モデルを学習させる学習工程と、
を含み、
前記類似ドメイン知識は、当該類似ドメイン知識に対応する各単語間の共起性が、前記対象テキストに含まれる各単語間の共起性と類似するドメイン知識である、学習方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022062071A JP7323669B1 (ja) | 2022-04-01 | 2022-04-01 | オントロジー生成方法及び学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022062071A JP7323669B1 (ja) | 2022-04-01 | 2022-04-01 | オントロジー生成方法及び学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7323669B1 true JP7323669B1 (ja) | 2023-08-08 |
JP2023152122A JP2023152122A (ja) | 2023-10-16 |
Family
ID=87519415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022062071A Active JP7323669B1 (ja) | 2022-04-01 | 2022-04-01 | オントロジー生成方法及び学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7323669B1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569985A (zh) | 2019-03-09 | 2019-12-13 | 华南理工大学 | 基于在线和离线决策集成学习的在线异构迁移学习的方法 |
-
2022
- 2022-04-01 JP JP2022062071A patent/JP7323669B1/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569985A (zh) | 2019-03-09 | 2019-12-13 | 华南理工大学 | 基于在线和离线决策集成学习的在线异构迁移学习的方法 |
Non-Patent Citations (1)
Title |
---|
B▲A▼CK, Jesper,Domain similarity metrics for predicting transfer learning performance [online],2019年,pp.1-38,[検索日:2023.03.17], Internet<URL:https://diva-portal.org/smash/record.jsf?pid=diva2%3A1276490&dswid=6144> |
Also Published As
Publication number | Publication date |
---|---|
JP2023152122A (ja) | 2023-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9542477B2 (en) | Method of automated discovery of topics relatedness | |
CN109271521B (zh) | 一种文本分类方法及装置 | |
US10678769B2 (en) | Artificial intelligence system and method for auto-naming customer tree nodes in a data structure | |
Soni et al. | Sentiment analysis of customer reviews based on hidden markov model | |
JP5881048B2 (ja) | 情報処理システム、及び、情報処理方法 | |
Balikas et al. | Twise at semeval-2016 task 4: Twitter sentiment classification | |
JP2016207141A (ja) | 要約生成装置、要約生成方法、及び要約生成プログラム | |
US11669687B1 (en) | Systems and methods for natural language processing (NLP) model robustness determination | |
JP2022109836A (ja) | テキスト分類情報の半教師あり抽出のためのシステム及び方法 | |
JP2019082931A (ja) | 検索装置、類似度算出方法、およびプログラム | |
CA3131157A1 (en) | System and method for text categorization and sentiment analysis | |
JP6770709B2 (ja) | 機械学習用モデル生成装置及びプログラム。 | |
CN108182182A (zh) | 翻译数据库中文档匹配方法、装置及计算机可读存储介质 | |
JP2019082860A (ja) | 生成プログラム、生成方法及び生成装置 | |
JP7323669B1 (ja) | オントロジー生成方法及び学習方法 | |
KR102400689B1 (ko) | 의미 관계 학습 장치, 의미 관계 학습 방법, 및 의미 관계 학습 프로그램 | |
Wongchaisuwat | Automatic keyword extraction using textrank | |
JPWO2015040860A1 (ja) | 分類辞書生成装置、分類辞書生成方法及びプログラム | |
US11580499B2 (en) | Method, system and computer-readable medium for information retrieval | |
CN114115878A (zh) | 一种工作流节点推荐方法及装置 | |
CN113297854A (zh) | 文本到知识图谱实体的映射方法、装置、设备及存储介质 | |
JP2018092347A (ja) | 情報処理装置、情報処理方法及びプログラム | |
Bembenik et al. | Intelligent methods and big data in industrial applications | |
CN105808522A (zh) | 一种语义联想的方法及装置 | |
CN107622129B (zh) | 一种知识库的组织方法及装置、计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220401 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230727 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7323669 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |