JP6368633B2 - 用語意味学習装置、用語意味判定装置、方法、及びプログラム - Google Patents
用語意味学習装置、用語意味判定装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6368633B2 JP6368633B2 JP2014248130A JP2014248130A JP6368633B2 JP 6368633 B2 JP6368633 B2 JP 6368633B2 JP 2014248130 A JP2014248130 A JP 2014248130A JP 2014248130 A JP2014248130 A JP 2014248130A JP 6368633 B2 JP6368633 B2 JP 6368633B2
- Authority
- JP
- Japan
- Prior art keywords
- term
- meaning
- feature vector
- character string
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
20、220、320 演算部
28 訓練データ集合データベース
30、230 特徴ベクトル生成部
32 判定ルール生成部
40、240 判定ルール
100、300 用語意味学習装置
200 用語意味判定装置
232 意味コード判定部
250 出力部
326 同義語類義語意味コード付与部
Claims (8)
- 入力された、用語の意味コードが予め付与された複数の用語の各々について、前記用語の文字列に含まれる部分文字列から、各部分文字列の有無又は個数を表す特徴ベクトルを生成する特徴ベクトル生成部と、
前記特徴ベクトル生成部により前記複数の用語の各々について生成された前記特徴ベクトルと、前記複数の用語の各々に付与された意味コードとに基づいて、用語の意味コードを判定するための判定ルールを生成する判定ルール生成部と、
を含む用語意味学習装置であって、
前記用語について生成された前記特徴ベクトルが表す部分文字列に含まれる全ての文字を要素とする集合と、前記用語の文字列に含まれる全ての文字を要素とする集合とは一致する、用語意味学習装置。 - 前記複数の用語の各々は、用語、及び意味コードの対の集合である訓練データとして入力され、
前記訓練データを構成する各用語は、特定の専門分野において唯一の意味が定義されている用語とし、
前記判定ルール生成部は、前記訓練データにおいて意味コードkが付与された用語を正例、前記意味コードk以外の意味コードが付与された用語を負例として、前記判定ルールを生成する、
請求項1に記載の用語意味学習装置。 - 入力された用語の文字列に含まれる部分文字列から、各部分文字列の有無又は個数を表す特徴ベクトルを生成する特徴ベクトル生成部と、
前記特徴ベクトル生成部により生成された前記特徴ベクトルと、あらかじめ学習された、用語の意味コードを判定するための判定ルールとに基づいて、前記入力された用語の意味コードを判定する意味コード判定部と、
を含む用語意味判定装置であって、
前記入力された用語について生成された前記特徴ベクトルが表す部分文字列に含まれる全ての文字を要素とする集合と、前記入力された用語の文字列に含まれる全ての文字を要素とする集合とは一致する、用語意味判定装置。 - 前記判定ルールは、特定の専門分野において唯一の意味が定義されている用語、及び意味コードの対の集合である訓練データを用いて、前記入力された用語の特徴量ベクトルを入力として、前記入力された用語の意味コードを判定するよう、あらかじめ学習されたものとする、
請求項3に記載の用語意味判定装置。 - 前記特徴ベクトル生成部は、前記入力された用語の文字の文字種を用いて定義される特徴量を追加した前記特徴ベクトルを生成する請求項3又は請求項4に記載の用語意味判定装置。
- 特徴ベクトル生成部が、入力された、用語の意味コードが予め付与された複数の用語の各々について、前記用語の文字列に含まれる部分文字列から、各部分文字列の有無又は個数を表す特徴ベクトルを生成するステップと、
判定ルール生成部が、前記特徴ベクトル生成部により前記複数の用語の各々について生成された前記特徴ベクトルと、前記複数の用語の各々に付与された意味コードとに基づいて、用語の意味コードを判定するための判定ルールを生成するステップと、
を含む用語意味学習方法であって、
前記用語について生成された前記特徴ベクトルが表す部分文字列に含まれる全ての文字を要素とする集合と、前記用語の文字列に含まれる全ての文字を要素とする集合とは一致する、用語意味学習方法。 - コンピュータを、請求項1又は請求項2に記載の用語意味学習装置を構成する各部として機能させるためのプログラム。
- コンピュータを、請求項3〜5の何れか1項に記載の用語意味判定装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014248130A JP6368633B2 (ja) | 2014-12-08 | 2014-12-08 | 用語意味学習装置、用語意味判定装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014248130A JP6368633B2 (ja) | 2014-12-08 | 2014-12-08 | 用語意味学習装置、用語意味判定装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016110440A JP2016110440A (ja) | 2016-06-20 |
JP6368633B2 true JP6368633B2 (ja) | 2018-08-01 |
Family
ID=56122301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014248130A Active JP6368633B2 (ja) | 2014-12-08 | 2014-12-08 | 用語意味学習装置、用語意味判定装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6368633B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7198408B2 (ja) | 2017-01-15 | 2023-01-04 | cotobox株式会社 | 商標情報処理装置及び方法、並びにプログラム |
CN112434756A (zh) * | 2020-12-15 | 2021-03-02 | 杭州依图医疗技术有限公司 | 医学数据的训练方法、处理方法、装置及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008021139A (ja) * | 2006-07-13 | 2008-01-31 | National Institute Of Information & Communication Technology | 意味タグ付け用モデル構築装置、意味タグ付け装置及びコンピュータプログラム |
JP2009230270A (ja) * | 2008-03-19 | 2009-10-08 | Fuji Xerox Co Ltd | データ解析装置及びプログラム |
WO2013052555A1 (en) * | 2011-10-03 | 2013-04-11 | Kyaw Thu | Systems and methods for performing contextual classification using supervised and unsupervised training |
-
2014
- 2014-12-08 JP JP2014248130A patent/JP6368633B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016110440A (ja) | 2016-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mukhtar et al. | Urdu sentiment analysis using supervised machine learning approach | |
Yu et al. | Learning composition models for phrase embeddings | |
Bastian et al. | Linkedin skills: large-scale topic extraction and inference | |
JP5356197B2 (ja) | 単語意味関係抽出装置 | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
JP6187877B2 (ja) | 同義語抽出システム、方法および記録媒体 | |
Igarashi et al. | Tohoku at SemEval-2016 task 6: Feature-based model versus convolutional neural network for stance detection | |
Bhaskar et al. | Enhanced sentiment analysis of informal textual communication in social media by considering objective words and intensifiers | |
US11669740B2 (en) | Graph-based labeling rule augmentation for weakly supervised training of machine-learning-based named entity recognition | |
Huang et al. | Siamese network-based supervised topic modeling | |
Andrew | Automatic extraction of entities and relation from legal documents | |
Tschuggnall et al. | Enhancing authorship attribution by utilizing syntax tree profiles | |
Chandola et al. | Online resume parsing system using text analytics | |
CN114139537A (zh) | 词向量的生成方法及装置 | |
JP6368633B2 (ja) | 用語意味学習装置、用語意味判定装置、方法、及びプログラム | |
JP6495124B2 (ja) | 用語意味コード判定装置、用語意味コード判定モデル学習装置、方法、及びプログラム | |
JP2021501387A (ja) | 自然言語処理のための表現を抽出するための方法、コンピュータ・プログラム及びコンピュータ・システム | |
US11580499B2 (en) | Method, system and computer-readable medium for information retrieval | |
Maisha et al. | Supervised machine learning algorithms for sentiment analysis of Bangla newspaper | |
JP6232358B2 (ja) | 次発話候補ランキング装置、方法、及びプログラム | |
Majumder et al. | Event extraction from biomedical text using crf and genetic algorithm | |
Saha et al. | A transformer based multi-task model for domain classification, intent detection and slot-filling | |
Bouhoun et al. | Information Retrieval Using Domain Adapted Language Models: Application to Resume Documents for HR Recruitment Assistance | |
Umare et al. | A survey on machine learning techniques to extract chemical names from text documents | |
Saias | Senti. ue: Tweet overall sentiment classification approach for SemEval-2014 task 9 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171114 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180709 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6368633 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |