JP7052395B2 - 学習プログラム、学習方法および学習装置 - Google Patents
学習プログラム、学習方法および学習装置 Download PDFInfo
- Publication number
- JP7052395B2 JP7052395B2 JP2018022708A JP2018022708A JP7052395B2 JP 7052395 B2 JP7052395 B2 JP 7052395B2 JP 2018022708 A JP2018022708 A JP 2018022708A JP 2018022708 A JP2018022708 A JP 2018022708A JP 7052395 B2 JP7052395 B2 JP 7052395B2
- Authority
- JP
- Japan
- Prior art keywords
- documents
- learning
- items
- cause
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
訓練データのサンプル数:正例=186件、負例=39,000件
精度:Precision=98.8%、Recall=86.0%
第2のケース:
訓練データのサンプル数:正例=3件、負例=0件
精度:Precision=0.6%、Recall=67.2%
第3のケース:
訓練データのサンプル数:正例=3件、負例=0件
上記に追加した正解:正例=5件、負例=10,000件
精度:Precision=54.8%、Recall=12.1%
学習対象となる前記特定の対象の複数の文書について、現象および原因が共通である複数の文書それぞれに対し、当該文書間で共通する項目を抽出し、
前記抽出された複数の文書に含まれる項目の出現頻度に基づき、前記複数の文書を順序づけ、
前記順序づけ結果に応じて、前記複数の文書それぞれに対し、正例、または、負例のラベルを付与し、
前記複数の文書および前記付与されたラベルを用いて、前記モデルの学習を行う、
処理をコンピュータに実行させることを特徴とする学習プログラム。
ことを特徴とする付記1に記載の学習プログラム。
ことを特徴とする付記1または2に記載の学習プログラム。
学習対象となる前記特定の対象の複数の文書について、現象および原因が共通である複数の文書それぞれに対し、当該文書間で共通する項目を抽出し、
前記抽出された複数の文書に含まれる項目の出現頻度に基づき、前記複数の文書を順序づけ、
前記順序づけ結果に応じて、前記複数の文書それぞれに対し、正例、または、負例のラベルを付与し、
前記複数の文書および前記付与されたラベルを用いて、前記モデルの学習を行う、
処理をコンピュータが実行することを特徴とする学習方法。
ことを特徴とする付記4に記載の学習方法。
ことを特徴とする付記4または5に記載の学習方法。
学習対象となる前記特定の対象の複数の文書について、現象および原因が共通である複数の文書それぞれに対し、当該文書間で共通する項目を抽出する抽出処理部と、
前記抽出された複数の文書に含まれる項目の出現頻度に基づき、前記複数の文書を順序づけるランキング部と、
前記順序づけ結果に応じて、前記複数の文書それぞれに対し、正例、または、負例のラベルを付与するラベル付与部と、
前記複数の文書および前記付与されたラベルを用いて、前記モデルの学習を行う学習部と、
を有することを特徴とする学習装置。
ことを特徴とする付記7に記載の学習装置。
ことを特徴とする付記7または8に記載の学習装置。
2…コンピュータ
10…不具合事例DB
11…不具合事例
12、13…フィールド障害レポート
20…判定モデル
21…抽出処理部
22…素性生成部
23…ランキング部
24…ラベル付与部
25…学習部
26…判別部
27…出力部
101…CPU
102…入力装置
103…モニタ
104…スピーカ
105…媒体読取装置
106…インタフェース装置
107…通信装置
108…RAM
109…ハードディスク装置
110…バス
111…プログラム
112…各種データ
Claims (5)
- コンピュータに、特定の対象に関する事象についての、現象と原因と、前記対象に関する複数の項目とを含む文書の判別を行うモデルの学習をさせる学習プログラムであって、
学習対象となる前記特定の対象の複数の第1の文書について、現象および原因が共通である複数の前記第1の文書それぞれに対し、当該第1の文書間で共通する項目を抽出し、
抽出された複数の前記第1の文書に含まれる項目の、学習対象となる特定の対象の複数の第2の文書の出現頻度に基づき、前記複数の第2の文書を順序づけ、
前記順序づけ結果に応じて、前記複数の第2の文書それぞれに対し、正例、または、負例のラベルを付与し、
前記複数の第2の文書および前記付与されたラベルを用いて、前記モデルの学習を行う、
処理をコンピュータに実行させることを特徴とする学習プログラム。 - 前記抽出する処理は、前記特定の対象の複数の第1の文書に含まれる項目ごとの、出現頻度に応じた重みづけをもとに、絞り込みを行った項目の中から前記共通する項目を抽出する、
ことを特徴とする請求項1に記載の学習プログラム。 - 前記付与する処理は、前記順序づけによる順位が所定の順位以下である第2の文書に負例のラベルを付与する、
ことを特徴とする請求項1または2に記載の学習プログラム。 - コンピュータが、特定の対象に関する事象についての、現象と原因と、前記対象に関する複数の項目とを含む文書の判別を行うモデルの学習をする学習方法であって、
学習対象となる前記特定の対象の複数の第1の文書について、現象および原因が共通である複数の前記第1の文書それぞれに対し、当該第1の文書間で共通する項目を抽出し、
抽出された複数の前記第1の文書に含まれる項目の、学習対象となる特定の対象の複数の第2の文書の出現頻度に基づき、前記複数の第2の文書を順序づけ、
前記順序づけ結果に応じて、前記複数の第2の文書それぞれに対し、正例、または、負例のラベルを付与し、
前記複数の第2の文書および前記付与されたラベルを用いて、前記モデルの学習を行う、
処理をコンピュータが実行することを特徴とする学習方法。 - 特定の対象に関する事象についての、現象と原因と、前記対象に関する複数の項目とを含む文書の判別を行うモデルの学習をする学習装置であって、
学習対象となる前記特定の対象の複数の第1の文書について、現象および原因が共通である複数の前記第1の文書それぞれに対し、当該第1の文書間で共通する項目を抽出する抽出処理部と、
抽出された複数の前記第1の文書に含まれる項目の、学習対象となる特定の対象の複数の第2の文書の出現頻度に基づき、前記複数の第2の文書を順序づけるランキング部と、
前記順序づけ結果に応じて、前記複数の第2の文書それぞれに対し、正例、または、負例のラベルを付与するラベル付与部と、
前記複数の第2の文書および前記付与されたラベルを用いて、前記モデルの学習を行う学習部と、
を有することを特徴とする学習装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018022708A JP7052395B2 (ja) | 2018-02-13 | 2018-02-13 | 学習プログラム、学習方法および学習装置 |
US16/268,958 US20190251100A1 (en) | 2018-02-13 | 2019-02-06 | Learning method and learning apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018022708A JP7052395B2 (ja) | 2018-02-13 | 2018-02-13 | 学習プログラム、学習方法および学習装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019139534A JP2019139534A (ja) | 2019-08-22 |
JP7052395B2 true JP7052395B2 (ja) | 2022-04-12 |
Family
ID=67542313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018022708A Active JP7052395B2 (ja) | 2018-02-13 | 2018-02-13 | 学習プログラム、学習方法および学習装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20190251100A1 (ja) |
JP (1) | JP7052395B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024157419A1 (ja) * | 2023-01-26 | 2024-08-02 | 富士通株式会社 | 情報処理プログラム,情報処理装置及び情報処理方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017049681A (ja) | 2015-08-31 | 2017-03-09 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
-
2018
- 2018-02-13 JP JP2018022708A patent/JP7052395B2/ja active Active
-
2019
- 2019-02-06 US US16/268,958 patent/US20190251100A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017049681A (ja) | 2015-08-31 | 2017-03-09 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20190251100A1 (en) | 2019-08-15 |
JP2019139534A (ja) | 2019-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11928567B2 (en) | System and method for improving machine learning models by detecting and removing inaccurate training data | |
AU2019261735B2 (en) | System and method for recommending automation solutions for technology infrastructure issues | |
US10417350B1 (en) | Artificial intelligence system for automated adaptation of text-based classification models for multiple languages | |
Elmurngi et al. | An empirical study on detecting fake reviews using machine learning techniques | |
US20190318407A1 (en) | Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof | |
CN110866799B (zh) | 使用人工智能监视在线零售平台的系统和方法 | |
US7840521B2 (en) | Computer-based method and system for efficient categorizing of digital documents | |
Soni et al. | Sentiment analysis of customer reviews based on hidden markov model | |
US20160189057A1 (en) | Computer implemented system and method for categorizing data | |
US11550707B2 (en) | Systems and methods for generating and executing a test case plan for a software product | |
JP7409484B2 (ja) | リスク評価装置、リスク評価方法およびプログラム | |
JP7261095B2 (ja) | ビジネスマッチング支援装置、及びビジネスマッチング支援方法 | |
JP5331023B2 (ja) | 重要語抽出装置、重要語抽出方法及び重要語抽出プログラム | |
JP7052395B2 (ja) | 学習プログラム、学習方法および学習装置 | |
US11580499B2 (en) | Method, system and computer-readable medium for information retrieval | |
JP4054046B2 (ja) | 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
Ghaffari et al. | Generative-AI in E-Commerce: Use-Cases and Implementations | |
US20210233007A1 (en) | Adaptive grouping of work items | |
US20230046851A1 (en) | Multi-model approach to natural language processing and recommendation generation | |
JP2018067215A (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
Harfoushi et al. | Amazon Machine Learning vs. Microsoft Azure Machine Learning as Platforms for Sentiment Analysis | |
JP2017188025A (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
Geojini et al. | Feature Adaptive Developmental Mechanisms for Mobile Apps Recommendations System using the Nearest Centroid Classification Algorithm | |
JP7354721B2 (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
CN111126033A (zh) | 文章的回应预测装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210928 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7052395 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |