JP2013011985A - 解析モデル学習装置、方法、及びプログラム - Google Patents
解析モデル学習装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2013011985A JP2013011985A JP2011143418A JP2011143418A JP2013011985A JP 2013011985 A JP2013011985 A JP 2013011985A JP 2011143418 A JP2011143418 A JP 2011143418A JP 2011143418 A JP2011143418 A JP 2011143418A JP 2013011985 A JP2013011985 A JP 2013011985A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- analysis
- predicted value
- training sample
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】ベースライン解析部2で、解析対象、基本特徴量、及び正解を含む複数の訓練用サンプル各々に対して、解析結果の予測値を解析し、ルール候補作成部4で、解析誤りのある訓練用サンプルからルールテンプレート5に従って変換ルール候補を作成し、ルール選択部6で、変換ルール候補各々を適用した場合に、正味の正解増加数が最大となる変換ルール候補を選択し、ルール適用部8で、選択した変換ルールを全訓練用サンプルに適用し、解析誤りが0になるまでルールの生成及び適用を繰り返す。インデクス作成部10で、各訓練用サンプルに適用されたルールの履歴及び基本特徴量のインデクスを格納し、訓練ベクトル作成部12で、インデクスに基づいて訓練ベクトルを作成し、学習部14で、訓練ベクトルに基づいて解析モデルを学習する。
【選択図】図1
Description
2 ベースライン解析部
3 解析結果テーブル
4 ルール候補作成部
5 ルールテンプレート
6 ルール選択部
7 ルール候補テーブル
8 ルール適用部
9 ルール適用履歴テーブル
10 インデクス作成部
11 インデクステーブル
12 訓練ベクトル作成部
13 訓練ベクトルテーブル
14 学習部
15 解析モデルテーブル
16 出力部
18 記憶部
Claims (7)
- 単語または単語の組み合わせからなる解析対象、前記解析対象を含むテキストデータの特徴を示す基本特徴量、及び前記解析対象に対する正解を含む複数の訓練用サンプル各々に、前記解析対象に対する解析結果の予測値を付与する付与手段と、
前記訓練用サンプルに含まれる正解と前記予測値とが一致しない訓練用サンプルに含まれる基本特徴量を用いたルールであって、該ルールを適用して前記予測値を変換した場合に、前記正解と前記予測値との不一致が減少するルールを生成する生成手段と、
前記生成手段により生成されたルールを適用して、前記解析対象に対する解析結果の予測値を変換する変換手段と、
前記正解と前記予測値との不一致が予め定めた所定数以下となるまで、前記ルールの生成、及び前記予測値の変換を繰り返すように前記生成手段及び前記変換手段を制御すると共に、前記変換手段により解析結果が変換された場合に、適用されたルールの履歴を前記訓練用サンプル毎に所定の記憶領域に記憶するように制御する制御手段と、
前記制御手段により記憶された履歴から抽出される前記訓練用サンプル毎の組み合わせ特徴量、及び前記訓練用サンプル毎の基本特徴量に基づいて、テキストデータに含まれる解析結果が未知の解析対象を解析するための解析モデルを学習する学習手段と、
を含む解析モデル学習装置。 - 前記生成手段は、前記訓練用サンプルに含まれる正解と前記予測値とが一致しない訓練用サンプルに含まれる基本特徴量を用いた複数のルール候補を作成し、該複数のルール候補の中で、該ルール候補を適用した場合に、前記予測値の正解数の増加が最も大きくなるルール候補を、前記正解と前記予測値との不一致が減少するルールとして選択する請求項1記載の解析モデル学習装置。
- 前記生成手段は、前記正解と前記予測値とが一致しない訓練用サンプルに含まれる基本特徴量と、予め定めたルールテンプレートとに基づいて、前記ルールを生成する請求項1または請求項2記載の解析モデル学習装置。
- 前記学習手段は、前記訓練用サンプル毎の基本特徴量及び組み合わせ特徴量から訓練ベクトルを生成し、該訓練ベクトルに基づいて、前記解析モデルを学習する請求項1〜請求項3のいずれか1項記載の解析モデル学習装置。
- 前記学習手段は、線形サポートベクトルマシンを用いて、前記解析モデルを学習する請求項1〜請求項4のいずれか1項記載の解析モデル学習装置。
- 付与手段と、生成手段と、変換手段と、制御手段と、学習手段とを含む解析モデル学習装置における解析モデル学習方法であって、
前記付与手段は、単語または単語の組み合わせからなる解析対象、前記解析対象を含むテキストデータの特徴を示す基本特徴量、及び前記解析対象に対する正解を含む複数の訓練用サンプル各々に、前記解析対象に対する解析結果の予測値を付与し、
前記生成手段は、前記訓練用サンプルに含まれる正解と前記予測値とが一致しない訓練用サンプルに含まれる基本特徴量を用いたルールであって、該ルールを適用して前記予測値を変換した場合に、前記正解と前記予測値との不一致が減少するルールを生成し、
前記変換手段は、前記生成手段により生成されたルールを適用して、前記解析対象に対する解析結果の予測値を変換し、
前記制御手段は、前記正解と前記予測値との不一致が予め定めた所定数以下となるまで、前記ルールの生成、及び前記予測値の変換を繰り返すように前記生成手段及び前記変換手段を制御すると共に、前記変換手段により解析結果が変換された場合に、適用されたルールの履歴を前記訓練用サンプル毎に所定の記憶領域に記憶するように制御し、
前記学習手段は、前記制御手段により記憶された履歴から抽出される前記訓練用サンプル毎の組み合わせ特徴量、及び前記訓練用サンプル毎の基本特徴量に基づいて、テキストデータに含まれる解析結果が未知の解析対象を解析するための解析モデルを学習する
解析モデル学習方法。 - コンピュータを、請求項1〜請求項5のいずれか1項記載の解析モデル学習装置を構成する各手段として機能させるための解析モデル学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011143418A JP2013011985A (ja) | 2011-06-28 | 2011-06-28 | 解析モデル学習装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011143418A JP2013011985A (ja) | 2011-06-28 | 2011-06-28 | 解析モデル学習装置、方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013011985A true JP2013011985A (ja) | 2013-01-17 |
Family
ID=47685830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011143418A Pending JP2013011985A (ja) | 2011-06-28 | 2011-06-28 | 解析モデル学習装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013011985A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014215920A (ja) * | 2013-04-26 | 2014-11-17 | 日本電信電話株式会社 | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム |
US20170098239A1 (en) * | 2015-10-02 | 2017-04-06 | Adobe Systems Incorporated | Prediction of content performance in content delivery based on presentation context |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011248633A (ja) * | 2010-05-27 | 2011-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 解析モデル学習装置、解析モデル学習方法及び解析モデル学習プログラム |
-
2011
- 2011-06-28 JP JP2011143418A patent/JP2013011985A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011248633A (ja) * | 2010-05-27 | 2011-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 解析モデル学習装置、解析モデル学習方法及び解析モデル学習プログラム |
Non-Patent Citations (6)
Title |
---|
CSNG199800474006; 松本 裕治 外2名: '誤り駆動型の確率モデル学習による日本語形態素解析' 情報処理学会研究報告 第98巻 第21号, 19980312, P.41〜48, 社団法人情報処理学会 * |
CSNG200100732008; 正富 欣之 外2名: '実例からの帰納的学習を用いた構文解析手法' 電子情報通信学会技術研究報告 第99巻 第691号, 20000316, P.57〜64, 社団法人電子情報通信学会 * |
CSNG200401461012; 中川 哲治 外2名: 'Support Vector Machineを用いた形態素解析と修正学習法の提案' 情報処理学会論文誌 第44巻 第5号, 20030515, P.1354〜1367, 社団法人情報処理学会 * |
JPN6014003637; 松本 裕治 外2名: '誤り駆動型の確率モデル学習による日本語形態素解析' 情報処理学会研究報告 第98巻 第21号, 19980312, P.41〜48, 社団法人情報処理学会 * |
JPN6014003639; 正富 欣之 外2名: '実例からの帰納的学習を用いた構文解析手法' 電子情報通信学会技術研究報告 第99巻 第691号, 20000316, P.57〜64, 社団法人電子情報通信学会 * |
JPN6014003641; 中川 哲治 外2名: 'Support Vector Machineを用いた形態素解析と修正学習法の提案' 情報処理学会論文誌 第44巻 第5号, 20030515, P.1354〜1367, 社団法人情報処理学会 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014215920A (ja) * | 2013-04-26 | 2014-11-17 | 日本電信電話株式会社 | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム |
US20170098239A1 (en) * | 2015-10-02 | 2017-04-06 | Adobe Systems Incorporated | Prediction of content performance in content delivery based on presentation context |
US10748178B2 (en) * | 2015-10-02 | 2020-08-18 | Adobe Inc. | Prediction of content performance in content delivery based on presentation context |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7259650B2 (ja) | 翻訳装置、翻訳方法及びプログラム | |
CN108475262A (zh) | 用于文本处理的电子设备和方法 | |
CN112069295B (zh) | 相似题推荐方法、装置、电子设备和存储介质 | |
Plepi et al. | Context transformer with stacked pointer networks for conversational question answering over knowledge graphs | |
CN111368082A (zh) | 一种基于层次网络的领域自适应词嵌入的情感分析方法 | |
CN112860896A (zh) | 语料泛化方法及用于工业领域的人机对话情感分析方法 | |
Aralikatte et al. | Rewarding coreference resolvers for being consistent with world knowledge | |
US20220245361A1 (en) | System and method for managing and optimizing lookup source templates in a natural language understanding (nlu) framework | |
Hara et al. | Evaluating the impact of re-training a lexical disambiguation model on domain adaptation of an HPSG parser | |
Liu et al. | Augmenting multi-turn text-to-SQL datasets with self-play | |
CN117193823A (zh) | 一种软件需求变更的代码工作量评估方法、系统及设备 | |
CN111723583A (zh) | 基于意图角色的语句处理方法、装置、设备及存储介质 | |
Surendran et al. | Conversational AI-A retrieval based chatbot | |
Adewoyin et al. | RSTGen: imbuing fine-grained interpretable control into long-FormText generators | |
CN115906818A (zh) | 语法知识预测方法、装置、电子设备和存储介质 | |
JP2013011985A (ja) | 解析モデル学習装置、方法、及びプログラム | |
CN113761875B (zh) | 事件抽取方法、装置、电子设备及存储介质 | |
CN116483314A (zh) | 一种自动化智能活动图生成方法 | |
CN114969347A (zh) | 缺陷查重实现方法、装置、终端设备及存储介质 | |
Aliero et al. | Systematic review on text normalization techniques and its approach to non-standard words | |
He et al. | [Retracted] Application of Grammar Error Detection Method for English Composition Based on Machine Learning | |
CN113326348A (zh) | 一种博客质量评估方法及工具 | |
CN114547321A (zh) | 一种基于知识图谱的答案生成方法、装置及电子设备 | |
CN113822053A (zh) | 一种语法错误检测方法、装置、电子设备及存储介质 | |
Sampath et al. | Hybrid Tamil spell checker with combined character splitting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130729 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140204 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141007 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150217 |