JP2011248633A - 解析モデル学習装置、解析モデル学習方法及び解析モデル学習プログラム - Google Patents
解析モデル学習装置、解析モデル学習方法及び解析モデル学習プログラム Download PDFInfo
- Publication number
- JP2011248633A JP2011248633A JP2010121257A JP2010121257A JP2011248633A JP 2011248633 A JP2011248633 A JP 2011248633A JP 2010121257 A JP2010121257 A JP 2010121257A JP 2010121257 A JP2010121257 A JP 2010121257A JP 2011248633 A JP2011248633 A JP 2011248633A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- analysis
- analysis result
- model learning
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】解析モデル学習装置1は、一度に読み込む訓練データ中の記事数を1記事または少数記事とし、それ以前に読み込まれた記事も含めて解析を行い解析結果の初期値を与えるベースライン解析部2と、訓練用データに対する解析結果を保持する解析結果テーブル3と、解析誤りデータからルールテンプレート5に基づいてルール候補を作成するルール候補作成部4と、それを保持するルール候補テーブル7と、ルール候補の中で最も正味の正解の増加数が大きくなるルールを選択するルール選択部6と、選択されたルールを保持する解析モデルテーブル9と、保持されたルールを、前記テーブル3に保持された訓練データに対する解析結果に適用し解析結果を変換するルール適用部8と、解析モデルテーブル9に保持されたルールを解析モデルとして外部に出力する出力部10とを備える。
【選択図】図1
Description
また上記の、条件部で頻度の高いルールを選びさらにその上位数十件について結論部で頻度の高いルールを選択する手法では、解析ルールが人間にとって理解しやすい利点が損なわれる短所がある。
図1は本発明の実施形態1に係る解析モデル学習装置の構成を示している。解析モデル学習装置1は、ベースライン解析部2と解析結果テーブル3とルール候補作成部4とルールテンプレート5とルール選択部6とルール候補テーブル7とルール適用部8と解析モデルテーブル9と出力部10とを備える。
2…ベースライン解析部
3…解析結果テーブル
4…ルール候補作成部
5…ルールテンプレート
6…ルール選択部
7…ルール候補テーブル
8…ルール適用部
9…解析モデルテーブル
10…出力部
Claims (9)
- 訓練用データから、テキスト解析のための解析モデルを学習する解析モデル学習装置であって、
前記訓練データ中の記事の総数よりも少ない数の記事を読み込み、それ以前に読み込まれている記事と前記読み込んだ記事とに対して解析を行い解析結果の初期値を与えるベースライン解析部と、
前記読み込んだ訓練用データに対する解析結果を記憶する解析結果テーブル記憶部と、
解析結果誤り修正用の変換ルールを抽出するためのテキストの特徴の集合であるルールテンプレートを予め記憶したルールテンプレート記憶部と、
前記読み込んだ記事に対する前記解析結果中の解析誤りデータから、前記ルールテンプレートを参照してルール候補を作成するルール候補作成部と、
前記ルール候補作成部で作成されたルール候補を記憶するルール候補テーブル記憶部と、
前記ルール候補テーブル記憶部中のルール候補の中でもっとも正味の正解の増加数が大きくなるルールを選択するルール選択部と、
前記ルール選択部で選択されたルールを記憶する解析モデルテーブル記憶部と、
前記解析モデルテーブル記憶部に保持されたルールを前記解析結果テーブル記憶部に記憶された訓練データに対する解析結果に適用し、解析結果を変換するルール適用部と、
を備えることを特徴とする解析モデル学習装置。 - 前記ベースライン解析部で読み込む記事の数は、1記事であることを特徴とする請求項1に記載の解析モデル学習装置。
- 請求項1又は2に記載の解析モデル学習装置において、前記ルール適用部は、訓練データ中の同一テキスト内で、1度のルール適用により変換した解析結果と同一となる解析結果を、前記変換した解析結果とは異なる解析結果に変換することを特徴とする解析モデル学習装置。
- 請求項1から3のいずれか1項に記載の解析モデル学習装置において、述語項構造解析の解析モデルを学習することを特徴とする解析モデル学習装置。
- 訓練用データから、テキスト解析のための解析モデルを学習する解析モデル学習方法であって、
解析モデル学習装置のベースライン解析部が、前記訓練データ中の記事の総数よりも少ない数の記事を読み込み、それ以前に読み込まれている記事と前記読み込んだ記事とに対して解析を行い解析結果の初期値を与えるベースライン解析ステップと、
前記解析結果を解析結果テーブル記憶部に格納するステップと、
解析モデル学習装置のルール候補作成部が、読み込まれている訓練用データに対する解析結果中の解析誤りデータから、解析結果誤り修正用の変換ルールを抽出するためのテキストの特徴の集合であるルールテンプレートに基づいて、ルール候補を作成するルール候補作成ステップと、
前記作成したルール候補をルール候補テーブル記憶部に格納するステップと、
解析モデル学習装置のルール選択部が、前記ルール候補テーブル中のルール候補の中でもっとも正味の正解の増加数が大きくなるルールを選択するルール選択ステップと、
前記選択したルールを解析モデルテーブル記憶部に格納するステップと、
解析モデル学習装置のルール適用部が、前記解析モデルテーブル記憶部に記憶されたルールを、前記解析結果テーブル記憶部に記憶された訓練データに対する解析結果に適用し、解析結果を変換するルール適用ステップと、
解析モデル学習装置の出力部が、解析モデルテーブル記憶部に記憶されたルールを解析モデルとして外部に出力するステップと、
を有することを特徴とする解析モデル学習方法。 - 前記ベースライン解析ステップにおいて、読み込む記事の数は1記事であることを特徴とする請求項5に記載の解析モデル学習方法。
- 請求項5又は6に記載の解析モデル学習方法において、前記ルール適用ステップは、訓練データ中の同一テキスト内で、1度のルール適用により変換した解析結果と同一となる解析結果を、前記変換した解析結果とは異なる解析結果に変換することを特徴とする解析モデル学習方法。
- 請求項5から7のいずれか1項に記載の解析モデル学習方法において、述語項構造解析の解析モデルを学習することを特徴とする解析モデル学習方法。
- コンピュータを請求項1から4のいずれか1項に記載の解析モデル学習装置を構成する各手段として機能させることを特徴とする解析モデル学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010121257A JP5466997B2 (ja) | 2010-05-27 | 2010-05-27 | 解析モデル学習装置、解析モデル学習方法及び解析モデル学習プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010121257A JP5466997B2 (ja) | 2010-05-27 | 2010-05-27 | 解析モデル学習装置、解析モデル学習方法及び解析モデル学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011248633A true JP2011248633A (ja) | 2011-12-08 |
JP5466997B2 JP5466997B2 (ja) | 2014-04-09 |
Family
ID=45413814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010121257A Active JP5466997B2 (ja) | 2010-05-27 | 2010-05-27 | 解析モデル学習装置、解析モデル学習方法及び解析モデル学習プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5466997B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013011985A (ja) * | 2011-06-28 | 2013-01-17 | Nippon Telegr & Teleph Corp <Ntt> | 解析モデル学習装置、方法、及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000040085A (ja) * | 1998-07-22 | 2000-02-08 | Hitachi Ltd | 日本語形態素解析処理の後処理方法および装置 |
-
2010
- 2010-05-27 JP JP2010121257A patent/JP5466997B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000040085A (ja) * | 1998-07-22 | 2000-02-08 | Hitachi Ltd | 日本語形態素解析処理の後処理方法および装置 |
Non-Patent Citations (4)
Title |
---|
CSNG200800063020; 定政 邦彦,安藤 真一,土井 伸一: 'SVMを用いた不要な曖昧性の除去による構文解析高速化の検討' 言語処理学会第12回年次大会発表論文集 , 20060313, p.121-124, 言語処理学会 * |
CSNG200800758131; 平 博順,永田 昌明: '構造学習を用いた述語項構造解析' 言語処理学会第14回年次大会発表論文集 , 20080317, p.556-p.559, 言語処理学会 * |
JPN6013047437; 定政 邦彦,安藤 真一,土井 伸一: 'SVMを用いた不要な曖昧性の除去による構文解析高速化の検討' 言語処理学会第12回年次大会発表論文集 , 20060313, p.121-124, 言語処理学会 * |
JPN6013047438; 平 博順,永田 昌明: '構造学習を用いた述語項構造解析' 言語処理学会第14回年次大会発表論文集 , 20080317, p.556-p.559, 言語処理学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013011985A (ja) * | 2011-06-28 | 2013-01-17 | Nippon Telegr & Teleph Corp <Ntt> | 解析モデル学習装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5466997B2 (ja) | 2014-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11106714B2 (en) | Summary generating apparatus, summary generating method and computer program | |
CN106502985B (zh) | 一种用于生成标题的神经网络建模方法及装置 | |
KR20190062413A (ko) | 인과 관계 인식 장치 및 그것을 위한 컴퓨터 프로그램 | |
CN108475262A (zh) | 用于文本处理的电子设备和方法 | |
WO2017198031A1 (zh) | 解析语义的方法和装置 | |
CN112579469A (zh) | 一种源代码缺陷检测方法与装置 | |
JP2019082931A (ja) | 検索装置、類似度算出方法、およびプログラム | |
CN111723192B (zh) | 代码推荐方法和装置 | |
CN112860896A (zh) | 语料泛化方法及用于工业领域的人机对话情感分析方法 | |
CN115470328A (zh) | 基于知识图谱的开放领域问答方法及相关设备 | |
US20100125448A1 (en) | Automated identification of documents as not belonging to any language | |
JPWO2019021804A1 (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
JP4005343B2 (ja) | 情報検索システム | |
JP5466997B2 (ja) | 解析モデル学習装置、解析モデル学習方法及び解析モデル学習プログラム | |
CN115203206A (zh) | 数据内容搜索方法、装置、计算机设备及可读存储介质 | |
Rofiq | Indonesian news extractive text summarization using latent semantic analysis | |
CN114969347A (zh) | 缺陷查重实现方法、装置、终端设备及存储介质 | |
CN111090720B (zh) | 一种热词的添加方法和装置 | |
JP2013011985A (ja) | 解析モデル学習装置、方法、及びプログラム | |
JP4576977B2 (ja) | 情報処理装置および方法、並びにプログラム | |
CN114722267A (zh) | 信息推送方法、装置及服务器 | |
JP4940251B2 (ja) | 文書処理プログラム及び文書処理装置 | |
JP6667875B2 (ja) | 要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム | |
JP2010170303A (ja) | 機械翻訳装置及びプログラム | |
CN111341404A (zh) | 一种基于ernie模型的电子病历数据组解析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121102 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5466997 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |