JP5220676B2 - 能動学習装置及び方法 - Google Patents
能動学習装置及び方法 Download PDFInfo
- Publication number
- JP5220676B2 JP5220676B2 JP2009094374A JP2009094374A JP5220676B2 JP 5220676 B2 JP5220676 B2 JP 5220676B2 JP 2009094374 A JP2009094374 A JP 2009094374A JP 2009094374 A JP2009094374 A JP 2009094374A JP 5220676 B2 JP5220676 B2 JP 5220676B2
- Authority
- JP
- Japan
- Prior art keywords
- clause
- relationship
- correct
- phrase
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 45
- 238000004458 analytical method Methods 0.000 claims description 126
- 238000011156 evaluation Methods 0.000 claims description 45
- 230000001174 ascending effect Effects 0.000 claims description 14
- 238000012706 support-vector machine Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
(イ)前記第3の文節の前記識別情報が、前記第2の文節の前記識別情報より大きい場合は、前記第1の文節が前記第2の文節に係らないことを示す正解データを作成し、かつ、前記第1の文節が前記第3の文節に係ることを示す正解データを作成する。
(ロ)前記第3の文節の前記識別情報が、前記第2の文節の前記識別情報に等しい場合は、前記第1の文節が前記第3の文節に係ることを示す正解データを作成する。
(ハ)前記第3の文節の前記識別情報が、前記第1の文節の前記識別情報より大きく前記第2の文節の識別情報より小さい場合は、前記第1の文節が前記第3の文節に係ることを示す正解データを作成し、かつ、前記第1の文節が前記第2の文節に係らないことを示す正解データを作成しない。
(イ)第3の文節の前記識別情報が、第2の文節の前記識別情報より大きい場合は、第1の文節が第2の文節に係らないことを示す正解データを作成し、かつ、第1の文節が第3の文節に係ることを示す正解データを作成する。
(ロ)第3の文節の前記識別情報が、第2の文節の前記識別情報に等しい場合は、第1の文節が第3の文節に係ることを示す正解データを作成する。
(ハ)第3の文節の前記識別情報が、第1の文節の前記識別情報より大きく第2の文節の前記識別情報より小さい場合は、第1の文節が第3の文節に係ることを示す正解データを作成し、かつ、第1の文節が第2の文節に係らないことを示す正解データを作成しない。
図1は、本発明の一実施形態に係る能動学習装置10の特徴を示す機能ブロック図である。
実施例2に係る能動学習装置10は、実施例1の図1〜図3と同様の構成を備えている。そして、訓練事例の1文を構成する全ての文節の係り関係について正解データを受け付ける必要はなく、一部の文節の係り関係についてのみ正しい係り関係を明確にした情報を受け付けることにより、正解事例データDB41に正解データを追加する。
(イ)j<i<kの場合:第j番目の文節が第i番目の文節に係らないという正解事例を加え、かつ、第j番目の文節が第k番目の文節に係るという正解事例を加える。
(ロ)j<i=kの場合:第j番目の文節が第k番目の文節に係るという正解事例を加える。
(ハ)j<k<iの場合:第j番目の文節が第k番目の文節に係るという正解事例を加え、かつ、第j番目の文節が第i番目の文節に係らないという正解事例は加えない(すなわち、第j番目の文節が第i番目の文節に係らないという正解事例は作成しない)。
(イ)j<i<kの場合:第j番目の文節が第i番目の文節に係らないという正解事例を加え、かつ、第j番目の文節が第k番目の文節に係るという正解事例を加える。更に、k−1>jの場合、第k番目の文節の直前の第(k−1)番目の文節は第k番目の文節に係るという正解事例を加える。
(ロ)j<i=kの場合:第j番目の文節が第k番目の文節に係るという正解事例を加える。更に、k−1>jの場合、第k番目の文節の直前の第(k−1)番目の文節は第k番目の文節に係るという正解事例を加える。
(ハ)j<k<iの場合:第j番目の文節が第k番目の文節に係るという正解事例を加え、かつ、第j番目の文節が第i番目の文節に係らないという正解事例は加えない(すなわち、第j番目の文節が第i番目の文節に係らないという正解事例は作成しない)。更に、k−1>jの場合、第k番目の文節の直前の第(k−1)番目の文節は第k番目の文節に係るという正解事例を加える。
(イ)j<i<kの場合は、文節jが文節iに係らないという正解データを作成し、かつ、文節jが文節kに係るという正解データを作成する。
(ロ)j<i=kの場合は、文節jが文節kに係るという正解データを作成する。
(ハ)j<k<iの場合は、文節jが文節kに係るという正解データを作成し、かつ、文節jが文節iに係らないという正解データを作成しない。
(イ)第3の文節が、第2の文節より後ろに位置する場合は、第1の文節が第2の文節に係らないことを示す正解データを作成し、かつ、第1の文節が第3の文節に係ることを示す正解データを作成し、
(ロ)第3の文節が、第2の文節に等しい場合は、第1の文節が第3の文節に係ることを示す正解データを作成し、
(ハ)第3の文節が、第1の文節と第2の文節との間に位置する場合は、第1の文節が第3の文節に係ることを示す正解データを作成し、かつ、第1の文節が第2の文節に係らないことを示す正解データを作成しない。
そして、作成した正解データを正解事例データDB41に追加し、追加された正解事例データDB41に基づいて係り関係モデルDB31を更新する。したがって、正解データとして入力された係り先の文節の後ろの文節までも、係らないという正解データを作成し、必要としていない事例までも追加してしまう場合と比較して、更に、係り受け解析の精度を向上させることができる。
11 モデル作成部
12 係り受け解析部
13 選択部
14 正解受付部
15 正解事例追加部
31 係り関係モデルDB
32 解析結果DB
41 正解事例データDB
Claims (9)
- 日本語を構成する文節の係り関係を解析する係り受け解析について能動学習する能動学習装置であって、
前記文節の係り関係の正解事例データに基づいて、文節の係り関係を判定する係り関係モデルを作成し、記憶するモデル作成手段と、
一文を構成する一部の文節を含む当該一文を前記係り関係モデルを用いて前記係り受け解析を行い、解析結果を出力する係り受け解析手段と、
前記係り受け解析手段が出力した解析結果から前記一文を構成する一部の文節から、係り関係を有すると判定された第1の文節と第2の文節とからなる文節のペアを選択する選択手段と、
前記選択した文節のペアをユーザ端末に提示し、第3の文節を前記ユーザ端末から受け付ける正解受付手段と、
前記第1の文節、前記第2の文節および前記第3の文節の前記一文における位置関係に応じて、異なる正解データを作成し正解事例データに追加する正解事例追加手段と、を備え、
前記モデル作成手段は、前記追加された正解事例データに基づいて前記係り関係モデルを更新することを特徴とする能動学習装置。 - 前記係り受け解析手段は、前記係り関係モデルを用いるサポートベクトルマシンの出力を前記係り受け解析の解析結果として出力することを特徴とする請求項1に記載の能動学習装置。
- 前記係り関係モデルは、文節の係り関係を判定するために、文節間の特徴量と評価値との組を用いることを特徴とする請求項1又は2に記載の能動学習装置。
- 前記所定の場合は、前記係り受け解析手段が出力した解析結果としての評価値を順次比較した中で、前記評価値が最も小さい場合であることを特徴とする請求項1乃至3のいずれかに記載の能動学習装置。
- 前記文節のペアを構成する前記第1の文節及び前記第2の文節と、前記正解受付手段が受け付けた前記第3の文節とにおいて、前記第1の文節の識別情報(文中での順番を表す識別番号)が前記第2の文節の前記識別情報より小さい場合であって、
前記正解事例追加手段は、前記第1の文節及び前記第2の文節と前記第3の文節との位置関係により下記(イ)、(ロ)又は(ハ)のいずれかの手順によって正解データを作成し、作成した前記正解データを正解事例データに追加する、ことを特徴とする請求項1乃至4のいずれかに記載の能動学習装置。
(イ)前記第3の文節の前記識別情報が、前記第2の文節の前記識別情報より大きい場合は、前記第1の文節が前記第2の文節に係らないことを示す正解データを作成し、かつ、前記第1の文節が前記第3の文節に係ることを示す正解データを作成する。
(ロ)前記第3の文節の前記識別情報が、前記第2の文節の前記識別情報に等しい場合は、前記第1の文節が前記第3の文節に係ることを示す正解データを作成する。
(ハ)前記第3の文節の前記識別情報が、前記第1の文節の前記識別情報より大きく前記第2の文節の識別情報より小さい場合は、前記第1の文節が前記第3の文節に係ることを示す正解データを作成し、かつ、前記第1の文節が前記第2の文節に係らないことを示す正解データを作成しない。 - 前記(イ)、(ロ)又は(ハ)の各々の手順において、前記正解データを作成すると共に、前記第3の文節の直前の文節の前記識別情報が前記第1の文節の前記識別情報より大きい場合に、前記第3の文節の直前の文節が前記第3の文節に係ることを示す正解データを作成し、作成した正解データを正解事例データに追加する、ことを特徴とする請求項5に記載の能動学習装置。
- 前記選択手段は、文節のペアについて前記係り受け解析手段が出力した解析結果としての評価値を順次比較した中で、前記評価値が小さい順に前記文節のペアを選択し、
前記正解受付手段は、前記選択手段が選択した前記文節のペアをユーザ端末に提示し、提示した前記文節のペアの係り関係ごとに、正しい係り先文節の情報を前記ユーザ端末から受け付ける、ことを特徴とする請求項1乃至6のいずれかに記載の能動学習装置。 - 前記提示において、前記正解受付手段は、前記文節のペアを含む文について、文節の係り関係を示す表示をし、前記文節のペアの係り関係ごとに、正しい係り先文節の情報の入力を受け付け、受け付けた該情報に基づいて前記文節の係り関係を示す表示を改めて表示する、ことを特徴とする請求項7に記載の能動学習装置。
- 能動学習装置が実行する、日本語を構成する文節の係り関係を解析する係り受け解析について能動学習する方法であって、
前記文節の係り関係の正解事例データに基づいて、文節の係り関係を判定する係り関係モデルを作成し、記憶するステップと、
一文を構成する一部の文節を含む当該一文を前記係り関係モデルを用いて前記係り受け解析を行い、解析結果を出力するステップと、
前記係り受け解析手段が出力した解析結果から前記一文を構成する一部の文節から、係り関係を有すると判定された第1の文節と第2の文節とからなる文節のペアを選択するステップと、
前記選択した文節のペアをユーザ端末に提示し、第3の文節を前記ユーザ端末から受け付けるステップと、
前記第1の文節、前記第2の文節および前記第3の文節の前記一文における位置関係に応じて、異なる正解データを作成し正解事例データに追加するステップと、
前記追加された正解事例データに基づいて前記係り関係モデルを更新するステップと、
を備えることを特徴とする方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009094374A JP5220676B2 (ja) | 2008-11-20 | 2009-04-08 | 能動学習装置及び方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008297282 | 2008-11-20 | ||
JP2008297282 | 2008-11-20 | ||
JP2009094374A JP5220676B2 (ja) | 2008-11-20 | 2009-04-08 | 能動学習装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010152858A JP2010152858A (ja) | 2010-07-08 |
JP5220676B2 true JP5220676B2 (ja) | 2013-06-26 |
Family
ID=42571833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009094374A Active JP5220676B2 (ja) | 2008-11-20 | 2009-04-08 | 能動学習装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5220676B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5823441B2 (ja) * | 2013-04-26 | 2015-11-25 | 日本電信電話株式会社 | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム |
JP6391617B2 (ja) * | 2016-03-18 | 2018-09-19 | ヤフー株式会社 | 学習装置、文章自動生成装置および学習方法 |
-
2009
- 2009-04-08 JP JP2009094374A patent/JP5220676B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010152858A (ja) | 2010-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9727553B2 (en) | System and method for generating and using user semantic dictionaries for natural language processing of user-provided text | |
CN108304375A (zh) | 一种信息识别方法及其设备、存储介质、终端 | |
US9047275B2 (en) | Methods and systems for alignment of parallel text corpora | |
CN108038725A (zh) | 一种基于机器学习的电商产品客户满意度分析方法 | |
JPH05197712A (ja) | 共起辞書構築・更新方法と共起・意味解析方法 | |
WO2010038540A1 (ja) | テキストセグメントを有する文書から用語を抽出するためのシステム | |
CN103324609A (zh) | 文本校对装置和文本校对方法 | |
CN105045777A (zh) | 使用互联网语料库的自动的上下文相关的语言校正和增强 | |
KR20080021017A (ko) | 텍스트 기반의 문서 비교 | |
CN111382260A (zh) | 一种检索文本纠错方法、装置和存储介质 | |
RU2646380C1 (ru) | Использование верифицированных пользователем данных для обучения моделей уверенности | |
CN112613321A (zh) | 一种抽取文本中实体属性信息的方法及系统 | |
Ünal et al. | A hierarchical approach to makam classification of Turkish makam music, using symbolic data | |
CN115860006A (zh) | 一种基于语义句法的方面级情感预测方法及装置 | |
JP5220676B2 (ja) | 能動学習装置及び方法 | |
RU2640718C1 (ru) | Верификация атрибутов информационных объектов | |
CN112988962B (zh) | 文本纠错方法、装置、电子设备及存储介质 | |
CN111949781B (zh) | 一种基于自然语句句法分析的智能交互方法及装置 | |
CN114580556A (zh) | 专利文献的预评估方法及装置 | |
CN112071304B (zh) | 一种语意分析方法及装置 | |
CN114595684A (zh) | 一种摘要生成方法、装置、电子设备及存储介质 | |
Romanchuk et al. | Intellectual Analysis System Project for Ukrainian-language Artistic Works to Determine the Text Authorship Attribution Probability | |
CN113901203A (zh) | 一种文本分类方法、装置、电子设备及存储介质 | |
Stehouwer | Statistical language models for alternative sequence selection | |
KR20210003540A (ko) | 복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120702 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130306 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160315 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5220676 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |