JP2011118814A - 自然言語処理プログラム及び自然言語処理装置 - Google Patents
自然言語処理プログラム及び自然言語処理装置 Download PDFInfo
- Publication number
- JP2011118814A JP2011118814A JP2009277560A JP2009277560A JP2011118814A JP 2011118814 A JP2011118814 A JP 2011118814A JP 2009277560 A JP2009277560 A JP 2009277560A JP 2009277560 A JP2009277560 A JP 2009277560A JP 2011118814 A JP2011118814 A JP 2011118814A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- syntax
- information
- parsing
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】コーパス変換装置1は、仕様Bの構文情報111Bに基づいて、学習コーパス111の文に構文解析の対象とする範囲の限定をブラケットによって付与するブラケット付与手段101と、ブラケットの付与前及び付与後において、文に仕様Aで構文解析を実行して、構文解析結果をそれぞれ出力する構文解析手段102と、構文情報111Aとブラケットの付与前及び付与後における構文解析結果との類似性を示すF値をそれぞれ求める構文解析評価手段103と、ブラケットの付与前及び付与後におけるF値の変化量と、ブラケット付与後の構文解析結果とを関連付けて学習する学習手段105とを有する。
【選択図】図1
Description
以下に、コーパス変換装置1の動作を図1〜11を参照しつつ、(1)学習動作と(2)識別動作とに分けて説明する。
図11は、コーパス変換装置1の学習動作例を示すフローチャートである。
図12(a)〜(b)は、識別用コーパス112の構成の一例を示す概略図である。
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々な変形が可能である。例えば、正例か負例かの判断は、F値が減少したか否かでなくとも、F値の減少が5以内の場合は正例、5より大きい場合は負例といったように、閾値で判断してもよい。また、F値以外の値を用いて構文の一致の度合いを算出してもよい。
Claims (4)
- コンピュータを、
学習対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記学習対象の文に構文解析の対象とする範囲の限定を付与する限定付与手段と、
前記範囲に限定しない前記学習対象の文と前記範囲に限定した前記学習対象の文とを対象にして、前記第1の仕様とは異なる第2の仕様の構文情報に基づいて構文解析を実行し、前記範囲に限定しない前記学習対象の文を対象にした前記第2の仕様に基づく第1の構文解析結果と前記範囲に限定した前記学習対象の文を対象にした前記第2の仕様に基づく第2の構文解析結果とをそれぞれ出力する構文解析手段と、
前記第2の仕様の構文情報と前記第1の構文解析結果の類似性を示す第1の評価結果と、前記第2の仕様の構文情報と前記第2の構文解析結果の類似性を示す第2の評価結果とを出力する評価手段と、
前記第1の評価結果と前記第2の評価結果の変化量と、前記第2の構文解析結果とを関連付けた情報を学習情報として記憶することで学習する学習手段として機能させるための自然言語処理プログラム。 - 前記限定付与手段は、識別対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記識別対象の文に構文解析の対象とする範囲の限定を付与し、
前記構文解析手段は、当該範囲に限定した前記識別対象の文を対象にして、前記第2の仕様の構文情報に基づいて構文解析して第3の構文解析結果を出力し、
前記第3の構文解析結果と類似する前記第2の構文解析結果を前記学習情報から抽出して、抽出された当該第2の構文解析結果に関連付けられた前記第1の評価結果と前記第2の評価結果の変化量を当該第3の構文解析結果に適用し、当該範囲の限定が妥当か否かを識別する識別手段として前記コンピュータをさらに機能させるための請求項1に記載の自然言語処理プログラム。 - 前記識別手段が妥当と識別した前記範囲の限定に対して得られた前記第3の構文解析結果を用いて、前記識別対象の文の構文情報を修正する修正手段として前記コンピュータをさらに機能させるための請求項2に記載の自然言語処理プログラム。
- 学習対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記学習対象の文に構文解析の対象とする範囲の限定を付与する限定付与手段と、
前記範囲に限定しない前記学習対象の文と前記範囲に限定した前記学習対象の文とを対象にして、前記第1の仕様とは異なる第2の仕様の構文情報に基づいて構文解析を実行し、前記範囲に限定しない前記学習対象の文を対象にした前記第2の仕様に基づく第1の構文解析結果と前記範囲に限定した前記学習対象の文を対象にした前記第2の仕様に基づく第2の構文解析結果とをそれぞれ出力する構文解析手段と、
前記第2の仕様の構文情報と前記第1の構文解析結果の類似性を示す第1の評価結果と、前記第2の仕様の構文情報と前記第2の構文解析結果の類似性を示す第2の評価結果とを出力する評価手段と、
前記第1の評価結果と前記第2の評価結果の変化量と、前記第2の構文解析結果とを関連付けた情報を学習情報として記憶することで学習する学習手段とを有する自然言語処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009277560A JP2011118814A (ja) | 2009-12-07 | 2009-12-07 | 自然言語処理プログラム及び自然言語処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009277560A JP2011118814A (ja) | 2009-12-07 | 2009-12-07 | 自然言語処理プログラム及び自然言語処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011118814A true JP2011118814A (ja) | 2011-06-16 |
Family
ID=44284031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009277560A Pending JP2011118814A (ja) | 2009-12-07 | 2009-12-07 | 自然言語処理プログラム及び自然言語処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011118814A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10067939B2 (en) | 2016-08-16 | 2018-09-04 | Samsung Electronics Co., Ltd. | Machine translation method and apparatus |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001350752A (ja) * | 2000-06-09 | 2001-12-21 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語解析装置、自然言語解析方法および記録媒体 |
JP2006018354A (ja) * | 2004-06-30 | 2006-01-19 | Advanced Telecommunication Research Institute International | テキスト分割装置及び自然言語処理装置 |
-
2009
- 2009-12-07 JP JP2009277560A patent/JP2011118814A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001350752A (ja) * | 2000-06-09 | 2001-12-21 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語解析装置、自然言語解析方法および記録媒体 |
JP2006018354A (ja) * | 2004-06-30 | 2006-01-19 | Advanced Telecommunication Research Institute International | テキスト分割装置及び自然言語処理装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10067939B2 (en) | 2016-08-16 | 2018-09-04 | Samsung Electronics Co., Ltd. | Machine translation method and apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6312942B2 (ja) | 言語モデル生成装置、言語モデル生成方法とそのプログラム | |
JP4940325B2 (ja) | 文書校正支援装置、方法およびプログラム | |
US20090094017A1 (en) | Multilingual Translation Database System and An Establishing Method Therefor | |
JP2012520528A (ja) | 自然言語テキストの自動的意味ラベリングのためのシステム及び方法 | |
Richter et al. | Korektor–a system for contextual spell-checking and diacritics completion | |
JP2008083952A (ja) | 辞書作成支援システム、方法及びプログラム | |
KR20160029587A (ko) | 단위 또는 약어의 풀네임 음성출력 방법 및 장치 | |
JP2016516247A (ja) | 翻字、翻訳、書記素洞察のキュレーション及び統合による多言語ビジネスの印の向上 | |
WO2011071174A1 (ja) | テキストマイニング方法、テキストマイニング装置及びテキストマイニングプログラム | |
Xiong et al. | Extended HMM and ranking models for Chinese spelling correction | |
Al-Ghamdi et al. | Exploring NLP web APIs for building Arabic systems | |
KR20170008357A (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
JP2008276543A (ja) | 対話処理装置、応答文生成方法、及び応答文生成処理プログラム | |
JP4361299B2 (ja) | 評価表現抽出装置、プログラム、及び記憶媒体 | |
JP2011118814A (ja) | 自然言語処理プログラム及び自然言語処理装置 | |
KR101626386B1 (ko) | 요소화 언어모델을 이용한 번역 오류 후처리 보정 방법 및 장치 | |
JP2016057810A (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
JP6375367B2 (ja) | 反論生成方法,反論生成システム | |
US20130103668A1 (en) | Question conversion for information searching | |
Noferesti et al. | A hybrid algorithm for recognizing the position of Ezafe constructions in Persian texts | |
Ganesh et al. | Grammar error detection tool for medical transcription using stop words parts-of-speech tags ngram based model | |
JP2010257085A (ja) | 検索装置、検索方法、および検索プログラム | |
JP5295576B2 (ja) | 自然言語解析装置、自然言語解析方法および自然言語解析プログラム | |
JP2006331246A (ja) | 意見分析処理方法、意見分析処理装置およびプログラム | |
JP2006243976A (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131022 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140527 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140723 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20141028 |