JP2009176062A - 自然言語解析装置、自然言語解析方法および自然言語解析プログラム - Google Patents
自然言語解析装置、自然言語解析方法および自然言語解析プログラム Download PDFInfo
- Publication number
- JP2009176062A JP2009176062A JP2008014133A JP2008014133A JP2009176062A JP 2009176062 A JP2009176062 A JP 2009176062A JP 2008014133 A JP2008014133 A JP 2008014133A JP 2008014133 A JP2008014133 A JP 2008014133A JP 2009176062 A JP2009176062 A JP 2009176062A
- Authority
- JP
- Japan
- Prior art keywords
- dependency
- analysis
- natural language
- sentence
- grouping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 124
- 238000000034 method Methods 0.000 claims abstract description 34
- 230000000877 morphologic effect Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 25
- 238000012986 modification Methods 0.000 abstract description 7
- 230000004048 modification Effects 0.000 abstract description 7
- 230000008520 organization Effects 0.000 abstract 2
- 239000002245 particle Substances 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 7
- 238000012706 support-vector machine Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】文節に区切ることが可能で、文節間の係り受け関係が存在する自然言語文を解析する自然言語解析装置であって、解析対象の文を形態素に分解する形態素解析手段と、形態素列の各単語間の依存関係を決定してくことで、文節のまとめ上げと係り受け解析とを行う文節まとめ上げ係り受け解析手段とを備え、前記文節まとめ上げ係り受け解析手段は、前記解析対象の文末まで前記文節のまとめ上げを行う過程で、文節の先頭の検出を行いながら依存先が未確定の単語をスタックしていき、依存関係の判定により文節の区切りが決定した後に、スタックに蓄積された単語の依存関係の決定を行って文節間の係り受けを決定する。
【選択図】図1
Description
(1)文節をまとめるための処理モジュールと、文節間の係り受け関係を解析する処理モジュールとが別途必要になり、プログラムの開発およびメンテナンスが困難となる。
(2)文節にまとめ上げる処理と係り受け解析処理とで、文を何度もスキャン(読取)する必要があり、処理が遅くなる。
(1)文節をまとめるための処理モジュールと、文節間の係り受けを解析する処理モジュールとを別途用意する必要がなく、プログラムの開発およびメンテナンスを容易にすることができる。
(2)文節にまとめ上げる処理と係り受け解析処理とで、文を何度もスキャン(読取)する必要がなく、処理を速めることができる。
101 解析対象文入力部
102 形態素解析部
103 解析文格納部
104 一文読み取り部
105 文節まとめ上げ係り受け解析部
106 依存元単語ID格納エリア
107 依存先候補単語ID格納エリア
108 依存先未決スタック
109 依存関係判定部
1091 教師データ入力部
1092 機械学習部
1093 文法ルール記憶部
1094 依存関係判定要求受付部
1095 依存関係判定実行部
110 文法定義テーブル
111 解析結果出力部
Claims (5)
- 文節に区切ることが可能で、文節間の係り受け関係が存在する自然言語文を解析する自然言語解析装置であって、
解析対象の文を形態素に分解する形態素解析手段と、
形態素列の各単語間の依存関係を決定してくことで、文節のまとめ上げと係り受け解析とを行う文節まとめ上げ係り受け解析手段と
を備え、
前記文節まとめ上げ係り受け解析手段は、
前記解析対象の文末まで前記文節のまとめ上げを行う過程で、文節の先頭の検出を行いながら依存先が未確定の単語をスタックしていき、依存関係の判定により文節の区切りが決定した後に、スタックに蓄積された単語の依存関係の決定を行って文節間の係り受けを決定する
ことを特徴とする自然言語解析装置。 - 請求項1に記載の自然言語解析装置において、
前記文節まとめ上げ係り受け解析手段における依存関係の判定は、依存元および依存先候補の単語の品詞、位置関係等の条件に応じた判定結果のタイプを対応付けた文法定義テーブルに基づいて行う
ことを特徴とする自然言語解析装置。 - 請求項1に記載の自然言語解析装置において、
前記文節まとめ上げ係り受け解析手段における依存関係の判定は、SVMにより機械学習された文法ルールに基づいて行う
ことを特徴とする自然言語解析装置。 - 文節に区切ることが可能で、文節間の係り受け関係が存在する自然言語文を解析する自然言語解析方法であって、
解析対象の文を形態素に分解する形態素解析工程と、
形態素列の各単語間の依存関係を決定してくことで、文節のまとめ上げと係り受け解析とを行う文節まとめ上げ係り受け解析工程と
を備え、
前記文節まとめ上げ係り受け解析工程は、
前記解析対象の文末まで前記文節のまとめ上げを行う過程で、文節の先頭の検出を行いながら依存先が未確定の単語をスタックしていき、依存関係の判定により文節の区切りが決定した後に、スタックに蓄積された単語の依存関係の決定を行って文節間の係り受けを決定する
ことを特徴とする自然言語解析方法。 - 文節に区切ることが可能で、文節間の係り受け関係が存在する自然言語文を解析する自然言語解析プログラムであって、
自然言語解析装置を構成するコンピュータを、
解析対象の文を形態素に分解する形態素解析手段、
形態素列の各単語間の依存関係を決定してくことで、文節のまとめ上げと係り受け解析とを行う文節まとめ上げ係り受け解析手段
として機能させ、
前記文節まとめ上げ係り受け解析手段は、
前記解析対象の文末まで前記文節のまとめ上げを行う過程で、文節の先頭の検出を行いながら依存先が未確定の単語をスタックしていき、依存関係の判定により文節の区切りが決定した後に、スタックに蓄積された単語の依存関係の決定を行って文節間の係り受けを決定する
コンピュータ読み取り可能の自然言語解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008014133A JP5295576B2 (ja) | 2008-01-24 | 2008-01-24 | 自然言語解析装置、自然言語解析方法および自然言語解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008014133A JP5295576B2 (ja) | 2008-01-24 | 2008-01-24 | 自然言語解析装置、自然言語解析方法および自然言語解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009176062A true JP2009176062A (ja) | 2009-08-06 |
JP5295576B2 JP5295576B2 (ja) | 2013-09-18 |
Family
ID=41031074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008014133A Active JP5295576B2 (ja) | 2008-01-24 | 2008-01-24 | 自然言語解析装置、自然言語解析方法および自然言語解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5295576B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011198075A (ja) * | 2010-03-19 | 2011-10-06 | Yahoo Japan Corp | 自然言語解析装置、方法及びプログラム |
US9436676B1 (en) | 2014-11-25 | 2016-09-06 | Truthful Speaking, Inc. | Written word refinement system and method |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02165378A (ja) * | 1988-12-20 | 1990-06-26 | Csk Corp | 機械翻訳システム |
JPH03137771A (ja) * | 1989-10-24 | 1991-06-12 | Ricoh Co Ltd | 構文解析装置 |
JPH04372060A (ja) * | 1991-06-20 | 1992-12-25 | Csk Corp | 日本語解析装置 |
JPH05210697A (ja) * | 1991-07-03 | 1993-08-20 | Csk Corp | 日本語構文解析システム |
JPH0668131A (ja) * | 1992-08-20 | 1994-03-11 | Csk Corp | 機械翻訳装置における並列名詞句処理方式 |
JPH06131390A (ja) * | 1992-10-20 | 1994-05-13 | Csk Corp | 自然言語解析装置 |
JPH08249330A (ja) * | 1995-03-10 | 1996-09-27 | Csk Corp | 自然言語の構文解析装置 |
JPH11203281A (ja) * | 1998-01-09 | 1999-07-30 | Sharp Corp | 電子辞書検索装置及び電子辞書検索装置制御プログラムを記憶した媒体 |
-
2008
- 2008-01-24 JP JP2008014133A patent/JP5295576B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02165378A (ja) * | 1988-12-20 | 1990-06-26 | Csk Corp | 機械翻訳システム |
JPH03137771A (ja) * | 1989-10-24 | 1991-06-12 | Ricoh Co Ltd | 構文解析装置 |
JPH04372060A (ja) * | 1991-06-20 | 1992-12-25 | Csk Corp | 日本語解析装置 |
JPH05210697A (ja) * | 1991-07-03 | 1993-08-20 | Csk Corp | 日本語構文解析システム |
JPH0668131A (ja) * | 1992-08-20 | 1994-03-11 | Csk Corp | 機械翻訳装置における並列名詞句処理方式 |
JPH06131390A (ja) * | 1992-10-20 | 1994-05-13 | Csk Corp | 自然言語解析装置 |
JPH08249330A (ja) * | 1995-03-10 | 1996-09-27 | Csk Corp | 自然言語の構文解析装置 |
JPH11203281A (ja) * | 1998-01-09 | 1999-07-30 | Sharp Corp | 電子辞書検索装置及び電子辞書検索装置制御プログラムを記憶した媒体 |
Non-Patent Citations (4)
Title |
---|
CSNG200100880011; 工藤 拓 外1名: 'Support Vector Machineによる日本語係り受け解析' 情報処理学会研究報告 第2000巻第65号, 20000719, p.79-86, 社団法人情報処理学会 * |
CSNG200700424001; 颯々野 学: '日本語係り受け解析の線形時間アルゴリズム' 自然言語処理 第14巻第1号, 20070110, p.3-18, 言語処理学会 * |
JPN6012000783; 工藤 拓 外1名: 'Support Vector Machineによる日本語係り受け解析' 情報処理学会研究報告 第2000巻第65号, 20000719, p.79-86, 社団法人情報処理学会 * |
JPN6012049945; 颯々野 学: '日本語係り受け解析の線形時間アルゴリズム' 自然言語処理 第14巻第1号, 20070110, p.3-18, 言語処理学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011198075A (ja) * | 2010-03-19 | 2011-10-06 | Yahoo Japan Corp | 自然言語解析装置、方法及びプログラム |
US9436676B1 (en) | 2014-11-25 | 2016-09-06 | Truthful Speaking, Inc. | Written word refinement system and method |
Also Published As
Publication number | Publication date |
---|---|
JP5295576B2 (ja) | 2013-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210157984A1 (en) | Intelligent system that dynamically improves its knowledge and code-base for natural language understanding | |
Rashel et al. | Building an Indonesian rule-based part-of-speech tagger | |
US7756871B2 (en) | Article extraction | |
JP4427500B2 (ja) | 意味解析装置、意味解析方法および意味解析プログラム | |
CN108614898A (zh) | 文档解析方法与装置 | |
US20060129396A1 (en) | Method and apparatus for automatic grammar generation from data entries | |
US8538743B2 (en) | Disambiguating text that is to be converted to speech using configurable lexeme based rules | |
Shanmugalingam et al. | Language identification at word level in Sinhala-English code-mixed social media text | |
JP2004303240A (ja) | 単語解析のためのシステムおよび方法 | |
Chungku et al. | Building NLP resources for Dzongkha: a tagset and a tagged corpus | |
US20140244676A1 (en) | Discovering Title Information for Structured Data in a Document | |
Wong et al. | isentenizer-: Multilingual sentence boundary detection model | |
JP5291351B2 (ja) | 評価表現抽出方法、評価表現抽出装置、および、評価表現抽出プログラム | |
JP5295576B2 (ja) | 自然言語解析装置、自然言語解析方法および自然言語解析プログラム | |
JP4361299B2 (ja) | 評価表現抽出装置、プログラム、及び記憶媒体 | |
US8977538B2 (en) | Constructing and analyzing a word graph | |
Boulaknadel et al. | Amazighe Named Entity Recognition using a A rule based approach | |
JP2010092169A (ja) | 情報処理装置及びプログラム | |
JP5795302B2 (ja) | 形態素解析装置、方法、及びプログラム | |
Oostdijk et al. | Constructing a broad-coverage lexicon for text mining in the patent domain | |
JP2632806B2 (ja) | 言語解析装置 | |
JP3767180B2 (ja) | 文書構造解析方法及び装置及び文書構造解析プログラムを格納した記憶媒体 | |
Hnátková et al. | Linguistic annotation of corpora in the Czech National Corpus | |
JP2014215970A (ja) | 誤り検出装置、方法、及びプログラム | |
Megyesi | Brill’s PoS tagger with extended lexical templates for Hungarian |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130612 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5295576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |