JP2012022599A - 文構造解析装置、文構造解析方法および文構造解析プログラム - Google Patents
文構造解析装置、文構造解析方法および文構造解析プログラム Download PDFInfo
- Publication number
- JP2012022599A JP2012022599A JP2010161464A JP2010161464A JP2012022599A JP 2012022599 A JP2012022599 A JP 2012022599A JP 2010161464 A JP2010161464 A JP 2010161464A JP 2010161464 A JP2010161464 A JP 2010161464A JP 2012022599 A JP2012022599 A JP 2012022599A
- Authority
- JP
- Japan
- Prior art keywords
- dependency
- clause
- phrase
- analysis
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】入力された文章を、形態素を単位とした単語に分割する形態素解析手段と、形態素解析手段によって分割された各単語を基に、複数の文節からなる文節列を生成する文節解析手段と、文節解析手段によって生成された各文節間の係り受け関係を解析する係り受け解析手段と、を備え、係り受け解析手段は、文節解析手段によって生成された文節列から、任意の異なる文節のペアを選択し、選択された文節ペアのそれぞれに対して係り受けスコアを計算してメモリに格納し、所定の閾値以上の係り受けスコアを持つ文節ペアに係り受け関係があると解析する。
【選択図】図1
Description
まず、本発明の第1の実施形態について説明する。
次に、本発明の第2の実施形態について説明する。
22 形態素解析手段
23 文節解析手段
24 統合係り受け解析手段
25 解析結果表示手段
401 文節ペア選択手段
402 係り受けスコア計算手段
403 係り受け関係選択手段
404 先行詞生成手段
405 係り受け統計モデル
Claims (8)
- プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリとを備え、入力された文章の構造を解析する文構造解析装置であって、
入力された文章を、形態素を単位とした単語に分割する形態素解析手段と、
前記形態素解析手段によって分割された各単語を基に、複数の文節からなる文節列を生成する文節解析手段と、
前記文節解析手段によって生成された各文節間の係り受け関係を解析する係り受け解析手段と、を備え、
前記係り受け解析手段は、前記文節解析手段によって生成された文節列から、任意の異なる文節のペアを選択し、
選択された文節ペアのそれぞれに対して係り受けスコアを計算して前記メモリに格納し、
所定の閾値以上の係り受けスコアを持つ文節ペアに係り受け関係があると解析することを特徴とする文構造解析装置。 - 前記係り受け解析手段は、前記文節解析手段によって生成された文節列から、第1文節、及び、前記第1文節よりも後に位置する第2文節からなる文節のペアを選択し、
選択された前記第1文節を係り元、前記第2文節を係り先とした場合の係り受けスコアを計算し、
計算された係り受けスコアが所定の閾値以上である場合、前記第1文節を係り元、前記第2文節を係り先とする係り受け関係があると解析することを特徴とする請求項1に記載の文構造解析装置。 - 前記係り受け解析手段は、前記文節解析手段によって生成された文節列から、第1文節、及び、前記第1文節よりも前に位置する第2文節からなる文節のペアを選択し、
選択された前記第1文節を係り先、前記第2文節を係り元とする係り受け関係が存在する場合、当該文節ペアに対して係り受けスコアを計算し、
計算された係り受けスコアが所定の閾値以上である場合、前記第1文節を係り元、前記第2文節を係り先とする係り受け関係があると解析することを特徴とする請求項1に記載の文構造解析装置。 - 前記係り受け解析手段は、前記文節解析手段によって生成された文節列に基づいて、係り受け関係の統計モデルを生成し、生成された前記統計モデルに基づいて、前記選択された文節ペアの係り受けスコアを計算することを特徴とする請求項1に記載の文構造解析装置。
- 前記係り受け解析手段は、前記文節解析手段によって生成された文節列から、ゼロ代名詞の先行詞を生成する先行詞生成手段を含み、
前記係り受け解析手段は、前記先行詞生成手段によって生成されたゼロ代名詞の先行詞と、前記文節解析手段によって生成された文節列に含まれる各文節とのペアを選択し、
選択された文節ペアのそれぞれに対して係り受けスコアを計算し、
最も高い係り受けスコアを持つ文節ペアに係り受け関係があると解析することを特徴とする請求項1に記載の文構造解析装置。 - 前記先行詞生成手段は、前記文節解析手段によって生成された文節列に基づいて、先行詞生成のための統計モデルを生成し、生成された前記統計モデルに基づいて、各文節の先行詞へのなりやすさの度合いを算出し、最も高い先行詞へのなりやすさの度合いを持つ文節を先行詞とすることを特徴とする請求項5に記載の文構造解析装置。
- プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリとを備えた文構造解析装置において、入力された文章の構造を解析する文構造解析方法であって、
前記プロセッサが、
入力された文章を、形態素を単位とした単語に分割する手順と、
前記分割する手順によって分割された各単語を基に、複数の文節からなる文節列を生成する手順と、
前記文節列を生成する手順によって生成された各文節間の係り受け関係を解析する手順と、を含み、
前記係り受け関係を解析する手順において、前記プロセッサは、前記文節列を生成する手順によって生成された文節列から、任意の異なる文節のペアを選択し、
選択された文節ペアのそれぞれに対して係り受けスコアを計算して前記メモリに格納し、
所定の閾値以上の係り受けスコアを持つ文節ペアに係り受け関係があると解析することを特徴とする文構造解析方法。 - プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリとを備えた文構造解析装置において用いられ、入力された文章の構造を解析する文構造解析プログラムであって、
入力された文章を、形態素を単位とした単語に分割する手順と、
前記分割する手順によって分割された各単語を基に、複数の文節からなる文節列を生成する手順と、
前記文節列を生成する手順によって生成された文節列から、任意の異なる文節のペアを選択する手順と、
前記選択する手順によって選択された文節ペアのそれぞれに対して係り受けスコアを計算して前記メモリに格納する手順と、
所定の閾値以上の係り受けスコアを持つ文節ペアに係り受け関係があると解析する手順と、
を前記プロセッサに実行させることを特徴とする文構造解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010161464A JP5564705B2 (ja) | 2010-07-16 | 2010-07-16 | 文構造解析装置、文構造解析方法および文構造解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010161464A JP5564705B2 (ja) | 2010-07-16 | 2010-07-16 | 文構造解析装置、文構造解析方法および文構造解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012022599A true JP2012022599A (ja) | 2012-02-02 |
JP5564705B2 JP5564705B2 (ja) | 2014-08-06 |
Family
ID=45776823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010161464A Active JP5564705B2 (ja) | 2010-07-16 | 2010-07-16 | 文構造解析装置、文構造解析方法および文構造解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5564705B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014215920A (ja) * | 2013-04-26 | 2014-11-17 | 日本電信電話株式会社 | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム |
JP2014238690A (ja) * | 2013-06-07 | 2014-12-18 | コニカミノルタ株式会社 | 操作支援プログラム及び操作支援方法並びに情報処理装置 |
JP2016057810A (ja) * | 2014-09-09 | 2016-04-21 | 日本電信電話株式会社 | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 |
US9436676B1 (en) | 2014-11-25 | 2016-09-06 | Truthful Speaking, Inc. | Written word refinement system and method |
CN110032726A (zh) * | 2018-01-09 | 2019-07-19 | 尤菊芳 | 用于改进句子图表构造和分析的系统和方法 |
JP2020501230A (ja) * | 2016-11-03 | 2020-01-16 | セールスフォース ドット コム インコーポレイティッド | 複数の言語タスク階層を通じてデータを処理するための深層ニューラルネットワークモデル |
US10740562B2 (en) | 2016-07-19 | 2020-08-11 | Fujitsu Limited | Search apparatus, encoding method, and search method based on morpheme position in a target document |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007226636A (ja) * | 2006-02-24 | 2007-09-06 | Advanced Telecommunication Research Institute International | 係り受け構造解析装置及びコンピュータプログラム |
-
2010
- 2010-07-16 JP JP2010161464A patent/JP5564705B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007226636A (ja) * | 2006-02-24 | 2007-09-06 | Advanced Telecommunication Research Institute International | 係り受け構造解析装置及びコンピュータプログラム |
Non-Patent Citations (6)
Title |
---|
CSNG199800302006; 山本 幹雄,小林 聡,中川 聖一: '音声対話文における助詞落ち・倒置の分析と解析手法' 情報処理学会論文誌 第33巻 第11号 第33巻第11号ISSN】0387-5806, 19921115, 1322-1330, 社団法人情報処理学会 * |
CSNG200100240019; 春野 雅彦: '機械学習の手法による自然言語処理' 情報処理学会研究報告 Vol.99 No.108 第99巻第108号【ISSN】0919-6072, 19991221, p.133-p.138, 社団法人情報処理学会 * |
CSNG200900465005; 西尾 公秀,村上 春佳,松田 源立,原田 実: '意味解析に基づく照応解析システムANASYS' 情報処理学会研究報告 平成21年度▲1▼ [CD-ROM] 【ISSN】1884-0930, 20090615, p.1-p.8, 社団法人情報処理学会 * |
JPN6013054644; 春野 雅彦: '機械学習の手法による自然言語処理' 情報処理学会研究報告 Vol.99 No.108 第99巻第108号【ISSN】0919-6072, 19991221, p.133-p.138, 社団法人情報処理学会 * |
JPN6013054648; 山本 幹雄,小林 聡,中川 聖一: '音声対話文における助詞落ち・倒置の分析と解析手法' 情報処理学会論文誌 第33巻 第11号 第33巻第11号ISSN】0387-5806, 19921115, 1322-1330, 社団法人情報処理学会 * |
JPN6013054651; 西尾 公秀,村上 春佳,松田 源立,原田 実: '意味解析に基づく照応解析システムANASYS' 情報処理学会研究報告 平成21年度▲1▼ [CD-ROM] 【ISSN】1884-0930, 20090615, p.1-p.8, 社団法人情報処理学会 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014215920A (ja) * | 2013-04-26 | 2014-11-17 | 日本電信電話株式会社 | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム |
JP2014238690A (ja) * | 2013-06-07 | 2014-12-18 | コニカミノルタ株式会社 | 操作支援プログラム及び操作支援方法並びに情報処理装置 |
JP2016057810A (ja) * | 2014-09-09 | 2016-04-21 | 日本電信電話株式会社 | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 |
US9436676B1 (en) | 2014-11-25 | 2016-09-06 | Truthful Speaking, Inc. | Written word refinement system and method |
US10740562B2 (en) | 2016-07-19 | 2020-08-11 | Fujitsu Limited | Search apparatus, encoding method, and search method based on morpheme position in a target document |
JP2020501230A (ja) * | 2016-11-03 | 2020-01-16 | セールスフォース ドット コム インコーポレイティッド | 複数の言語タスク階層を通じてデータを処理するための深層ニューラルネットワークモデル |
US11222253B2 (en) | 2016-11-03 | 2022-01-11 | Salesforce.Com, Inc. | Deep neural network model for processing data through multiple linguistic task hierarchies |
JP7068296B2 (ja) | 2016-11-03 | 2022-05-16 | セールスフォース ドット コム インコーポレイティッド | 複数の言語タスク階層を通じてデータを処理するための深層ニューラルネットワークモデル |
US11797825B2 (en) | 2016-11-03 | 2023-10-24 | Salesforce, Inc. | Training a joint many-task neural network model using successive regularization |
CN110032726A (zh) * | 2018-01-09 | 2019-07-19 | 尤菊芳 | 用于改进句子图表构造和分析的系统和方法 |
CN110032726B (zh) * | 2018-01-09 | 2023-11-03 | 尤菊芳 | 用于改进句子图表构造和分析的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5564705B2 (ja) | 2014-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pianta et al. | The TextPro Tool Suite. | |
Rashel et al. | Building an Indonesian rule-based part-of-speech tagger | |
JP5564705B2 (ja) | 文構造解析装置、文構造解析方法および文構造解析プログラム | |
Mohtaj et al. | Parsivar: A language processing toolkit for Persian | |
Garcia et al. | Yet another suite of multilingual NLP tools | |
Ramisch et al. | mwetoolkit: A framework for multiword expression identification. | |
JP6955963B2 (ja) | 検索装置、類似度算出方法、およびプログラム | |
Sibarani et al. | A study of parsing process on natural language processing in bahasa Indonesia | |
Wintner | Morphological processing of semitic languages | |
Tehseen et al. | Neural POS tagging of shahmukhi by using contextualized word representations | |
JP2009181408A (ja) | 単語意味付与装置、単語意味付与方法、プログラムおよび記録媒体 | |
Kammoun et al. | The MORPH2 new version: A robust morphological analyzer for Arabic texts | |
JP5291351B2 (ja) | 評価表現抽出方法、評価表現抽出装置、および、評価表現抽出プログラム | |
Koleva et al. | An automatic part-of-speech tagger for Middle Low German | |
Ibrahim et al. | Bel-Arabi: advanced Arabic grammar analyzer | |
Khoufi et al. | Statistical-based system for morphological annotation of Arabic texts | |
KR102182248B1 (ko) | 문법 검사 시스템 및 방법과 이를 위한 컴퓨터 프로그램 | |
Elsheikh | Timeline of the development of Arabic PoS taggers and Morphological analysers | |
Ihsan et al. | A Corpus-based Study of Reporting Verbs in Citation Texts Using Natural Language Processing | |
Rajendran | Parsing in tamil: Present state of art | |
Mutuvi et al. | Multilingual epidemic event extraction | |
Teodorescu et al. | Part of speech tagging for romanian text-to-speech system | |
JP6298785B2 (ja) | 自然言語解析装置、方法、及びプログラム | |
Boroş et al. | RACAI GEC–a hybrid approach to grammatical error correction | |
Dione | Finite-state tokenization for a deep Wolof LFG grammar |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120316 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140520 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5564705 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |