JP2011118814A - 自然言語処理プログラム及び自然言語処理装置 - Google Patents

自然言語処理プログラム及び自然言語処理装置 Download PDF

Info

Publication number
JP2011118814A
JP2011118814A JP2009277560A JP2009277560A JP2011118814A JP 2011118814 A JP2011118814 A JP 2011118814A JP 2009277560 A JP2009277560 A JP 2009277560A JP 2009277560 A JP2009277560 A JP 2009277560A JP 2011118814 A JP2011118814 A JP 2011118814A
Authority
JP
Japan
Prior art keywords
learning
syntax
information
parsing
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009277560A
Other languages
English (en)
Inventor
Yasuhide Miura
康秀 三浦
Tomoko Okuma
智子 大熊
Hiroshi Masuichi
博 増市
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2009277560A priority Critical patent/JP2011118814A/ja
Publication of JP2011118814A publication Critical patent/JP2011118814A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】学習対象の文に関連付けられた、構文解析器の構文解析の仕様とは異なる構文解析の仕様を、構文解析器の構文解析の仕様に合わせるために学習する自然言語処理プログラム及び自然言語処理装置を提供する。
【解決手段】コーパス変換装置1は、仕様Bの構文情報111Bに基づいて、学習コーパス111の文に構文解析の対象とする範囲の限定をブラケットによって付与するブラケット付与手段101と、ブラケットの付与前及び付与後において、文に仕様Aで構文解析を実行して、構文解析結果をそれぞれ出力する構文解析手段102と、構文情報111Aとブラケットの付与前及び付与後における構文解析結果との類似性を示すF値をそれぞれ求める構文解析評価手段103と、ブラケットの付与前及び付与後におけるF値の変化量と、ブラケット付与後の構文解析結果とを関連付けて学習する学習手段105とを有する。
【選択図】図1

Description

本発明は、自然言語処理プログラム及び自然言語処理装置に関する。
文章中の特定の文にならって、文章の読点の付け方の不統一を防止する技術が提案されている。
これに関連する技術として、特許文献1には、抽出された特定の文を形態素解析して形態素解析表を作成し、句解析規則集を用いて句解析表を作成して、校正対象となる他の文から文型を抽出し、その文型を検索のキーとして文書から校正対象文を取り出して、それら校正対象文の読点位置の種類や頻度等から読点の付け方が不統一であればその旨を通知、又は修正する技術が開示されている。
特開平7−85048号公報
本発明の目的は、学習対象の文に関連付けられた、構文解析器の構文解析の仕様とは異なる構文解析の仕様を、構文解析器の構文解析の仕様に合わせるために学習する自然言語処理プログラム及び自然言語処理装置を提供することにある。
[1]コンピュータを、学習対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記学習対象の文に構文解析の対象とする範囲の限定を付与する限定付与手段と、前記範囲に限定しない前記学習対象の文と前記範囲に限定した前記学習対象の文とを対象にして、前記第1の仕様とは異なる第2の仕様の構文情報に基づいて構文解析を実行し、前記範囲に限定しない前記学習対象の文を対象にした前記第2の仕様に基づく第1の構文解析結果と前記範囲に限定した前記学習対象の文を対象にした前記第2の仕様に基づく第2の構文解析結果とをそれぞれ出力する構文解析手段と、前記第2の仕様の構文情報と前記第1の構文解析結果の類似性を示す第1の評価結果と、前記第2の仕様の構文情報と前記第2の構文解析結果の類似性を示す第2の評価結果とを出力する評価手段と、前記第1の評価結果と前記第2の評価結果の変化量と、前記第2の構文解析結果とを関連付けた情報を学習情報として記憶することで学習する学習手段として機能させるための自然言語処理プログラム。
[2]前記限定付与手段は、識別対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記識別対象の文に構文解析の対象とする範囲の限定を付与し、前記構文解析手段は、当該範囲に限定した前記識別対象の文を対象にして、前記第2の仕様の構文情報に基づいて構文解析して第3の構文解析結果を出力し、前記第3の構文解析結果と類似する前記第2の構文解析結果を前記学習情報から抽出して、抽出された当該第2の構文解析結果に関連付けられた前記第1の評価結果と前記第2の評価結果の変化量を当該第3の構文解析結果に適用し、当該範囲の限定が妥当か否かを識別する識別手段として前記コンピュータをさらに機能させるための前記[1]に記載の自然言語処理プログラム。
[3]前記識別手段が妥当と識別した前記範囲の限定に対して得られた前記第3の構文解析結果を用いて、前記識別対象の文の構文情報を修正する修正手段として前記コンピュータをさらに機能させるための前記[2]に記載の自然言語処理プログラム。
[4]学習対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記学習対象の文に構文解析の対象とする範囲の限定を付与する限定付与手段と、前記範囲に限定しない前記学習対象の文と前記範囲に限定した前記学習対象の文とを対象にして、前記第1の仕様とは異なる第2の仕様の構文情報に基づいて構文解析を実行し、前記範囲に限定しない前記学習対象の文を対象にした前記第2の仕様に基づく第1の構文解析結果と前記範囲に限定した前記学習対象の文を対象にした前記第2の仕様に基づく第2の構文解析結果とをそれぞれ出力する構文解析手段と、前記第2の仕様の構文情報と前記第1の構文解析結果の類似性を示す第1の評価結果と、前記第2の仕様の構文情報と前記第2の構文解析結果の類似性を示す第2の評価結果とを出力する評価手段と、前記第1の評価結果と前記第2の評価結果の変化量と、前記第2の構文解析結果とを関連付けた情報を学習情報として記憶することで学習する学習手段とを有する自然言語処理装置。
請求項1又は4に係る発明によれば、学習対象の文に関連付けられた、構文解析器の構文解析の仕様とは異なる構文解析の仕様を、構文解析器の構文解析の仕様に合わせるために学習することができる。
請求項2に係る発明によれば、学習対象の文に関連付けられた、構文解析器の構文解析の仕様とは異なる構文解析の仕様を、構文解析器の構文解析の仕様に合わせることができる。
請求項3に係る発明によれば、学習対象の文に関連付けられた、構文解析器の構文解析の仕様とは異なる構文解析の仕様を構文解析器の構文解析の仕様に合わせるように学習対象の文に関連付けられた構文解析の仕様を修正することができる。
本発明の実施の形態に係るコーパス変換装置の構成例を示す概略図である。 (a)〜(c)は、学習用コーパスの構成の一例を示す概略図である。 ブラケットの付与された学習用コーパス文の構成の一例を示す概略図である。 (a)及び(b)は、構文情報及び構文解析手段による構文解析結果の構成の一例を示す概略図である。 ブラケットの付与された学習用コーパス文の構成の一例を示す概略図である。 学習用コーパス文の解析結果としての構文情報の構成の一例を示す概略図である。 (a)及び(b)は、構文情報及び構文解析手段による構文解析結果の構成の一例を示す概略図である。 (a)〜(c)は、それぞれ異なる箇所に限定ブラケットを付与した場合のF値の例を示す概略図である。 (a)〜(c)は、それぞれ異なる箇所にさらに限定ブラケットを付与した場合のF値の例を示す概略図である。 (a)〜(c)は、学習手段の学習動作の一例を示す概略図である。 コーパス変換装置の学習動作例を示すフローチャートである。 (a)〜(b)は、識別用コーパス112の構成の一例を示す概略図である。 ブラケットの付与された識別用コーパス文の構成の一例を示す概略図である。 (a)〜(c)は、識別手段の学習動作の一例を示す概略図である。 コーパス変換装置1の識別動作例を示すフローチャートである。
図1は、本発明の実施の形態にコーパス変換装置の構成例を示す概略図である。
このコーパス変換装置1は、CPU(Central Processing Unit)等から構成され各部を制御するとともに各種のプログラムを実行する制御部10と、HDD(Hard Disk Drive)やフラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11とを有する。
なお、コーパス変換装置1は、例えば、パーソナルコンピュータやPDA(Personal Digital Assistant)、携帯電話機等でもよい。また、コーパス変換装置1は、外部から受け付ける要求等に基づいて動作するが、文や図形等を表示する液晶ディスプレイ等の表示部と、操作入力用のキーボードやマウス等の操作部を備え、直接に利用者の操作に基づいて動作する構成としてもよい。
制御部10は、後述するコーパス変換プログラム110を実行することで、コーパス取得手段100と、ブラケット付与手段101と、構文解析手段102と、構文解析評価手段103と、ブラケット正負判定手段104と、学習手段105と、識別手段106と、コーパス修正手段107等として機能する。
コーパス取得手段100は、学習対象としての学習用コーパス111又は識別対象としての識別用コーパス112を取得する。ここで、「コーパス」とは、文とその文の構文情報とを関連付けた情報を持つ言語資源をいう。構文情報を持たない、一般的に「生コーパス」といわれるものは含んでいない。また、「構文情報」とは、文を一定の仕様で構文解析して得られた情報であり、文を構成する形態素及びその形態素の品詞等を示す情報である。一般的に大規模な文及び文章を資料体としてまとめたものを指す。
ブラケット付与手段101は、コーパス取得手段100が取得したコーパスの文に対し、その文の構文情報に応じて後述するブラケットを付与する。ここで、「ブラケット」とは、構文情報において品詞や句・節・項等の構文における意味付けを排除し、構文上の区切りのみで表現したものである。
構文解析手段102は、文の構文を後述する仕様Aに基づいて解析する。ここで、「仕様A」とは、構文解析の手法の1つであり、後に説明する仕様Bと異なる手法を指すものとする。
構文解析評価手段103は、構文解析手段102が解析した結果を、コーパスが有する構文情報と比較して評価する。
ブラケット正負判定手段104は、ブラケットが付与される前後において、文の構文解析評価手段103の評価結果を比較して正か負かを判定する。なお、判定基準については後述する。
学習手段105は、学習用コーパス111の仕様Aの構文情報111Aと仕様Bの構文情報111Bとを比較して学習し、学習情報113を生成する。具体的には、文に付与されたブラケットごとに、ブラケット正負判定手段104の判定結果及びブラケットで限定された内容の構文情報を学習し、その内容を学習情報113として記憶部11に記憶する。
識別手段106は、識別対象としての識別用コーパス112の文を仕様Aの構文解析手段102によって構文解析した場合に、その構文解析結果が構文情報112Bとどれだけ親和性があるかを識別し、その内容を識別情報114として記憶部11に記憶する。
コーパス修正手段107は、識別情報114に基づいて構文情報112Bを仕様Aに修正する。
記憶部11は、制御部10を上述した各手段として動作させるコーパス変換プログラム110と、文に関連づけられた仕様Aの構文情報111A及び仕様Aと異なる手法で構文解析された仕様Bの構文情報111Bを有する学習用コーパス111と、文に関連づけられた仕様Bの構文情報112Bを有する識別用コーパス112と、学習手段105によって出力された学習情報113と、識別手段106によって識別された識別情報114等を記憶する。
本実施の形態では、構文解析の仕様として仕様Aと使用Bとが存在し、学習用に用いる学習用コーパス111には仕様A及び仕様Bの構文情報111A及び111Bが関連づけられる。また、識別用に用いる識別用コーパス112には仕様Bの構文情報112Bのみ関連づけられている。以下、学習用コーパス111の構成について説明する。
図2(a)〜(c)は、記憶部11に記憶された学習用コーパス111の構成の一例を示す概略図である。
図2(a)に示す学習用コーパス文111mは、学習用コーパス111に含まれる構文解析の対象とされる文であり、一例として「超音波探傷法、磁気探傷法などと合わせて非破壊検査の重要な手法である。」(独立行政法人 情報通信研究機構、EDR日本語コーパス、http://www2.nict.go.jp/r/r312/EDR/J_index.html)という内容を有する。
図2(b)に示す構文情報111Aは、学習用コーパス111に含まれ、構文解析の仕様Aによって学習用コーパス文111mを構文解析した結果であり、品詞、句・節・項等に分けて記述されるものである。
図2(c)に示す構文情報111Bは、学習用コーパス111に含まれ、構文解析の仕様Bによって学習用コーパス文111mを構文解析した結果であり、品詞、句・節・項等に分けて記述されるものである。
(構文仕様変換装置の動作)
以下に、コーパス変換装置1の動作を図1〜11を参照しつつ、(1)学習動作と(2)識別動作とに分けて説明する。
(1)学習動作
図11は、コーパス変換装置1の学習動作例を示すフローチャートである。
まず、コーパス変換装置1のコーパス取得手段100は、記憶部11から学習用コーパス111を取得し、その学習用コーパス111から図2(a)及び(c)に示すような1つの学習用コーパス文111m及び構文情報111Bを取得する(S1)。
次に、ブラケット付与手段101は、構文情報111Bの構造、つまり各品詞や句・節・項等のまとまりに基づいて学習用コーパス文111mに対してブラケットを付与する(S2)。
図3は、ブラケットの付与された学習用コーパス文の構成の一例を示す概略図である。
学習用コーパス文111bは、構文情報111Bの構造に基づいて付与される「[」と「]」からなるブラケット101aを有する。例えば、図2(c)に示す構文情報111Bにおいて、「超音波探傷法」は、名詞であるので、ブラケット101aが「[超音波探傷法]」と付与される。なお、ブラケットは文を区切る手法の一例であり、他の記号を用いてもよいし、異なる手法で区切ってもよい。
次に、構文解析手段102は、図2(a)に示すブラケットの付与されていない学習用コーパス文111mを仕様Aに基づいて構文解析する(S3)。構文解析は、例えば、大規模日本語文法の開発(野呂智哉,橋本泰一,徳永建伸,田中穂積.大規模日本語文法の開発.自然言語処理 Vol.12 No.1,2005.)に基づく構文解析器を用いて実行する。
図4(a)及び(b)は、構文情報111A及び構文解析手段102による構文解析結果の構成の一例を示す概略図である。
図4(a)に示す構文情報111aは、図2(b)に示す構文情報111Aから抽出される情報であり、構文を品詞や句・節・項等の要素間の関係によって表現したものである。
図4(b)に示す構文解析結果102aは、構文解析手段102によって学習用コーパス文111mを解析した結果であり、構文情報111Aと同様に品詞や句・節・項等の要素間の関係によって表現したものである。
次に、構文解析評価手段103は、構文情報111Aと比較することにより構文解析結果102aを評価する(S4)。評価方法として、以下に示すF値を用いる。
F値は、適合率Pと再現率Rとから算出される値であり、それぞれ以下に示す数式で表現される。
Figure 2011118814
Figure 2011118814
Figure 2011118814
図4(a)及び(b)に示す例から上記した値を算出すると、適合率=100×11/13=84.6、再現率=100×11/12=91.7であるので、F値=88.0と算出される。
次に、ブラケット付与手段101は、学習用コーパス文111bにおいて付与されたブラケット101aのうち任意の1つを学習用コーパス文111mに付与し、構文解析手段102は、そのブラケットの付与された学習用コーパス文を構文解析する(S5)。
図5は、ブラケットの付与された学習用コーパス文の構成の一例を示す概略図である。
学習用コーパス文111cは、ブラケット101aから選択された任意のブラケット、例えば、「超音波探傷法、磁気探傷法」を囲むブラケットを限定ブラケット101bとして有する。この限定ブラケット101bは、構文解析手段102の構文解析の品詞や句・節・項等を判断する範囲を限定するものである。
図6は、学習用コーパス文111cの解析結果としての構文情報の構成の一例を示す概略図である。
構文情報102Bは、構文解析手段102によって仕様Aを制約として加えて解析された結果であり、「超音波探傷法、磁気探傷法など」が図2(b)に示す構文情報111Aでは名詞句となっているのに対し、本図では、限定ブラケット101bによって「超音波探傷法、磁気探傷法」を限定したことにより、動詞句となっている。
次に、構文解析評価手段103は、構文情報111aと比較することにより構文情報102Bから得られる構文解析結果102bを評価する(S6)。具体的にはステップS4と同様にF値を算出する。
図7(a)及び(b)は、構文情報111A及び構文解析手段102による構文解析結果の構成の一例を示す概略図である。
図7(a)に示す構文情報111aは、図4(a)に示す構文情報111aと同一である。
図7(b)に示す構文解析結果102bは、構文解析手段102によって学習用コーパス文111cを解析した結果であり、構文情報111Aと同様に品詞や句・節・項等の要素間の関係によって表現したものである。
構文情報111Aと構文解析結果102bとを、ステップS4と同様にF値が算出され、F値=88.0という値が得られる。
ステップS5及びS6は、すべてのブラケットに対して実行される(S7)。つまり、現段階では任意の1つのブラケットを付与したすべてのパターンについて実行される。
図8(a)〜(c)は、それぞれ異なる箇所に限定ブラケットを付与した場合のF値の例を示す概略図である。
図8(a)に示す学習用コーパス文111cは、ブラケット101aから選択された任意のブラケット、「超音波探傷法、磁気探傷法」を囲むブラケットを限定ブラケット101bとして有し、F値=88.0である。
図8(b)に示す学習用コーパス文111dは、ブラケット101aから選択された任意のブラケット、「超音波探傷法」を囲むブラケットを限定ブラケット101bとして有し、F値=69.2である。
図8(c)に示す学習用コーパス文111eは、ブラケット101aから選択された任意のブラケット、「超音波探傷法、磁気探傷法など」を囲むブラケットを限定ブラケット101bとして有し、F値=90.7である。
ステップS5及びS6は、以上に挙げた限定ブラケット101bの付与の他、図3に示すすべてのブラケット101aに対してそれぞれ実行される。
次に、ブラケット正負判定手段104は、算出されたF値から最も値の大きなもの、つまり、図8(c)に示す限定ブラケット101bを確定する。
図9(a)〜(c)は、それぞれ異なる箇所にさらに限定ブラケットを付与した場合のF値の例を示す概略図である。
図9(a)に示す学習用コーパス文111eは、図8(c)に示したものと同一である。
図9(b)に示す学習用コーパス文111fは、図8(c)に示す限定ブラケット101bを確定ブラケット101cとし、ブラケット101aから選択された任意のブラケット、「超音波探傷法、磁気探傷法」を囲むブラケットを限定ブラケット101dとして有し、F値=90.7である。
図9(c)に示す学習用コーパス文111gは、図8(c)に示す限定ブラケット101bを確定ブラケット101cとし、ブラケット101aから選択された任意のブラケット、「超音波探傷法」を囲むブラケットを限定ブラケット101dとして有し、F値=90.7である。
以上のように確定ブラケット101c内のブラケットをすべて付与してステップS5〜S8を実行する(S9)。また、ステップS2〜S9を学習用コーパス111の全ての文に対して実行する(S10)。
次に、学習手段105は、以上のステップにおいて算出されたF値及び構文解析結果とに基づいて学習する(S11)。具体的な学習方法を以下に示す。
図10(a)〜(c)は、学習手段105の学習動作の一例を示す概略図である。
学習手段105は、例えば、図10(a)に示す、学習用コーパス文111cのF値と、「超音波探傷法、磁気探傷法などと合わせ」を限定ブラケット101bで限定した学習用コーパス文111hのF値とを比較し、F値が減少した場合に学習用コーパス文111hのケースを負例と学習する。
また、構文情報111Bにおいて、このケースは、図10(b)の学習対象1110で示す動詞句以下の句・節・項や品詞の集合であり、学習手段105は、それらを図10(c)に示す構文情報に書き換えたものを負例の学習情報113aとして、記憶部11に記憶する。
(2)識別動作
図12(a)〜(b)は、識別用コーパス112の構成の一例を示す概略図である。
図12(a)に示す識別用コーパス文112mは、識別用コーパス112に含まれる構文解析の対象とされる文であり、一例として「10時、広場の民主大学が開講しました。」という内容を有する。
図12(b)に示す構文情報112Bは、識別用コーパス112に含まれ、構文解析の仕様Bによって識別用コーパス文112mを構文解析した結果であり、品詞、句・節・項等に分けて記述されるものである。
図15は、コーパス変換装置1の識別動作例を示すフローチャートである。
まず、コーパス変換装置1のコーパス取得手段100は、記憶部11から識別用コーパス112を取得し、その識別用コーパス112から図12(a)に示す1つの識別用コーパス文112m及び図12(b)に示す構文情報111Bを取得する(S20)。
次に、ブラケット付与手段101は、構文情報112Bの構造、つまり各品詞や句・節・項等のまとまりに基づいて識別用コーパス文112mに対してブラケットを付与する(S21)。
図13は、ブラケットの付与された識別用コーパス文の構成の一例を示す概略図である。
識別用コーパス文112bは、構文情報112Bの構造に基づいて付与されるブラケット101aを有する。
次に、識別手段106は、識別用コーパス文112bのブラケット101aごとに素性を抽出して、学習情報113と比較することにより正例か負例かを識別する(S22)。詳しくは以下に説明する。
図14(a)〜(c)は、識別手段106の学習動作の一例を示す概略図である。
識別手段106は、図14(a)に示す構文情報112Bにおいて、例えば、識別対象1120で示す動詞句以下の句・節・項や品詞の集合を、図14(b)に示す構文情報に書き換えたものを素性情報112cとして抽出し、学習情報113と比較することで、例えば、図14(c)に示す負例の学習情報113aと類似していると判断した場合、素性情報112cを負例と識別するとともに、識別結果を識別情報114として記憶部11に記憶する。
ステップS22は、すべてのブラケット101aに対して実行し(S23)、正例と判断されたブラケット内の構文情報を用いてコーパスを仕様Aに修正する(S24)。
以上のステップS21〜S24を識別用コーパス112のすべての文に対して実行し(S25)、動作を終了する。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々な変形が可能である。例えば、正例か負例かの判断は、F値が減少したか否かでなくとも、F値の減少が5以内の場合は正例、5より大きい場合は負例といったように、閾値で判断してもよい。また、F値以外の値を用いて構文の一致の度合いを算出してもよい。
また、上記実施の形態で使用されるコーパス取得手段100と、ブラケット付与手段101と、構文解析手段102と、構文解析評価手段103と、ブラケット正負判定手段104と、学習手段105と、識別手段106と、コーパス修正手段107とは、CD−ROM等の記憶媒体から装置内の記憶部に読み込んでも良く、インターネット等のネットワークに接続されているサーバ装置等から装置内の記憶部にダウンロードしてもよい。また、上記実施の形態で使用される手段の一部または全部をASIC等のハードウェアによって実現してもよい。
1…コーパス変換装置、10…制御部、11…記憶部、100…コーパス取得手段、101…ブラケット付与手段、101a…ブラケット、101b…限定ブラケット、101c…確定ブラケット、101d…限定ブラケット、102…構文解析手段、102B…構文情報、102a…構文解析結果、102b…構文解析結果、103…構文解析評価手段、104…ブラケット正負判定手段、105…学習手段、106…識別手段、107…コーパス修正手段、110…コーパス変換プログラム、111…学習用コーパス、111A…構文情報、111B…構文情報、111m…学習用コーパス文、111a…構文情報、111b…学習用コーパス文、111c…学習用コーパス文、111d…学習用コーパス文、111e…学習用コーパス文、111f…学習用コーパス文、111g…学習用コーパス文、111h…学習用コーパス文、112…識別用コーパス、112B…構文情報、112m…識別用コーパス文、112b…識別用コーパス文、112c…素性情報、113…学習情報、113a…学習情報、114…識別情報、1110…学習対象、1120…識別対象

Claims (4)

  1. コンピュータを、
    学習対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記学習対象の文に構文解析の対象とする範囲の限定を付与する限定付与手段と、
    前記範囲に限定しない前記学習対象の文と前記範囲に限定した前記学習対象の文とを対象にして、前記第1の仕様とは異なる第2の仕様の構文情報に基づいて構文解析を実行し、前記範囲に限定しない前記学習対象の文を対象にした前記第2の仕様に基づく第1の構文解析結果と前記範囲に限定した前記学習対象の文を対象にした前記第2の仕様に基づく第2の構文解析結果とをそれぞれ出力する構文解析手段と、
    前記第2の仕様の構文情報と前記第1の構文解析結果の類似性を示す第1の評価結果と、前記第2の仕様の構文情報と前記第2の構文解析結果の類似性を示す第2の評価結果とを出力する評価手段と、
    前記第1の評価結果と前記第2の評価結果の変化量と、前記第2の構文解析結果とを関連付けた情報を学習情報として記憶することで学習する学習手段として機能させるための自然言語処理プログラム。
  2. 前記限定付与手段は、識別対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記識別対象の文に構文解析の対象とする範囲の限定を付与し、
    前記構文解析手段は、当該範囲に限定した前記識別対象の文を対象にして、前記第2の仕様の構文情報に基づいて構文解析して第3の構文解析結果を出力し、
    前記第3の構文解析結果と類似する前記第2の構文解析結果を前記学習情報から抽出して、抽出された当該第2の構文解析結果に関連付けられた前記第1の評価結果と前記第2の評価結果の変化量を当該第3の構文解析結果に適用し、当該範囲の限定が妥当か否かを識別する識別手段として前記コンピュータをさらに機能させるための請求項1に記載の自然言語処理プログラム。
  3. 前記識別手段が妥当と識別した前記範囲の限定に対して得られた前記第3の構文解析結果を用いて、前記識別対象の文の構文情報を修正する修正手段として前記コンピュータをさらに機能させるための請求項2に記載の自然言語処理プログラム。
  4. 学習対象の文に関連付けられた第1の仕様の構文情報に基づいて、前記学習対象の文に構文解析の対象とする範囲の限定を付与する限定付与手段と、
    前記範囲に限定しない前記学習対象の文と前記範囲に限定した前記学習対象の文とを対象にして、前記第1の仕様とは異なる第2の仕様の構文情報に基づいて構文解析を実行し、前記範囲に限定しない前記学習対象の文を対象にした前記第2の仕様に基づく第1の構文解析結果と前記範囲に限定した前記学習対象の文を対象にした前記第2の仕様に基づく第2の構文解析結果とをそれぞれ出力する構文解析手段と、
    前記第2の仕様の構文情報と前記第1の構文解析結果の類似性を示す第1の評価結果と、前記第2の仕様の構文情報と前記第2の構文解析結果の類似性を示す第2の評価結果とを出力する評価手段と、
    前記第1の評価結果と前記第2の評価結果の変化量と、前記第2の構文解析結果とを関連付けた情報を学習情報として記憶することで学習する学習手段とを有する自然言語処理装置。
JP2009277560A 2009-12-07 2009-12-07 自然言語処理プログラム及び自然言語処理装置 Pending JP2011118814A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009277560A JP2011118814A (ja) 2009-12-07 2009-12-07 自然言語処理プログラム及び自然言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009277560A JP2011118814A (ja) 2009-12-07 2009-12-07 自然言語処理プログラム及び自然言語処理装置

Publications (1)

Publication Number Publication Date
JP2011118814A true JP2011118814A (ja) 2011-06-16

Family

ID=44284031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009277560A Pending JP2011118814A (ja) 2009-12-07 2009-12-07 自然言語処理プログラム及び自然言語処理装置

Country Status (1)

Country Link
JP (1) JP2011118814A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10067939B2 (en) 2016-08-16 2018-09-04 Samsung Electronics Co., Ltd. Machine translation method and apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001350752A (ja) * 2000-06-09 2001-12-21 Nippon Telegr & Teleph Corp <Ntt> 自然言語解析装置、自然言語解析方法および記録媒体
JP2006018354A (ja) * 2004-06-30 2006-01-19 Advanced Telecommunication Research Institute International テキスト分割装置及び自然言語処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001350752A (ja) * 2000-06-09 2001-12-21 Nippon Telegr & Teleph Corp <Ntt> 自然言語解析装置、自然言語解析方法および記録媒体
JP2006018354A (ja) * 2004-06-30 2006-01-19 Advanced Telecommunication Research Institute International テキスト分割装置及び自然言語処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10067939B2 (en) 2016-08-16 2018-09-04 Samsung Electronics Co., Ltd. Machine translation method and apparatus

Similar Documents

Publication Publication Date Title
JP6312942B2 (ja) 言語モデル生成装置、言語モデル生成方法とそのプログラム
JP4940325B2 (ja) 文書校正支援装置、方法およびプログラム
US20090094017A1 (en) Multilingual Translation Database System and An Establishing Method Therefor
JP2012520528A (ja) 自然言語テキストの自動的意味ラベリングのためのシステム及び方法
Richter et al. Korektor–a system for contextual spell-checking and diacritics completion
JP2008083952A (ja) 辞書作成支援システム、方法及びプログラム
KR20160029587A (ko) 단위 또는 약어의 풀네임 음성출력 방법 및 장치
JP2016516247A (ja) 翻字、翻訳、書記素洞察のキュレーション及び統合による多言語ビジネスの印の向上
WO2011071174A1 (ja) テキストマイニング方法、テキストマイニング装置及びテキストマイニングプログラム
Xiong et al. Extended HMM and ranking models for Chinese spelling correction
Al-Ghamdi et al. Exploring NLP web APIs for building Arabic systems
KR20170008357A (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
JP2008276543A (ja) 対話処理装置、応答文生成方法、及び応答文生成処理プログラム
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
JP2011118814A (ja) 自然言語処理プログラム及び自然言語処理装置
KR101626386B1 (ko) 요소화 언어모델을 이용한 번역 오류 후처리 보정 방법 및 장치
JP2016057810A (ja) 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体
JP6375367B2 (ja) 反論生成方法,反論生成システム
US20130103668A1 (en) Question conversion for information searching
Noferesti et al. A hybrid algorithm for recognizing the position of Ezafe constructions in Persian texts
Ganesh et al. Grammar error detection tool for medical transcription using stop words parts-of-speech tags ngram based model
JP2010257085A (ja) 検索装置、検索方法、および検索プログラム
JP5295576B2 (ja) 自然言語解析装置、自然言語解析方法および自然言語解析プログラム
JP2006331246A (ja) 意見分析処理方法、意見分析処理装置およびプログラム
JP2006243976A (ja) 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140723

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141028