JP5533359B2 - 文校正プログラム及び文校正装置 - Google Patents

文校正プログラム及び文校正装置 Download PDF

Info

Publication number
JP5533359B2
JP5533359B2 JP2010153112A JP2010153112A JP5533359B2 JP 5533359 B2 JP5533359 B2 JP 5533359B2 JP 2010153112 A JP2010153112 A JP 2010153112A JP 2010153112 A JP2010153112 A JP 2010153112A JP 5533359 B2 JP5533359 B2 JP 5533359B2
Authority
JP
Japan
Prior art keywords
modification
sentence
morpheme
proofreading
destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010153112A
Other languages
English (en)
Other versions
JP2012014630A (ja
Inventor
昌嗣 外池
智子 大熊
博 増市
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010153112A priority Critical patent/JP5533359B2/ja
Publication of JP2012014630A publication Critical patent/JP2012014630A/ja
Application granted granted Critical
Publication of JP5533359B2 publication Critical patent/JP5533359B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、文校正プログラム及び文校正装置に関する。
日本語の文において修飾先が一意に決まらない文節を修飾先が限定されるように編集する技術が提案されている。
これに関連する技術として、特許文献1には、対象の文を形態素解析手段によって形態素解析し、形態素解析の結果を構文解析手段によって構文解析し、構文解析の結果からある文節が修飾先チェック手段によって修飾先に曖昧性があると判断された場合、文節移動手段によって修飾先が曖昧な文節を適切な位置に移動したり、カンマ挿入手段によって文節間にカンマを挿入したりして、文節の修飾先の曖昧性を解消する技術が開示されている。
特開平8−249331号公報
本発明の目的は、修飾先の候補を2以上有する形態素を含む文について、当該形態素の修飾先の候補を1つに特定するように当該文を校正する文校正プログラム及び文校正装置を提供することにある。
[1]コンピュータを、
形態素解析によって複数の形態素に分割された文の前記形態素のうち、連体修飾の修飾先の候補を2以上有する形態素を検出する検出手段と、
連体修飾を受けない少なくとも1つの連用修飾文節の入力を受け付けて前記文に挿入することにより、前記検出手段により検出された形態素である修飾先不特定形態素の修飾先の候補が1つとなるように前記文を校正する文校正手段と
前記修飾先不特定形態素の修飾先の候補の中から、当該修飾先不特定形態素の修飾先の選択を受け付ける第1受付手段として機能させ、
前記文校正手段は、前記第1受付手段により前記修飾先不特定形態素の直後の形態素又は文節以外の選択を受け付けた場合、前記修飾先不特定形態素の直後の位置に前記連用修飾文節を挿入することにより、前記文を校正する文校正プログラム。
]前記文以外の予め定めた他の文における前記連用修飾文節の出現頻度、又は前記連用修飾文節と前記文における前記連用修飾文節を含む連体修飾成分に含まれる1つ以上の形態素からなる語句との前記文以外の予め定めた他の文における共起頻度に基づいて、前記連用修飾文節の順位付けを行う順位付与手段と、
前記順位付けに基づいて配置して表示された前記連用修飾文節の中から、連用修飾文節の選択を受け付ける第2受付手段として前記コンピュータをさらに機能させ、
前記文校正手段は、前記第2受付手段による選択を受け付けた連用修飾文節を前記入力を受け付けた連用修飾文節として挿入することにより、前記文を校正する前記[1]に記載の文校正プログラム。
]前記文校正手段によって校正された前記文を異なる言語に翻訳する翻訳手段と、
前記翻訳手段が翻訳した文から前記少なくとも1つの連用修飾文節に対応する語句を削除する削除手段として前記コンピュータをさらに機能させるための前記[1]に記載の文校正プログラム。
]形態素解析によって複数の形態素に分割された文の前記形態素のうち、連体修飾の修飾先の候補を2以上有する形態素を検出する検出手段と、
連体修飾を受けない少なくとも1つの連用修飾文節の入力を受け付けて前記文に挿入することにより、前記検出手段により検出された形態素である修飾先不特定形態素の修飾先の候補が1つとなるように前記文を校正する文校正手段と
前記修飾先不特定形態素の修飾先の候補の中から、当該修飾先不特定形態素の修飾先の選択を受け付ける第1受付手段とを有し、
前記文校正手段は、前記第1受付手段により前記修飾先不特定形態素の直後の形態素又は文節以外の選択を受け付けた場合、前記修飾先不特定形態素の直後の位置に前記連用修飾文節を挿入することにより、前記文を校正する文校正装置。
請求項1又はに係る発明によれば、修飾先の候補を2以上有する形態素を含む文について、当該形態素の修飾先の候補を1つに特定するように当該文を校正することができ、修飾先の候補を2以上有する形態素の修飾先を選択した場合、修飾先の候補を2以上有する形態素が選択した修飾先以外の修飾先を修飾しないようにすることができる。
請求項に係る発明によれば、挿入する連用修飾文節を他の文における連用修飾文節の出現状況を考慮して選択することができる。
請求項に係る発明によれば、修飾先の候補を2以上有する形態素を含む文を他の言語に翻訳する場合に、当該形態素の修飾先の候補を1つに特定して当該文を翻訳することができる。
図1は、本発明の第1の実施の形態に係る文校正装置の構成例を示す概略図である。 図2は、文取得手段が文書情報から取得した文の一例を示す概略図である。 図3は、形態素解析結果の一例を示す概略図である。 図4(a)及び(b)は、文脈自由文法のルールを適用した構文解析結果の一例を示す概略図である。 図5は、文校正手段によって表示部に提示される表示画像の一例を示す概略図である。 図6は、文校正手段によって表示部に提示される表示画像の一例を示す概略図である。 図7(a)及び(b)は、非交差条件によって修飾先が特定される原理を説明するための図である。 図8は、文校正装置の動作例を示すフローチャートである。 図9は、曖昧性検出手段の動作例を示すフローチャートである。 図10は、第1の実施の形態の変形例であり、文校正手段及び校正候補提示手段によって表示部に提示される表示画像の一例を示す概略図である。 図11は、本発明の第2の実施の形態に係る文校正装置の構成例を示す概略図である。 図12(a)〜(d)は、校正及び翻訳による文書情報及び翻訳文書の変化例を示す概略図である。
[第1の実施の形態]
(文校正装置の構成)
図1は、本発明の第1の実施の形態に係る文校正装置の構成例を示す概略図である。
この文校正装置1は、CPU(Central Processing Unit)等から構成され各部を制御するとともに各種のプログラムを実行する制御部10と、HDD(Hard Disk Drive)やフラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、文や図形等を表示する液晶ディスプレイ等の表示部12と、操作入力用のキーボードやマウス等の操作部13とを有する。なお、文校正装置1は、例えば、パーソナルコンピュータであり、PDA(Personal Digital Assistant)又は携帯電話機等でもよい。
制御部10は、後述する文校正プログラム110を実行することで、文取得手段100、形態素解析手段101、曖昧性検出手段102、文校正手段103、校正候補提示手段104等として機能する。
文取得手段100は、校正対象としての文を記憶部11の文書情報111が含む文から取得する。
形態素解析手段101は、文取得手段100が取得した文を形態素解析する。形態素解析では、文を形態素(言語で意味を持つ最小単位)に分け、それぞれの形態素の品詞を判別する作業を行う。形態素解析には、例えば、JUMAN、茶筌、MeCab等を用いる。
曖昧性検出手段102は、形態素解析手段101が解析した形態素のうち、品詞の候補が2以上あるものを曖昧性がある修飾先不特定形態素として検出する。
文校正手段103は、曖昧性検出手段102が曖昧性を検出した場合、文取得手段100が取得した文を後述する副詞的連用修飾成分の挿入によって校正し、形態素の曖昧性を除去する。
校正候補提示手段104は、文校正手段103が挿入することができる形態素又は形態素の列を候補として挙げる。ここで、「形態素の列」とは、連続する複数の形態素のことをいう。なお、候補は、予め用意された辞書から抽出され、予め定めた条件に基づいて順位が付与される。
記憶部11は、制御部10を上述した各手段100〜104として動作させる文校正プログラム110と、1つ又は2以上の文で構成される文章を情報中に含む文書情報111と、文校正手段103によって文書情報111を校正した校正文書情報112等を記憶する。
文書情報111及び校正文書情報112は、例えば、ワープロ、表計算ソフト等のソフトで作成されたファイルや、HTML文書等である。以上に挙げたファイル中には1つ又は2以上の文から構成される文章が含まれているものとする。
(第1の実施の形態の文校正装置の動作)
以下に、文校正装置1の動作を図1〜9を参照しつつ、(1)基本動作、(2)曖昧性検出動作、(3)校正動作に分けて説明する。
(1)基本動作
図8は、文校正装置1の動作例を示すフローチャートである。
まず、文校正装置1の文取得手段100は、記憶部11から文書情報111を取得し、その文書情報111から1つの文を取得する(S1)。なお、取得する文は、文校正装置1を操作する利用者が指定してもよいし、記憶部11に格納されるすべての文書情報111が有するすべての文を順次取得する構成としてもよい。
図2は、文取得手段100が文書情報111から取得した文の一例を示す概略図である。
文書情報111から取得した文111aが「かわいい靴をみがく人」という文で構成されるとする。ここで、形態素「かわいい」が形態素「靴」を連体修飾するのか、形態素「人」を連体修飾するのかが問題となるが、問題点の詳細については後述する。
次に、形態素解析手段101は、文取得手段100が取得した文111aを形態素解析し、形態素解析結果を出力する(S2)。
図3は、その形態素解析結果の一例を示す概略図である。
形態素解析結果101Aは、形態素解析手段101によって文111aを形態素解析して得られた結果である。形態素解析結果101Aは、分割された形態素を示す形態素欄101aと、形態素の読み仮名を示す読み仮名欄101bと、形態素の基本形を示す基本形欄101cと、形態素の品詞を示す品詞欄101dと、形態素の活用型を示す活用型欄101eと、形態素の活用形を示す活用形欄101fとを有する。
次に、曖昧性検出手段102は、連体修飾の曖昧性検出の一例として、形態素解析結果101Aに基づき文脈自由文法で構文解析を行う(S3)。文脈自由文法とは、以下のルールを満たすものである。
1.S → {NP+|ADV*}{V|A}
2.NP → N PP
3.N → A N
4.N → S N
ここで、「S」は文、「NP」は名詞句、「ADV」は副詞、「V」は動詞、「A」は形容詞、「PP」は助詞、「N」は名詞、「+」は1以上の連続、「*」は0以上の連続を示す。なお、上記ルールの「3.」及び「4.」は、連体修飾を表すルールである。
図4(a)及び(b)は、文脈自由文法のルールを適用した構文解析結果の一例を示す概略図である。
ツリー構造101B及び101Cは、文脈自由文法のルールを適用して文111aを形態素解析結果101Aの形態素欄101aに基づいて構文解析した結果であり、ツリー構造で表される。文111aからは、構文解析結果として2つのツリー構造101B及び101Cが得られる。
次に、曖昧性検出手段102は、複数の構文解析結果が得られたため、連体修飾成分となりうる形態素に注目し、ツリー構造101B及び101Cにおいて連体修飾のルールの適用の差を検証する。なお、ここで、「連体修飾成分」とは、単一又は連続する複数の連体修飾文節を含むものをいう。また、「文節」とは、自立語の出現の度に文を区切るという操作によって切り取られた単位をいう。
具体的には、曖昧性検出手段102は、以下に説明する方法で連体修飾の曖昧性を有する形態素を検出する(S4)。
(2)曖昧性検出動作
図9は、曖昧性検出手段102の動作例を示すフローチャートである。
まず、曖昧性検出手段102は、形態素解析結果101Aの形態素欄101aから形態素を順に取り出し、変数mに格納する(S11)。つまり、まず「かわいい」が取り出される。
以降に説明する動作は、ステップS11で文111aに含まれるすべての形態素が取り出されるまで繰り返される(S12)。
次に、曖昧性検出手段102は、mが連体修飾成分になりうるか否かを判断する(S13)。連体修飾成分になりうる品詞とは、動詞、助動詞、形容詞、形容動詞、連体詞、判定詞等であり、「かわいい」は形容詞であるので連体修飾成分となりうると判断する(S13;Yes)。
次に、曖昧性検出手段102は、ツリー構造101Bをmから上にたどり、連体修飾のルール「3.」又は「4.」が出現するかツリー構造の頂点に着いたら止まる(S14)。ツリー構造101Bにおいて、「かわいい」から上にたどると、ルール「3.」である「N→AN」つまり「かわいい靴」で止まる(S15;Yes)。
次に、曖昧性検出手段102は、ツリー構造101BをNのある方に形態素まで下がる(S16)。つまり、「かわいい靴」からNである「靴」に下がる。
そして、たどり着いた先の形態素をmの修飾先としてmとともに出力する(S17)。つまり、mである「かわいい」の修飾先として「靴」を出力する。
また、曖昧性検出手段102は、ツリー構造101Cに上記ステップS11〜S17を行うことで、「かわいい」の修飾先として「人」を出力する。すなわち、ツリー構造101Bと101Cにおいて「かわいい」の修飾先が異なるため、曖昧性検出手段102は、形態素「かわいい」を連体修飾の曖昧性を有する修飾先不特定形態素として検出する。
(3)校正動作
文校正手段103は、まず、曖昧性検出手段102で特定された、連体修飾の曖昧性を有する修飾先不特定形態素の修飾先を利用者に確認する。そして、修飾先として連体修飾の曖昧性を有する形態素の直後の形態素又は文節以外が指定された場合は、連体修飾の曖昧性を有する形態素の直後に、副詞的連用修飾成分を挿入するように、利用者に促す。一方、修飾先として連体修飾の曖昧性を有する形態素の直後の形態素又は文節が指定された場合は、修飾先の曖昧性を解消することができないため、何もしないか、もしくは、連体修飾の曖昧性を有する形態素の存在を利用者に通知するにとどめる(S5)。
なお、ここで「副詞的連用修飾成分」の「副詞的」とは連体修飾を受けないことであり、「連用修飾成分」とは単一又は連続する複数の連用修飾文節を含むものをいい、例えば、副詞、形容詞の連用形、形容動詞語幹+助詞等が挙げられる。
副詞の例としては、「まだ」、「ずっと」、「いつも」等が挙げられる。形容詞の連用形の例としては、「うつくしく」、「激しく」、「おいしく」等が挙げられる。形容動詞語幹+助詞の例としては、「きれい+に」、「静か+に」、「大胆+に」。さらに、「〜的に」といった語句を用いることもできる。
図5は、連体修飾の修飾先を確認するために文校正手段103によって表示部12に提示される表示画像の一例を示す概略図である。
表示画像120Aは、品詞を示した形態素120a〜120eと、可能性のある修飾先を示す矢印120f及び120gと、修飾先を利用者に判断させるための「『かわいい』の係り先はどちらですか?」という質問文を含むメッセージ120hとを有する。
利用者は、表示部12に表示された表示画像120Aに応じて、「かわいい」の修飾先「靴」又は「人」のいずれかを選択する。選択は、操作部13において行われる。
ここで、例えば、利用者が「かわいい」の修飾先として「人」を選択した場合、文校正手段103は、以下に示す表示画像120Bを表示する。
図6は、連体修飾の修飾先を確定するために文校正手段103によって表示部12に提示される表示画像の一例を示す概略図である。
表示画像120Bは、形態素120a〜120eと、副詞的連用修飾成分を挿入する位置を指示するための「ここに、動詞『みがく』に係る副詞的連用修飾成分を挿入してください。」という指示文を含むメッセージ120iとを有する。
利用者は、表示画像120Bを確認して、「かわいい」と「靴」との間に、例えば、「ごしごし」、「ちゃんと」、「きっちり」等の副詞的連用成分を挿入する。文校正手段103は、利用者の操作に応じて副詞的連用成分を文に挿入し(S6)、校正文書情報112として記憶部11に格納する(S7)。
ここで、文校正手段103は、連体修飾の曖昧性を有する形態素の直後を上記した副詞的連用成分の挿入箇所としているが、これは、以下に説明する日本語の係り受けに関する重要な規則である非交差条件に基づいている。
図7(a)及び(b)は、非交差条件を用いて、「かわいい」の修飾先が特定できる原理を説明するための図である。
図7(a)に示すように、「かわいい」と「靴」との間に「いつも」という副詞の形態素120jを挿入した文103Aの場合、「かわいい」の修飾先103aは「靴」であると仮定してみる。すると、非交差条件により、「いつも」の修飾先103bがなくなってしまう。ゆえに、「かわいい」の修飾先103aは「靴」ではない。そうすると、「かわいい」の修飾先は、図7(b)に示すように、もうひとつの修飾先候補(103c)の「人」しかなくなる。これは、日本語の文内においては修飾先103aと103bとが交差しないという条件に基づいたものである。
ゆえに、非交差条件に基づけば「かわいい」及び「いつも」の修飾先103c及び103dは、図7(b)に示すように、それぞれ「人」及び「みがく」となる。
以上に説明した非交差条件により、文校正手段103は、「かわいい」の修飾先を「靴」ではなく「人」にする場合は、「靴」の前に副詞的連用修飾成分を挿入する。ちなみに、「かわいい」の修飾先を「人」ではなく「靴」にしたい場合は、「かわいい」の修飾先を「靴」に特定することはできない。
(変形例)
図10は、第1の実施の形態の変形例であり、ステップS6において挿入する連体修飾の修飾先を確定するために文校正手段103及び校正候補提示手段104によって表示部12に提示される表示画像の一例を示す概略図である。
表示画像120Cは、形態素120a〜120eと、副詞的連用修飾成分を挿入する位置120kと、「ここに、動詞『みがく』に係る副詞的連用修飾成分を挿入してください。」という指示文を含むメッセージ120lと、副詞的連用成分の候補120m及び120nとを有する。副詞的連用成分の候補120m及び120nは、校正候補提示手段104によって予め定められた辞書等(図示せず)の語句から選択される。
副詞的連用修飾成分の候補120mは、文の意味を大きく変えない意味の薄い連用修飾文節等を提示する。
副詞的連用修飾成分の候補120nは、「みがく」に係る連用修飾文節等を順位付けして提示する。連用修飾文節の候補は、文書情報211や予め定めた他の文書情報(ウェブ上に存在する文章や新聞中の文章)等において「みがく」と共に使われた回数によって順位付けされる。また、回数は、候補とともに括弧書きで提示される。
また、上記回数は、例えば「かわいい靴をブラシでみがく人」という文があったとき、「みがく」を含む連体修飾成分に含まれる、1つ以上の形態素からなる語句(この場合、「ブラシで」)や、それらの上位概念や類義語と共に使われた回数であってもよい。また、複数の語句の組み合わせにおいて上記回数を数えてもよい。例えば、「みがく」と「靴」と共に使われた場合の回数を数えてもよい。
[第2の実施の形態]
第2の実施の形態は、第1の実施の形態の構成を利用して、曖昧性のある語句が含まれる原文を曖昧性を解消して翻訳し、訳文を作成するとともに、訳文と原文との意味に差が生じないようにする点で第1の実施の形態と異なる。
図11は、本発明の第2の実施の形態に係る文校正装置の構成例を示す概略図である。なお、以下の説明において、第1の実施の形態と同一又は対応する構成及び機能を有する部分については共通の符号を付している。以下、第1の実施の形態と異なる構成について説明する。
文校正装置2の制御部10は、文校正プログラム210を実行することで、第1の実施の形態と同様に手段100〜103として機能し、さらにダミー挿入手段204、翻訳手段205、ダミー訳語削除手段206等として機能する。
ダミー挿入手段204は、校正の対象となる文に曖昧性を解消するためにダミーの副詞的連用成分を挿入する。
翻訳手段205は、ダミー挿入手段204によってダミーが挿入された文を日本語以外の他の言語、例えば、英語の翻訳文に変換する。
ダミー訳語削除手段206は、翻訳手段205によって変換された英語の翻訳文からダミーに該当する単一又は複数の英単語を削除する。
記憶部21は、制御部10を手段100〜103及び上述した各手段204〜206として動作させる文校正プログラム110と、翻訳手段205によって文書情報111を英語に翻訳した翻訳文書情報212等を記憶する。なお、以上に説明した校正対象となる文が、例えば、日本語以外の言語で、翻訳文が日本語であってもよいし、校正対象となる文と翻訳文との言語の組み合わせは限定されるものではない。
(第2の実施の形態の文校正装置の動作)
以下に、文校正装置2の動作例を図11及び図12を参照しつつ、翻訳動作を説明する。なお、第1の実施の形態において説明した(1)基本動作、(2)曖昧性検出動作は、第2の実施の形態においても共通するため、説明を省略する。
図12(a)〜(d)は、校正及び翻訳によって文書情報及び翻訳文書が変化する例を示す概略図である。
(1)基本動作、(2)曖昧性検出動作を経て、図12(a)に示す「かわいい靴をみがく人」という内容の文211aから、曖昧性検出手段102が「かわいい」に連体修飾の曖昧性を検出した後、文校正手段103は、連体修飾の曖昧性を解消するため、連体修飾の修飾先を利用者に確認して、副詞的連用修飾成分の挿入箇所を表示部12に提示する。
連体修飾の修飾先を確認するために文校正手段103によって表示部12に提示される表示画像は、図5において説明したものと同様であり、品詞を示した形態素120a〜120eと、可能性のある修飾先を示す矢印120f及び120gと、修飾先を利用者に判断させるための「『かわいい』の係り先はどちらですか?」という質問文を含むメッセージ120hとを有する。
利用者は、表示部12に表示された表示画像120Aに応じて、「かわいい」の修飾先「靴」又は「人」を選択する。選択は、操作部13において行われる。
ここで、例えば、利用者が「かわいい」の修飾先として「人」を選択した場合、ダミー挿入手段204は、「かわいい」と「靴」との間に、例えば、「いつも」等の副詞的連用成分204aを挿入する。文校正手段103は、ダミー挿入手段204によって選択された副詞的連用成分を文211aに挿入し、校正された「かわいいいつも靴をみがく人」という内容の文211bを翻訳手段205に入力する。
翻訳手段205は、入力された文211bを英語に翻訳し、「Cute people who always polish shoes」という内容の訳文212aを出力する。なお、翻訳手段205は、文校正装置2の外部の翻訳装置を利用してもよい。
次に、ダミー訳語削除手段206は、訳文212aから、ダミー挿入手段204が挿入した「いつも」という内容の副詞的連用成分204aに対応する「always」という内容の訳語204bを削除し、「Cute people who polish shoes」という内容の訳文212bを出力する。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々な変形が可能である。
また、上記文校正プログラム110及び210をCD−ROM等の記憶媒体に格納して提供することも可能であり、インターネット等のネットワークに接続されているサーバ装置等から装置内の記憶部にダウンロードしてもよい。また、文取得手段100、形態素解析手段101、曖昧性検出手段102、文校正手段103、校正候補提示手段104、ダミー挿入手段204、翻訳手段205、ダミー訳語削除手段206の一部又は全部をASIC等のハードウェアによって実現してもよい。なお、上記実施の形態の動作説明で示した各ステップは、順序の変更、ステップの省略、追加が可能である。
1、2…文校正装置、10…制御部、11…記憶部、12…表示部、13…操作部、21…記憶部、100…文取得手段、101…形態素解析手段、101A…形態素解析結果、101B、101C…ツリー構造、101a…形態素欄、101b…仮名欄、101c…基本形欄、101d…品詞欄、101e…活用型欄、101f…活用形欄、102…曖昧性検出手段、103…文校正手段、103A…文、103a−103d…修飾先、104…校正候補提示手段、105…校正候補選択手段、110…文校正プログラム、111…文書情報、111a…文、112…校正文書情報、120A−120C…表示画像、120a-120e…形態素、120f…矢印、120h…メッセージ、120i…メッセージ、120j…形態素、120k…位置、120l…メッセージ、120m、120n…候補、204…ダミー挿入手段、204a…副詞的連用成分、204b…訳語、205…翻訳手段、206…ダミー訳語削除手段、210…文校正プログラム、211…文書情報、211a、211b…文、212…翻訳文書情報、212a、212b…訳文

Claims (4)

  1. コンピュータを、
    形態素解析によって複数の形態素に分割された文の前記形態素のうち、連体修飾の修飾先の候補を2以上有する形態素を検出する検出手段と、
    連体修飾を受けない少なくとも1つの連用修飾文節の入力を受け付けて前記文に挿入することにより、前記検出手段により検出された形態素である修飾先不特定形態素の修飾先の候補が1つとなるように前記文を校正する文校正手段と
    前記修飾先不特定形態素の修飾先の候補の中から、当該修飾先不特定形態素の修飾先の選択を受け付ける第1受付手段として機能させ、
    前記文校正手段は、前記第1受付手段により前記修飾先不特定形態素の直後の形態素又は文節以外の選択を受け付けた場合、前記修飾先不特定形態素の直後の位置に前記連用修飾文節を挿入することにより、前記文を校正する文校正プログラム。
  2. 前記文以外の予め定めた他の文における前記連用修飾文節の出現頻度、又は前記連用修飾文節と前記文における前記連用修飾文節を含む連体修飾成分に含まれる1つ以上の形態素からなる語句との前記文以外の予め定めた他の文における共起頻度に基づいて、前記連用修飾文節の順位付けを行う順位付与手段と、
    前記順位付けに基づいて配置して表示された前記連用修飾文節の中から、連用修飾文節の選択を受け付ける第2受付手段として前記コンピュータをさらに機能させ、
    前記文校正手段は、前記第2受付手段による選択を受け付けた連用修飾文節を前記入力を受け付けた連用修飾文節として挿入することにより、前記文を校正する請求項1に記載の文校正プログラム。
  3. 前記文校正手段によって校正された前記文を異なる言語に翻訳する翻訳手段と、
    前記翻訳手段が翻訳した文から前記少なくとも1つの連用修飾文節に対応する語句を削除する削除手段として前記コンピュータをさらに機能させるための請求項1に記載の文校正プログラム。
  4. 形態素解析によって複数の形態素に分割された文の前記形態素のうち、連体修飾の修飾先の候補を2以上有する形態素を検出する検出手段と、
    連体修飾を受けない少なくとも1つの連用修飾文節の入力を受け付けて前記文に挿入することにより、前記検出手段により検出された形態素である修飾先不特定形態素の修飾先の候補が1つとなるように前記文を校正する文校正手段と
    前記修飾先不特定形態素の修飾先の候補の中から、当該修飾先不特定形態素の修飾先の選択を受け付ける第1受付手段とを有し、
    前記文校正手段は、前記第1受付手段により前記修飾先不特定形態素の直後の形態素又は文節以外の選択を受け付けた場合、前記修飾先不特定形態素の直後の位置に前記連用修飾文節を挿入することにより、前記文を校正する文校正装置。
JP2010153112A 2010-07-05 2010-07-05 文校正プログラム及び文校正装置 Expired - Fee Related JP5533359B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010153112A JP5533359B2 (ja) 2010-07-05 2010-07-05 文校正プログラム及び文校正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010153112A JP5533359B2 (ja) 2010-07-05 2010-07-05 文校正プログラム及び文校正装置

Publications (2)

Publication Number Publication Date
JP2012014630A JP2012014630A (ja) 2012-01-19
JP5533359B2 true JP5533359B2 (ja) 2014-06-25

Family

ID=45600945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010153112A Expired - Fee Related JP5533359B2 (ja) 2010-07-05 2010-07-05 文校正プログラム及び文校正装置

Country Status (1)

Country Link
JP (1) JP5533359B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3081232B2 (ja) * 1990-11-20 2000-08-28 株式会社リコー 言語処理装置
JP3408830B2 (ja) * 1992-11-24 2003-05-19 株式会社リコー 日本語文構文解析装置
JP3999103B2 (ja) * 2002-11-07 2007-10-31 株式会社東芝 自然言語処理装置

Also Published As

Publication number Publication date
JP2012014630A (ja) 2012-01-19

Similar Documents

Publication Publication Date Title
JP4635659B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
KR101279759B1 (ko) 컴퓨터 시스템에 의해 구현가능한 방법, 컴퓨팅 시스템에 의해 실행가능한 명령어들을 포함하는 매체 및 컴퓨팅 시스템
JP5362353B2 (ja) 文書中のコロケーション誤りを処理すること
Ramisch et al. mwetoolkit: A framework for multiword expression identification.
JP5403696B2 (ja) 言語モデル生成装置、その方法及びそのプログラム
Vandeghinste et al. Translating text into pictographs
JP6584795B2 (ja) 語彙知識獲得装置、語彙知識獲得方法、及び語彙知識獲得プログラム
JP5564705B2 (ja) 文構造解析装置、文構造解析方法および文構造解析プログラム
Beck et al. Representation problems in linguistic annotations: Ambiguity, variation, uncertainty, error and bias
Toral et al. Linguistically-augmented perplexity-based data selection for language models
JP2006251843A (ja) 同義語対抽出装置及びそのためのコンピュータプログラム
US20150081273A1 (en) Machine translation apparatus and method
JP5533359B2 (ja) 文校正プログラム及び文校正装置
JP2008021139A (ja) 意味タグ付け用モデル構築装置、意味タグ付け装置及びコンピュータプログラム
JP2007206796A (ja) 文字処理装置、方法、プログラムおよび記録媒体
JP6689466B1 (ja) 文構造ベクトル化装置、文構造ベクトル化方法、及び文構造ベクトル化プログラム
JP6114090B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP2006190072A (ja) 自動換言装置、自動換言方法及び換言処理プログラム
JP2007072841A (ja) 単語抽出方法、データベース構築方法、データベース構築装置、データベース構築プログラムおよび記録媒体
Loáiciga et al. It-disambiguation and source-aware language models for cross-lingual pronoun prediction
JP7243818B2 (ja) 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム
JP2010040020A (ja) キーワード抽出装置、方法及びプログラム
Mattiuzzi An evaluation of part-of-speech taggers for French
JP2011186507A (ja) 翻訳前換言規則生成システム、翻訳前換言規則生成方法および翻訳前換言規則生成用プログラム
JP2008071001A (ja) 自然言語処理装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130617

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

R150 Certificate of patent or registration of utility model

Ref document number: 5533359

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140414

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees