JP3855058B2 - 言い換えを利用した文章作成支援処理装置および方法 - Google Patents
言い換えを利用した文章作成支援処理装置および方法 Download PDFInfo
- Publication number
- JP3855058B2 JP3855058B2 JP2003186859A JP2003186859A JP3855058B2 JP 3855058 B2 JP3855058 B2 JP 3855058B2 JP 2003186859 A JP2003186859 A JP 2003186859A JP 2003186859 A JP2003186859 A JP 2003186859A JP 3855058 B2 JP3855058 B2 JP 3855058B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- paraphrase
- dictionary
- proposition
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
【発明の属する技術分野】
本発明は、コンピュータを用いた自然言語処理技術に関する。より詳しくは、ある自然言語で記述された文を別の表現による文に変換する言い換えを利用して文章作成を支援する、言い換えを利用した文章作成支援処理装置および方法に関する。
【0002】
【従来の技術】
言い換えとは、ある自然言語で記述された文を別の表現による文に変換する処理であって、文の中核的な意味を保持したままで、文の長さ・文体・表現などを変換するものをいう。
【0003】
言い換えは、概ね、構文的言い換え、意味的言い換え、およびプラグマティックな言い換えに分類することができる(非特許文献1参照)。
【0004】
構文的言い換えは、文に表れる語句を同義語や類義語に置き換えて文の表現を変える処理、文構造のマッピングにもとづいて文を変形する処理などをいう。例えば、元の表現「システムを生成する」の<生成する>を<作る>に置き換えて、新たな表現「システムを作る」に変形する処理である。
【0005】
意味的言い換えは、参照表現などをその指示内容に置き換えて文の表現を変える処理のように、その文が発話された文脈や状況などを参照して文を変形する処理をいう。例えば、元の表現「去年の出来事」が1999年に発話されていた場合に、<去年>が<1998年>を意味すると解析して、新たな表現「1998年の出来事」に変形する処理である。
【0006】
プラグマティックな言い換えとは、前記の二種類の言い換え以外のより複雑な言い換えを行う処理であって、ある状況において同じ効果を持つような表現へ変形する処理をいう。例えば、元の表現「どなたかgccのソースの在りかをご存じないでしょうか」において、<どなたか−ご存じないでしょうか。>、<gccのソースの在り処を>などの意味解析から、この表現が、物の所在場所を問い合わせる文脈であると解析し、新たな表現「gccのソースが置いてあるftpサイトを教えてください」に変形するものである。
【0007】
ここで、コンピュータやワープロで実行される文章作成処理ソフトウェアの文章編集機能を利用して文の言い換えを行う例として、以下のような2つの文の順序を入れ替える作業を想定する。
【0008】
「太郎は公園を散歩しなかった。なぜなら、雨が降っていたからだ。」
ユーザは、先ずカット・アンド・ペースト操作により、前文「太郎は公園を散歩しなかった。」を後文「なぜなら、雨が降っていたからだ。」の後尾に移動させる。2つの文は以下のようになる。
【0009】
「なぜなら、雨が降っていたからだ。太郎は公園を散歩しなかった。」
しかし、並び替え後の2つの文の表現は、自然言語(ここでは、日本語)としては不自然であり、文の表現を変える必要がある。そこで、ユーザは、不要な文字や語句の削除、必要な文字や語句の挿入などを、文字キーの操作(以下、キータイプという)によって行う。キータイプ後、2つの文は以下のようになる。
【0010】
「<>雨が降って<いた>。<だから、>太郎は公園を散歩しなかった。」(<>は、キータイプによる変更部分)
さらに、並び替えた2つの文を1つの文に結合する言い換えを想定する。ユーザは、同様に、語句の削除・挿入をキータイプによって行う。キータイプ後、2つの文は以下のようになる。
【0011】
「雨が降っていた<から、>太郎は公園を散歩しなかった。」
以上のように、文の並び替え、結合などによる文の言い換えでは、文の表現が自然なものとなるように、語句の削除や挿入などのキータイプが必要となる場合が多い。
【0012】
【非特許文献1】
乾 健太郎、”言語表現を言い換える技術”、
言語処理学会第8回年次大会チュートリアル予稿集、言語処理学会、
2002年3月、pp.1−21
【0013】
【発明が解決しようとする課題】
文章作成処理ソフトウェアを用いて文章を作成する場合に、既存の文章データを活用することは多い。この場合に、既存の文章データ中の文を結合、分割などにより変形して利用するとき、従来、ユーザは、語句の削除や挿入などのキータイプを行って、文の表現が自然なものとなるように、すなわち利用しようとする文が前後の文脈と合致するように、文を変形しなければならない。
【0014】
しかし、文の表現を変えるためにキータイプを行うことは煩雑である。特に、近年急速に普及し始めたマウス操作が入力操作の中心となっているコンピュータやタブレット型コンピュータなどにおいて、キータイプによる文字入力は、かえって煩雑になっている。
【0015】
しがたって、ポインティング機能が入力操作の中心となっているコンピュータにおいて、できる限りキータイプせずに文章作成を行うことを支援する仕組みの実現が強く要求されている。
【0016】
また、従来のような単なる構文的言い換えや意味的言い換えを行うだけでは、言い換えたい文が発話された文脈と合致しない不自然な表現の変形が行われてしまうおそれがあり、実際の文章作成支援に利用することができなかった。
【0017】
本発明の目的は、文の言い換えを利用した文章作成支援において、キータイプを行うことなく簡単な操作により文章作成支援ができるようにすることである。
【0018】
また、本発明の別の目的は、文の言い換えを利用した文章作成支援において、文の文脈を考慮した自然な表現の言い換えを行うことにより、有用性の高い文章作成支援ができるようにすることである。
【0019】
【課題を解決するための手段】
上記課題を解決するため、本発明は、ある自然言語で記述された文データを別の表現による文データに変換する言い換え処理を利用した文章作成支援処理装置、およびコンピュータが実行する言い換え処理を利用した文章作成支援処理方法である。言い換え処理を利用した文章作成支援処理では、以下の処理を行う。
【0020】
本発明では、文データが記述する行為もしくは状態を定義する命題タイプが記述された命題辞書、または、前記命題辞書および文中の手がかり表現と文同士の対応関係を示す命題間タイプとの関係が記述された命題連接辞書との組のいずれかの辞書データを記憶する命題辞書記憶手段と、係り受け関係もしくは手がかり表現にもとづく言い換えパターンを記述した言い換え辞書を記憶する言い換え辞書記憶手段と、良い文章構造であると認定された文章データであって、前記命題タイプが付与された模範文章データを記憶するテンプレート辞書を記憶するテンプレート辞書記憶手段とを備える。そして、ユーザに対して表示された文章データから、ユーザの操作によって特定された言い換え操作の対象とする操作対象部分、および言い換え操作の種別を示す文操作情報を取得する。
【0021】
そして、前記操作対象部分の内部構造および意味を解析し、前記命題辞書記憶手段に記憶された前記命題辞書を参照して、前記解析結果から前記操作対象部分の命題タイプを同定し、前記文操作情報に従って、前記言い換え辞書記憶手段に記憶された言い換え辞書の前記言い換えパターンを参照して前記操作対象部分の言い換えを行い、言い換え群を生成する。
【0022】
その後、前記テンプレート辞書記憶手段に記憶された前記テンプレート辞書から前記操作対象部分の命題タイプを含む模範文章データを抽出し、前記模範文章データの文脈と前記操作対象部分を含む所定の範囲の文章データであって前記言い換え群から取り出した言い換えにより言い換えた事例文章データの文脈とを比較して、前記模範文章データの文章構造と前記事例文章データの文章構造との類似を評価し、所定の評価を得た言い換えを言い換え候補として出力する。
【0023】
また、本発明は、上記の処理を行う場合に、ユーザに対して表示された文章データの任意の節もしくは文、または所定の選択項目を、入力ポインティング機能を用いて選択することにより行う。
【0024】
なお、ユーザによって、表示装置などに出力した言い換え候補から所望する候補が選択されると、本発明は、所定の文章作成処理手段に対し、選択された言い換え候補を、元の文章データの該当箇所に対する入力データとして渡す。
【0025】
本発明によれば、ユーザは、マウス、タブレットペンおよび入力パネルなどの入力手段が備えるポインティング機能を用いて、既存の文章データから言い換えに利用したい操作対象部分(文字列)を選択することができ、さらに、言い換え候補の中から所望する候補を選択することができる。
【0026】
選択された言い換え候補は、所定の文章作成処理において入力文(入力文字列)とされるため、ユーザは、キータイプを行うことなく入力文を取得でき、簡単に文章を作成することが可能となる。
【0027】
また、コンピュータが読み取り可能な何らかの文章データがあれば、その文章データを活用して新たな文章データを作成することが可能となり、文章作成作業の効率化を図ることができる。
【0028】
さらに、本発明は、操作対象部分(文字列)の言い換え処理を行った後、言い換え処理により生成した言い換え群の中から、言い換えられる文章の文脈を考慮して、言い換えが文脈に合致すると一定の評価を得たものを言い換え候補として絞り込む。これにより、ユーザは、適切な言い換え候補に絞り込まれたものの中から所望する言い換え候補を選択することができ、実用的な文章作成支援を実現することができる。
【0029】
なお、本発明は、コンピュータにより読み取られ実行されるプログラムとして実施することができる。本発明を実施するプログラムは、コンピュータが読み取り可能な、可搬媒体メモリ、半導体メモリ、ハードディスクなどの適当な記録媒体に格納することができ、これらの記録媒体に記録して提供され、または、通信インタフェースを介して種々の通信網を利用した送受信により提供されるものである。
【0030】
【発明の実施の形態】
以下、本発明の実施の形態を説明する。
【0031】
図1は、実施の一形態において、本発明の構成例を示す図である。
【0032】
文章作成支援装置1は、入出力処理手段11、文解析処理手段12、言い換え処理手段13、文脈マッチング処理手段14、入出力装置17、および記憶部20を備え、記憶部20には、体言辞書21、用言辞書22、命題辞書23、命題連接辞書24、言い換え辞書25、およびテンプレート辞書26などのデータが格納される。
【0033】
体言辞書21は、一般的に体言と分類される名詞、代名詞などについて、その意味情報と、品詞、項として共起しやすい用言などの構文情報とを記述するデータである。用言辞書22は、一般的に動詞、形容詞などについて、意味情報と、品詞、活用形、共起しやすい助詞、および項として共起しやすい用言などの構文情報とを記述するデータである。体言辞書21および用言辞書22は、相互に参照が可能なように構成されている。なお、体言辞書21および用言辞書22は、一般的に提供されている既存のコンピュータ用日本語辞書データなどにより実現される。
【0034】
命題辞書23は、文末表現や文構造などと文の命題タイプとの関係が記述されたデータである。命題タイプとは、文に表れる時制、モダリティ、アスペクトなどの組み合わせによって、その文が記述する行為や状態などを定義する分類ラベル情報である。命題タイプの例として、主題、現象、事実、判断などが定義される。
【0035】
命題辞書23は、最も簡単な構造をとる場合には、文末表現に所定の命題タイプがラベル付けされたデータで構成される。一般的に、動詞や形容詞などの用言が文末や複文にある場合に、これらの用言には時制、モダリティ、アスペクトなどの諸情報が表示されることから、以下のように、文末表現ごとに命題タイプを定義しておく。
【0036】
「表現」[命題タイプ]、
「しなくてはならない」[義務、客観]、
「かもしれない」[予想]、…。
【0037】
または、命題辞書23は、複数の項および述語の組で記述される文に所定の命題タイプがラベル付けされたデータで構成される。
【0038】
一般的に、「太郎が公園で散歩した。」は、<太郎が, 公園で, 散歩する>というような形<項,項,…,述語>で記述されるため、文末の動詞「散歩する」に表示されている時制、モダリティ、アスペクトにもとづいて所定の命題タイプが付与される。
【0039】
<太郎が, 公園で, 散歩した>[事実動作の過去]、
<太郎は, 公園で, 散歩したかった>[願望過去] 、…。
【0040】
さらに、「太郎は公園で散歩がしたかったが、外は雨が降っていた。」のような複文の場合には、以下のように、前節(前件)と後節(後件)にそれぞれ命題タイプがラベル付けされる。
【0041】
<太郎は, 公園で, 散歩したかった>[2重複文前件−願望過去] ;
<外は, 雨が, 降っていた>[2重複文後件−自然現象過去描写] 。
【0042】
命題連接辞書24は、係り受け、接続などの手がかり表現と所定の命題間タイプとの関係が記述されたデータである。命題間タイプとは、手がかり表現などによって複数の命題の接続関係を定義する分類ラベル情報である。命題間タイプの例として、因果、並列、時間経過、詳細化、例示などが定義される。
【0043】
例えば、文「太郎は公園で散歩がしたかったが、外は雨が降っていた。」の場合には、以下のような内部構造となる。
【0044】
<太郎は, 公園で, 散歩したかった><が><外は, 雨が, 降っていた>
そして、前節(前件)と後節(後件)との接続語<が>を手がかり表現となるから、以下のような命題間タイプが付与されたデータが命題連接辞書24に記憶される。
【0045】
<太郎は, 公園で, 散歩したかった>[2重複文前件−願望過去] ;
<が>[命題間タイプ=逆説];
<外は, 雨が, 降っていた>[2重複文後件−自然現象過去描写]
言い換え辞書25は、係り受け関係などにもとづく相互に言い換え可能な表現パターンを記述したデータである。
【0046】
テンプレート辞書26は、よい文章構造であると認定された所定の単位の文章データ(模範文章)であって、命題タイプ、命題間タイプなどの情報が付与されたデータである。
【0047】
ここで、よい文章構造であるか否かの認定基準は、その文章の種類や用途などによって異なるものである。そのため、ユーザが作成したい文章の用途や種類などに応じて、例えば新聞記事用テンプレート辞書、学術論文用テンプレート辞書、法律文章用テンプレート辞書など、予め用途や種類などにより分類した文章種別ごとに対応するテンプレート辞書26が用意され、文脈マッチング処理手段14によって、テンプレート辞書26が切り替えられるように構成されていてもよい。
【0048】
入出力処理手段11は、入出力装置17とのデータ入出力処理を行う手段である。入出力装置17の入力機能は、マウス、タブレットペンと入力パネルの組み合わせなどにより実現することができる。
【0049】
入出力処理手段11は、言い換え操作の対象となる文字列データ(操作対象部分)の選択元となる文章データ(元の文章)を入出力装置17に表示し、ユーザによって選択される操作対象部分と、言い換え操作の種別を特定する文操作情報3とを取得する。
【0050】
なお、操作対象部分として選択される部分は、節、文、または文章などであるが、本例では文単位に選択されものとし、入出力処理手段11は、操作対象部分として操作対象文2を取得する。
【0051】
また、文操作情報3の例として、以下のような操作が定義されているとする。
【0052】
分割:1つの文を分割し、複数の文を生成する処理、
結合:複数の文を結合し、1つの文を生成する処理、
削除:文の特定された部分を削除する処理、
態変換:文の態(能動態または受動態)を変換する処理、
主題化:文の特定された部分を主題とする文を生成する処理、…。
【0053】
また、入出力処理手段11は、言い換えが文脈に合致すると評価された一または複数の言い換え候補4を入出力装置17に表示し、ユーザが選択した言い換え候補4を取得する。
【0054】
なお、所定の文章作成処理手段(図示しない)では、操作対象文2が選択された元の文章データ(元の文)をユーザが選択した言い換え候補4により言い換えて、新たな文章データとする。
【0055】
なお、ユーザが操作対象文2、文操作情報3、および言い換え候補4の選択を行う入出力装置17は、少なくとも表示画面上に表示された項目を選択し、文字列データを特定することができる機能を備えていればよい。
【0056】
文解析処理手段12は、体言辞書21、用言辞書22を参照し、所定の解析手法を用いて、操作対象文2の内部構造および意味を解析し、命題辞書23をもとに操作対象文2の命題タイプを同定し、命題連接辞書24をもとに操作対象文2の命題間タイプを同定する手段である。
【0057】
言い換え処理手段13は、言い換えを辞書25を参照して、文操作情報3に対応する操作対象文2の言い換え処理を行い、言い換え群を生成する処理手段である。言い換え処理では、構文情報や意味情報を用いて構文的または意味的な言い換えを行い、多くの言い換えを生成する。
【0058】
文脈マッチング処理手段14は、テンプレート辞書26を参照し、言い換え群の各言い換えについて、その言い換えを行う文章データ(事例文章)の文脈を、テンプレート辞書26の対応する模範文章の文脈と比較し、模範文章の良い文脈に一定の程度で類似する場合に、その事例文章で用いた言い換えを抽出する処理手段である。
【0059】
図2に、文章作成支援装置1の処理の流れを示す。まず、文分割の場合を例に、処理の流れを説明する。
【0060】
ステップS10:入出力処理手段11では、操作対象文2の選択を促す操作対象選択画面を入出力装置17に表示する。
【0061】
図3に、操作対象選択画面50の例を示す。ユーザは、操作対象選択画面50の操作対象文を選択する元の文章表示域51上で、文「昨日の会議は双方の意見に利益がかみあわず、議論がすれ違った。」を操作対象文2として選択する。
【0062】
ステップS11:文解析処理手段12では、体言辞書21および用言辞書22を参照して、操作対象文2を構成する各素の構文解析・意味解析を行い、文解析情報、意味解析情報などを取得する。なお、文解析処理手段12が行う文解析処理および意味解析処理は、既存の一般的な処理手法を用いて行う。
【0063】
ステップS12:文解析処理手段12では、操作対象文2の文解析情報、意味解析情報などをもとに命題辞書23から合致する文末表現や文を抽出し、その文末表現または文に付与されている命題タイプを操作対象文2の命題タイプと同定する。
【0064】
ステップS13:文解析処理手段12では、操作対象文2の文解析情報の中の係り受け関係を示す情報をもとに、命題連接辞書24から合致する係り受け関係を抽出し、その命題間タイプを操作対象文2の命題間タイプと同定する。
【0065】
ステップS11〜ステップS13の処理において、文解析処理手段12では、操作対象文2から、図4(A)に示すような文解析情報、意味解析情報、命題タイプ、命題間タイプなどの情報を取得する。
【0066】
「前文a:
<昨日の会議は>[主題]
<双方の,意見に,利益が,かみあわない,>[ず形前件−客観観察]
後文b:
<議論が,すれ違う>[過去−客観観察]
命題間タイプ:因果」
ステップS14:さらに、入出力処理手段11では、操作対象選択画面50の文操作指定欄52から文操作情報3を取得する。ここでは、文操作指定欄52で「文分割」が選択されているため、文操作情報3として「分割」を取得する。
【0067】
ステップS15:言い換え処理手段13では、文操作情報3に対応する操作対象文2の言い換えを、言い換え辞書25の言い換えパターンを参照して生成する。生成した言い換えを言い換え群とする。
【0068】
例えば、図4(B)に示すように、言い換え辞書25に以下のような言い換えパターンが記憶されているとする。
【0069】
「…ことによって、…だ。」、
「…なので、…だ。」、
「…だ。ゆえに、…した。」、
「…だ。その結果、…しなかった。」、…。
【0070】
言い換え処理手段13では、これらの言い換えパターンを用いて、以下のような操作対象文2のさまざまな言い換えを生成して言い換え群とする。
【0071】
「…利益がかみあわなかった。それで、議論が…。」、
「…利益が一致しなかった。ゆえに、議論が…。」、
「…利益と合わなかった。ゆえに、議論が…。」、…。
【0072】
ステップS16:文脈マッチング処理手段14では、テンプレート辞書26を参照した文脈マッチングにより、言い換え群から、その言い換えを行う文章データ(事例文章)が適切な文脈となるものを絞り込む。
【0073】
文脈マッチング処理手段14では、テンプレート辞書26を参照し、操作対象文2の命題を含む模範文章を抽出する。また、言い換え群から言い換えを一つずつ取り出し、操作対象文2が選択された元の文章データの所定の範囲(例えば段落)を切り出して事例文章データ(事例文章)とする。事例文章を取り出した言い換えを用いて言い換え、構文情報および意味情報を取得し、さらに、命題タイプおよび命題間タイプを取得する。
【0074】
そして、事例文章の命題タイプの並びと取り出した模範文章の命題タイプの並びとについてマッチング処理を行い、両者の所定の範囲全体での命題タイプの並び、および、言語表現の並びが、どの程度類似するかについて評価する。所定の評価を得た事例文章の言い換えを抽出する。
【0075】
上記の類似評価を、言い換え群の全ての言い換えについて行い、抽出した言い換えを言い換え候補とする。なお、抽出した言い換えから評価の良い言い換えを所定数だけ選択して言い換え候補としてもよい。
【0076】
図4(C)に示すように、操作対象文2の命題間タイプが「因果」であるから、テンプレート辞書26から、命題間タイプ=因果を含むような模範文章を抽出する。例えば、テンプレート辞書26に、以下のような文を含む模範文章があるとする。
【0077】
因果:「双方の言い分がかみあわず、交渉はすれ違いに終わった。」
この模範文章の命題タイプの並びと、事例文章の命題タイプの並びの類似度を評価し、所定の類似度を持つと評価された言い換えを言い換え候補c(c1、c2、…)とする。
【0078】
その後、入出力処理手段11では、言い換え候補表示画面60を入出力装置17に表示する。
【0079】
図5に、言い換え候補表示画面60の例を示す。言い換え候補表示画面60の言い換え候補表示域61に、以下のような言い換え候補c1、c2が表示される。
【0080】
c1:「昨日の会議は双方の意見に利益がかみあわなかった。ゆえに議論がすれ違った。」
c2:「昨日の会議は双方の意見に利益がかみあわなかった。その結果議論がすれ違った。」
ユーザは、入出力装置17のポインティング機能を用いて言い換え候補表示域61から所望する言い換え候補を選択すると、選択された言い換え候補cにより元の文章データの該当する箇所が言い換えられた文章データが新たな文章データとして文章作成欄62に表示される。
【0081】
次に、図6〜図8を用いて、2つの文を結合して1つの文に言い換える場合の処理の流れを説明する。
【0082】
図6に示すように、ユーザは、操作対象選択画面50の元の文章表示域51上で、以下のような2つの操作対象文2を選択する。
【0083】
文2a:「検問所で、31日、停止命令に従わなかったワゴン車に兵士が発砲した。」
文2b:「そのため、車に乗っていた13人の女性と子供のうち7人が死亡した。」
文解析処理手段12は、体言辞書21および用言辞書22を参照して、選択された操作対象文2(文2aおよび文2b)について文/文間解析、意味解析などの処理を行う。さらに、文解析情報、意味解析情報などをもとに命題タイプおよび命題間タイプを同定する。
【0084】
例えば、図7(A)に示すような解析情報、命題タイプ、命題間タイプが取得される。
【0085】
文2a: <検問所で,31日,停止命令に,従わない,ワゴン車に,兵士が,発砲する。>[過去−事実]
文2b:<そのため,車に,乗る,13人の,女性と,子供の,うち,7人が,死亡する。>[過去−事実]
[命題間タイプ=事実前後関係]
さらに、操作対象選択画面50の文操作指定欄52で選択された「文結合」、およびユーザのマウス操作やタブレットペン操作などから、図7(B)に示すように、「文操作情報=結合」および「結合の方向=文2a→文2b」が取得される。
【0086】
そして、言い換え処理手段13は、言い換え辞書25の言い換えパターンを参照して、文結合に対応する言い換えを生成する。さらに、文脈マッチング処理手段14は、「文分割」例における処理の場合と同様に、テンプレート辞書26の模範文章の命題タイプの並びと、言い換え群の言い換えを用いた事例文章の命題タイプの並びとの類似評価を行う。所定の範囲全体での両者の命題タイプの並びが一定以上で類似していると評価した場合には、図7(C)に示すように、その言い換えを言い換え候補とする。
【0087】
c1:「31日、検問所で、停止命令に従わなかったワゴン車に兵士が発砲したため、ワゴン車に乗っていた13人の女性と子供のうち7人が死亡した。」、
c2:「31日、検問所で、兵士の発砲によって、停止命令に従わなかった車に乗っていた13人の女性と子供のうち7人が死亡した。」、
c3:「31日、検問所で、兵士が発砲し、停止命令に従わなかった車に乗っていた13人の女性と子供のうち7人が死亡した。」、…。
【0088】
入出力処理手段11では、図8に示すように、言い換え候補表示画面60の言い換え候補表示域61に抽出された言い換え候補を表示する。
【0089】
次に、図9を用いて、文形式を変更する言い換え操作のうち、受動化の場合の処理の流れを説明する。
【0090】
操作対象文2の選択は、文分割、文結合などの場合と同様である。ユーザにより、操作対象選択画面50の元の文章表示域51上で、図9(A)に示すような操作対象文2が選択されたとする。
【0091】
「広場に集まった群衆は、その大きな銅像を引き倒した。」
文解析処理手段12は、文分割の処理の場合と同様に、操作対象文2について文解析情報、意味解析情報を取得し、命題タイプなどを同定する。
【0092】
<広場に,集まった,群衆は,その,大きな,銅像を,引き倒した。>[過去−事実]
さらに、図6に示す操作対象選択画面50と同様の画面での文操作指定欄52での「受動化」の選択、およびユーザのマウス操作やタブレットペン操作などから、図9(B)に示すように、文操作情報=受動化が取得される。
【0093】
その後、言い換え処理手段13では、言い換え辞書25の言い換えパターンを参照して、受動化の言い換えを生成する。そして、文脈マッチング処理手段14は、文分割の処理の場合と同様に、テンプレート辞書26の模範文章の命題タイプの並びと事例文章の命題タイプの並びとの類似評価を行い、図9(C)に示すように、所定の評価を得た言い換えを言い換え候補とする。
【0094】
c1:「その大きな銅像は、広場に集まった群衆によって引き倒された。」、
c2:「広場に集まった群衆によって、その大きな銅像は引き倒された。」、…。
【0095】
入出力処理手段11では、言い換え候補表示画面60の言い換え候補表示域61に抽出された言い換え候補を表示する。
【0096】
次に、図10を用いて、文形式を変更する言い換え操作のうち主題化の場合の処理の流れを説明する。
【0097】
文分割、文結合などの場合と同様に、ユーザにより、操作対象選択画面50の元の文章表示域51上で、図10(A)に示すような操作対象文2が選択されたとする。
【0098】
「検問所で、停止命令に従わなかった車に乗っていた13人の女性と子供のうち7人が死亡した。」
文解析処理手段12は、操作対象文2の文解析情報、意味解析情報などを取得し、命題タイプなどを同定する。
【0099】
<検問所で,停止命令に,従わなかった,車に,乗っていた,13人の,女性と,子供の,うち,7人が,死亡した。>[過去−事実]
さらに、図6に示す操作対象選択画面50と同様の画面での文操作指定欄52での「主題化」の選択、およびユーザのマウス操作やタブレットペン操作などから、図10(B)に示すように、文操作情報=主題化、および「主題化の対象=<7人が,死亡した>」が取得される。
【0100】
言い換え処理手段13は、言い換え辞書25の言い換えパターンを参照して、主題化の言い換えを生成する。そして、文脈マッチング処理手段14は、文分割の場合の処理と同様に、テンプレート辞書26の模範文章の命題タイプの並びと事例文章の命題タイプの並びとの類似評価を行い、図10(C)に示すように、所定の評価を得た言い換えを言い換え候補とする。
【0101】
c1:「7人の死亡は、検問所で、停止命令に従わなかった車に乗っていた13人の女性と子供のうちで起った。」、
c2:「7人の死亡は、検問所で、停止命令に従わなかった車の13人の女性と子供のうちで起った。」、…。
【0102】
次に、図11を用いて、文の一部を削除する場合の処理の流れを説明する。
【0103】
文分割、文結合などの場合と同様に、ユーザにより、操作対象選択画面50の元の文章表示域51上で、図11(A)に示すような操作対象文2が選択されたとする。
【0104】
「彼は学校に入学したけれど、講義がつまらなくて、すぐ辞めてしまった。」文解析処理手段12は、操作対象文2について文解析情報、意味解析情報などを取得し、命題タイプ、命題間タイプを同定する。
【0105】
<彼は,学校に,入学した>[過去−事実];
<けれど>=逆説;
<講義が,つまらなくて>[過去−判断];
<すぐ,辞めてしまった>[過去−事実]
さらに、操作対象選択画面50の文操作指定欄52での「削除」選択により、文操作情報=削除を取得する。
【0106】
言い換え処理手段13は、言い換え辞書25の言い換えパターンを参照して、削除の言い換えを生成する。そして、文脈マッチング処理手段14は、文分割の場合の処理と同様に、テンプレート辞書26の模範文章の命題タイプの並びと事例文章の命題タイプの並びとの類似評価を行い、図11(C)に示すように、類似と評価した言い換えを言い換え候補とする。
【0107】
c1:「彼は学校に入学したけれど、すぐ辞めてしまった。」、
c2:「学校の講義がつまらなくて、彼はすぐ辞めてしまった。」、…。
【0108】
このように、本発明では、操作対象選択画面50上に表示された既存の文章データから言い換えの操作をしたい文データをユーザがマウス操作やタブレットペン操作により選択するだけで、その言い換えの操作をしたい文の前後の文脈と合致した適切な表現の言い換え候補群を提示することができる。これにより、ユーザは、キータイプを行うことなく、文章データの表現を変更することができ、文章作成作業を効率よく行うことができる。
【0109】
以上、本発明をその実施の形態により説明したが、本発明はその主旨の範囲において種々の変形が可能である。
【0110】
本発明の実施の形態では、文章作成支援装置1を、コンピュータに読み取られ実行される処理プログラムとして実現する場合に、入出力処理手段11は、文章作成支援装置1を実行するコンピュータのオペレーティング・システムにより提供される処理機能を利用することが可能である。
【0111】
【発明の効果】
以上説明したように、本発明によれば、言い換えたい文および言い換えたい操作の種別の選択、および言い換え候補から所望する候補の選択は、表示画面上で選択したい項目を指定することにより行われる。ユーザは、言い換えのためのキータイプを行う必要がなく、簡単な項目選択の操作だけで言い換えられた表現を利用して文作成を行うことができる。よって、本発明は、文章作成支援処理における操作負担の軽減を図ることができる。
【0112】
さらに、本発明によれば、言い換え処理において、言い換えたい文が含まれる段落の文脈の流れを考慮し、その文脈において良い文章構造であると評価された言い換え候補のみを提示するため、ユーザは、自然な表現の言い換え候補のみが提示されるため、適切な言い換え候補を得て文章の作成を行うことができる。よって、本発明は、より実用的な文章作成支援処理を提供することができる。
【0113】
また、本発明は、既存の文章データを活用した効率的な文章作成支援処理を提供することができる。
【図面の簡単な説明】
【図1】本発明の構成例を示す図である。
【図2】文章作成支援装置の処理の流れを示す図である。
【図3】操作対象選択画面の例を示す図である。
【図4】文分割の場合の処理を説明するための図である。
【図5】言い換え候補表示画面の例を示す図である。
【図6】操作対象選択画面の例を示す図である。
【図7】文結合の場合の処理を説明するための図である。
【図8】言い換え候補表示画面の例を示す図である。
【図9】受動化の場合の処理を説明するための図である。
【図10】主題化の場合の処理を説明するための図である。
【図11】削除の場合の処理を説明するための図である。
【符号の説明】
1 文章作成支援装置
11 入出力処理手段
12 文解析処理手段
13 言い換え処理手段
14 文脈マッチング処理手段
17 入出力装置
20 記憶部
21 体言辞書
22 用言辞書
23 命題辞書
24 命題連接辞書
25 言い換え辞書
26 テンプレート辞書
Claims (6)
- ある自然言語で記述された文データを別の表現による文データに変換する言い換え処理を利用した文章作成支援処理装置であって、
文データが記述する行為もしくは状態を定義する命題タイプが記述された命題辞書、または、前記命題辞書および文中の手がかり表現と文同士の対応関係を示す命題間タイプとの関係が記述された命題連接辞書との組のいずれかの辞書データを記憶する命題辞書記憶手段と、
係り受け関係もしくは手がかり表現にもとづく言い換えパターンを記述した言い換え辞書を記憶する言い換え辞書記憶手段と、
良い文章構造であると認定された文章データであって、前記命題タイプが付与された模範文章データを記憶するテンプレート辞書を記憶するテンプレート辞書記憶手段と、
ユーザに対して表示された文章データから、ユーザの操作によって特定された言い換え操作の対象とする操作対象部分、および言い換え操作の種別を示す文操作情報を取得する入力処理手段と、
前記操作対象部分の内部構造および意味を解析し、前記命題辞書記憶手段に記憶された前記命題辞書を参照して、前記解析結果から前記操作対象部分の命題タイプを同定する文解析処理手段と、
前記文操作情報に従って、前記言い換え辞書記憶手段に記憶された言い換え辞書の前記言い換えパターンを参照して前記操作対象部分の言い換えを行い、言い換え群を生成する言い換え処理手段と、
前記テンプレート辞書記憶手段に記憶された前記テンプレート辞書から前記操作対象部分の命題タイプを含む模範文章データを抽出し、前記模範文章データの文脈と前記操作対象部分を含む所定の範囲の文章データであって前記言い換え群から取り出した言い換えにより言い換えた事例文章データの文脈とを比較して、前記模範文章データの文章構造と前記事例文章データの文章構造との類似を評価し、所定の評価を得た言い換えを言い換え候補として出力する文脈マッチング処理手段とを備える
言い換えを利用した文章作成支援処理装置。 - 前記入力処理手段は、前記操作対象部分および前記文操作情報を取得する場合に、前記ユーザに対して表示された文章データの任意の節もしくは文、または所定の選択項目を、入力ポインティング機能を用いて選択することにより行う
ことを特徴とする請求項1に記載の言い換えを利用した文章作成支援処理装置。 - 前記命題辞書記憶手段は、前記命題辞書とともに、文中の手がかり表現と文同士の対応関係を示す命題間タイプとの関係が記述された命題連接辞書を記憶し、
前記テンプレート辞書記憶手段は、前記命題タイプが付与された模範文章データを記憶し、
前記文解析処理手段は、前記命題辞書記憶手段に記憶された前記命題辞書および前記命題連接辞書を参照して、前記解析結果から前記操作対象部分の命題タイプおよび命題間タイプを同定する
ことを特徴とする請求項1または請求項2のいずれか一項に記載の言い換えを利用した文章作成支援処理装置。 - ある自然言語で記述された文データを別の表現による文データに変換する言い換え処理を利用した文章作成支援処理を行うために、文データが記述する行為もしくは状態を定義する命題タイプが記述された命題辞書を記憶する命題辞書記憶手段と、係り受け関係もしくは手がかり表現にもとづく言い換えパターンを記述した言い換え辞書を記憶する言い換え辞書記憶手段と、良い文章構造であると認定された文章データであって、前記命題タイプが付与された模範文章データを記憶するテンプレート辞書を記憶するテンプレート辞書記憶手段と、入力処理手段と、文解析処理手段と、言い換え処理手段と、文脈マッチング処理手段とを備えたコンピュータが行う処理方法であって、
前記入力処理手段が、ユーザに対して表示された文章データから、ユーザの操作によって特定された言い換え操作の対象とする操作対象部分、および言い換え操作の種別を示す文操作情報を取得し、
前記文解析処理手段が、前記操作対象部分の内部構造および意味を解析し、前記命題辞書記憶手段に記憶された前記命題辞書を参照して、前記解析結果から前記操作対象部分の命題タイプを同定し、
前記言い換え処理手段が、前記文操作情報に従って、前記言い換え辞書記憶手段に記憶された言い換え辞書の前記言い換えパターンを参照して前記操作対象部分の言い換えを行い、言い換え群を生成し、
前記文脈マッチング処理手段が、前記テンプレート辞書記憶手段に記憶された前記テンプレート辞書から前記操作対象部分の命題タイプを含む模範文章データを抽出し、前記模範文章データの文脈と前記操作対象部分を含む所定の範囲の文章データであって前記言い換え群から取り出した言い換えにより言い換えた事例文章データの文脈とを比較して、前記模範文章データの文章構造と前記事例文章データの文章構造との類似を評価し、所定の評価を得た言い換えを言い換え候補として出力する
言い換えを利用した文章作成支援処理方法。 - 前記入力処理手段が、前記操作対象部分および前記文操作情報を取得する処理において、前記ユーザに対して表示された文章データの任意の節もしくは文、または所定の選択項目を、入力ポインティング機能を用いて選択することにより行う
ことを特徴とする請求項4に記載の言い換えを利用した文章作成支援処理方法。 - 前記命題辞書記憶手段に、前記命題辞書とともに、文中の手がかり表現と文同士の対応関係を示す命題間タイプとの関係が記述された命題連接辞書が記憶され、
前記テンプレート辞書記憶手段に、前記命題タイプが付与された模範文章データが記憶される場合に、
前記文解析処理手段が、前記解析結果から前記操作対象部分の命題タイプを同定する処理において、前記命題辞書記憶手段に記憶された前記命題辞書および前記命題連接辞書を参照して、前記解析結果から前記操作対象部分の命題タイプおよび命題間タイプを同定する
ことを特徴とする請求項4または請求項5のいずれか一項に記載の言い換えを利用した文章作成支援処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003186859A JP3855058B2 (ja) | 2003-06-30 | 2003-06-30 | 言い換えを利用した文章作成支援処理装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003186859A JP3855058B2 (ja) | 2003-06-30 | 2003-06-30 | 言い換えを利用した文章作成支援処理装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005025257A JP2005025257A (ja) | 2005-01-27 |
JP3855058B2 true JP3855058B2 (ja) | 2006-12-06 |
Family
ID=34185880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003186859A Expired - Lifetime JP3855058B2 (ja) | 2003-06-30 | 2003-06-30 | 言い換えを利用した文章作成支援処理装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3855058B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4575798B2 (ja) * | 2005-02-01 | 2010-11-04 | 日本放送協会 | 音声合成装置及び音声合成プログラム |
US7831423B2 (en) * | 2006-05-25 | 2010-11-09 | Multimodal Technologies, Inc. | Replacing text representing a concept with an alternate written form of the concept |
JP5337516B2 (ja) * | 2009-02-06 | 2013-11-06 | 東芝ソリューション株式会社 | 文書処理装置及びプログラム |
US9262735B2 (en) | 2013-08-12 | 2016-02-16 | International Business Machines Corporation | Identifying and amalgamating conditional actions in business processes |
JP6315439B2 (ja) * | 2013-12-16 | 2018-04-25 | Kddi株式会社 | 文章編集支援装置、プログラムおよび文章編集支援システム |
KR102419648B1 (ko) * | 2019-11-15 | 2022-07-12 | 한국과학기술원 | 언어의 구체성 및 설득 전략 나열에 기반하여 문서의 설득력을 판단하고 향상시키는 방법 및 시스템 |
CN111159350B (zh) * | 2019-12-30 | 2022-12-06 | 科大讯飞股份有限公司 | 用户说法挖掘扩增方法、装置、终端及存储介质 |
CN113822034B (zh) * | 2021-06-07 | 2024-04-19 | 腾讯科技(深圳)有限公司 | 一种复述文本的方法、装置、计算机设备及存储介质 |
-
2003
- 2003-06-30 JP JP2003186859A patent/JP3855058B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005025257A (ja) | 2005-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101136007B1 (ko) | 문서 감성 분석 시스템 및 그 방법 | |
de AR Goncalves et al. | Business process mining from group stories | |
KR20110009205A (ko) | 컴퓨터와의 자연어 의사소통 시스템 및 방법 | |
JP2005507525A (ja) | 機械翻訳 | |
JPH0424869A (ja) | 文書処理システム | |
JP2005165958A (ja) | 情報検索システム、情報検索支援システム及びその方法並びにプログラム | |
WO2010051966A1 (en) | Method for semantic processing of natural language using graphical interlingua | |
JPH11110413A (ja) | データベース検索結果を生成するための方法および装置 | |
WO2004001570A1 (ja) | 自然言語による既存データの記述方法及びそのためのプログラム | |
Chiarcos et al. | Analyzing middle high German syntax with RDF and SPARQL | |
JP3855058B2 (ja) | 言い換えを利用した文章作成支援処理装置および方法 | |
JP2004157931A (ja) | 意図文型種別抽出方式 | |
Jaafar et al. | Towards a new hybrid approach for abstractive summarization | |
Mahlberg et al. | Corpus stylistics, norms and comparisons: Studying speech in Great Expectations | |
Rühlemann et al. | Conversation Analysis and the XML method | |
KR102395926B1 (ko) | 복합명사 분석장치 및 방법, 컴퓨터 프로그램 | |
JP5106042B2 (ja) | 文書関連性分析装置、方法及びプログラム | |
JP2948159B2 (ja) | データベース装置 | |
JP4361299B2 (ja) | 評価表現抽出装置、プログラム、及び記憶媒体 | |
Falke et al. | Utilizing automatic predicate-argument analysis for concept map mining | |
JPH11296552A (ja) | 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4877930B2 (ja) | 文書処理装置及び文書処理方法 | |
Kettaf et al. | Authorship attribution by functional discriminant analysis | |
Tiwari et al. | Mold-a framework for entity extraction and summarization | |
JP2004334382A (ja) | 構造化文書要約装置、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060417 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060718 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060724 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3855058 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |