JP6592378B2 - 書き換え装置、方法、及びプログラム - Google Patents

書き換え装置、方法、及びプログラム Download PDF

Info

Publication number
JP6592378B2
JP6592378B2 JP2016036089A JP2016036089A JP6592378B2 JP 6592378 B2 JP6592378 B2 JP 6592378B2 JP 2016036089 A JP2016036089 A JP 2016036089A JP 2016036089 A JP2016036089 A JP 2016036089A JP 6592378 B2 JP6592378 B2 JP 6592378B2
Authority
JP
Japan
Prior art keywords
impression
notation
rewriting
rewrite
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016036089A
Other languages
English (en)
Other versions
JP2017151902A (ja
Inventor
千明 宮崎
千明 宮崎
平野 徹
徹 平野
東中 竜一郎
竜一郎 東中
松尾 義博
義博 松尾
理史 佐藤
理史 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016036089A priority Critical patent/JP6592378B2/ja
Publication of JP2017151902A publication Critical patent/JP2017151902A/ja
Application granted granted Critical
Publication of JP6592378B2 publication Critical patent/JP6592378B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、書き換え装置、方法、及びプログラムに係り、特に、入力文の表記を書き換える書き換え装置、方法、及びプログラムに関する。
従来技術として、特定のキャラクタに紐づけられたテキストコーパスを用意し、そのコーパスにおける出現確率に従って言語表現を書き換えることで、言語表現に表れるキャラクタ性を変換する手法(非特許文献1)がある。
宮崎千明, 平野徹, 東中竜一郎, 牧野俊朗, 松尾義博, 佐藤理史, 文節機能部の確率的書き換えによるキャラクタ性変換,言語処理学会第21回年次大会発表論文集, pp. 277-280 (2015)
しかし、上記非特許文献1の技術においては、変換先キャラクタごとに、そのキャラクタに応じたテキストコーパスを用意する必要があるため、変換先キャラクタの種類を増やすことが容易ではない。
本発明では、上記問題点を解決するために成されたものであり、簡易に、指定された印象を感じさせる表現に書き換えることができる書き換え装置、方法、及びプログラムを提供することを目的とする。
また、入力文の印象を評価することができる印象評価装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の書き換え装置は、書き換え先の印象の指定及び入力文を受け付ける入力部と、書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め求められた印象スコアと、前記入力部で受け付けた書き換え先の印象の指定とに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、を含んで構成されている。
本発明の書き換え方法は、入力部が、書き換え先の印象の指定及び入力文を受け付け、書き換え候補選択部が、書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め求められた印象スコアと、前記入力部で受け付けた書き換え先の印象の指定とに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する。
本発明の印象評価装置は、評価対象の入力文を受け付ける入力部と、表記毎に予め求められた印象スコアに基づいて、入力文に含まれる表記の各々の印象スコアを取得し、前記入力文を評価する評価部と、を含んで構成されている。
本発明の印象評価方法は、入力部が、評価対象の入力文を受け付け、評価部が、表記毎に予め求められた印象スコアに基づいて、入力文に含まれる表記の各々の印象スコアを取得し、前記入力文を評価する。
また、本発明のプログラムは、コンピュータを、上記の書き換え装置、又は印象評価装置を構成する各部として機能させるためのプログラムである。
以上説明したように、本発明の書き換え装置、方法、及びプログラムによれば、表記毎に予め求められた印象スコアと、書き換え先の印象の指定とに基づいて、入力文を構成する表記のうち、書き換え対象となる表記について、書き換え規則リストから得られる書き換え候補の表記を選択し、入力文の表記を置換することにより、簡易に、指定された印象を感じさせる表現に書き換えることができる。
また、本発明の印象評価装置、方法、及びプログラムによれば、表記毎に予め求められた印象スコアに基づいて、入力文に含まれる表記の各々の印象スコアを取得し、入力文を評価することにより、入力文の印象を評価することができる。
第1の実施形態に係る学習装置における機能的構成を示すブロック図である。 印象別コーパスの例を示す図である。 書き換え規則リストの例を示す図である。 印象スコアの算出方法を説明するための図である。 印象スコアの例を示す図である。 第1の実施形態に係る書き換え装置における機能的構成を示すブロック図である。 印象パラメータ設定表の例を示す図である。 書き換え先候補を選択する方法を説明するための図である。 動詞活用表の例を示す図である。 第1の実施形態に係る学習装置における書き換え規則学習処理ルーチンを示すフローチャート図である。 第1の実施形態に係る学習装置における印象スコア学習処理ルーチンを示すフローチャート図である。 第1の実施形態に係る書き換え装置における書き換え処理ルーチンを示すフローチャート図である。 第2の実施形態に係る印象評価装置における機能的構成を示すブロック図である。 第2の実施形態に係る印象評価装置における印象評価処理ルーチンを示すフローチャート図である。
以下、図面を参照して本発明の実施形態を詳細に説明する。
<本発明の実施形態に係る書き換え装置の原理>
まず、本発明の実施形態に係る書き換え装置について説明する。本発明の実施形態に係る書き換え装置は、日本語で書かれたテキストを入力として受け取り、入力されたテキストを構成する表記(形態素または形態素列)を、指定された印象らしさを持つ表現に置換する。
このとき、各表記(形態素または形態素列)に対して、個々の印象らしさ(硬さ、重さ、冷静さなど)を表すスコアを付与しておき、そのスコアを参照して、入力された任意のテキストに含まれる表記を、指定された印象らしさを持つ表現に置換する。
例としては、「今日は非常に大量の雨が降りました」という文を「今日はとてもたくさんの雨が降りました」のような「柔らかい」印象を感じさせるものに書き換えることができる。この例では、「非常に」を「とても」に、「大量」を「たくさん」に置換している。
さらに、複数の「印象」を組み合わせて指定することで、多様なキャラクタ性(話者・著者の人物像らしさ)を感じさせる表現に書き換える。
例としては、「くだけた」「軽い」「興奮した」という印象を組み合わせて指定することで、「今日マジでいっぱい雨降った!」のような、若者らしさを感じさせる表現に書き換えることができる。
この例では、「は」や「が」から空文字への置換、「非常に」から「マジで」への置換、「大量の」から「いっぱい」への置換、「(り)ました」から「(っ)た」への置換によって「くだけた」印象を付与している。また、「非常に」を「マジで」に置換することは「軽い」印象も付与している。さらに、文末に「!」を挿入することで「興奮した」印象を付与している。
ここで、日本語で書かれたテキストとは、ブログ・SNS等への書き込み、発話の音声認識結果やテキストチャットなど、文字化された日本語のデータであれば何でも良い。
なお、本実施の形態における「キャラクタ」とは話し手・書き手の人物像のことであり、人物像の構成要素としては「年齢,性別,職業,階層,時代,容姿・風貌,性格等」(非特許文献2を参照)を想定している。また、「キャラクタ」とはアニメキャラクタのような具体的なものであってもよい。
[非特許文献2]:金水敏, 「ヴァーチャル日本語 役割語の謎」, 岩波書店 (2003)
[第1の実施の形態]
<第1の実施形態に係る学習装置の構成>
次に、本実施形態に係る学習装置の構成について説明する。図1に示すように、本実施形態に係る学習装置100は、CPUと、RAMと、後述する書き換え規則学習処理ルーチン、及び印象スコア学習処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この学習装置100は、機能的には図1に示すように演算部20を含んで構成されている。
演算部20は、書き換えコーパス記憶部30と、印象別コーパス記憶部32と、形態素文節情報付与部40と、書き換え箇所アライメント部42と、書き換え規則リスト取得部44と、表記書き換え規則リスト記憶部46と、印象スコア算出部48と、表記別印象スコア記憶部50と、を含んで構成される。
書き換えコーパス記憶部30には、印象毎に、日本語で記載された書き換え元の文と、当該印象を持つ書き換え先の文とのペアの各々が記憶されている。例えば、書き換え元の文「実験のレポートを書きました」、及び印象「くだけた」を持つ書き換え先の文「実験のレポート書いた」のペアが記憶されている。
印象別コーパス記憶部32には、図2に示すように、印象軸毎に、当該印象軸において対立する2つの印象の各々について、当該印象を持つ文からなるコーパスが記憶されている。
例えば、印象軸「改まり度」において対立する印象「改まった」と印象「くだけた」の各々について、コーパスが記憶されている。
印象「改まった」のコーパスには、例えば、以下のような文が含まれている。
文1:実験が難しいです
文2:レポートはありますか
文3:お弁当を食べました
また、印象「くだけた」のコーパスには、例えば、以下のような文が含まれている。
文4:レポートむずい
文5:実験ってあったっけ
文6:弁当食った
形態素文節情報付与部40は、書き換えコーパス記憶部30に記憶されているペア毎に、当該ペアに含まれる書き換え元の文と書き換え先の文との各々について、係り受け解析器を用いて係り受け解析を行い、当該係り受け解析結果として、当該文の文節境界、形態素境界、品詞、及び活用語の活用型・活用形の情報を取得する。
具体的に、書き換え元の文が「実験のレポートを書きました」であるとすると、形態素情報、及び文節情報は下記(1)及び(2)となる。
(1){実験}_の/{レポート}_を/{書}_き_まし_た
(2)名詞_助詞/名詞_助詞/動詞語幹:カ行五段_活用語尾:連用形_助動詞_助動詞
また、書き換え元の文が「実験のレポート書いた」であるとすると、形態素情報、及び文節情報は下記(3)及び(4)となる。
(3){実験}_の/{レポート}/{書}_い_た
(4)名詞_助詞/名詞/動詞語幹:カ行五段_活用語尾:連用形-音便_助動詞
上記(1)〜(4)の形態素情報、及び文節情報の例では、文節主辞が「{}」で、表され、文節境界が「/」で表され、形態素境界が「 _ 」で表されている。ここで、文節が区切れているところでは、必ず形態素も区切れているため、文節境界は形態素境界でもある。なお、本実施形態においては、活用語の活用語尾は語幹から切り離して処理するものとする。例えば、「降り」を「降_り」とする。また、係り受け解析器は、文節境界、文節主辞、形態素境界、品詞、及び活用語の活用型・活用形の情報を取得できさえすれば、どのようなものを使用しても良い。また、これらの情報は人手によって予め付与されたものを利用してもよい。
また、形態素文節情報付与部40は、印象別コーパス記憶部32に記憶されている全ての文の各々について、係り受け解析器を用いて係り受け解析を行い、当該係り受け解析結果として、当該文の文節境界、形態素境界、品詞、及び活用語の活用型・活用形の情報を取得する。
書き換え箇所アライメント部42は、形態素文節情報付与部40において取得した係り受け解析結果が付与されている書き換え元の文と書き換え先の文とのペア毎に、動的計画法を利用して、書き換え元の文に含まれる形態素の各々と書き換え先の文に含まれる形態素の各々とにおける形態素単位の対応付けを行い、当該ペアにおける形態素の対応関係を取得する。また、書き換え箇所アライメント部42は、ペア毎に、当該ペアの対応関係に基づいて、当該ペアに含まれる書き換え元の文と書き換え先の文とを併合した書き換え箇所アライメント済みペアとする。ここで、当該書き換え元の文と書き換え先の文とのペア間における書き換え箇所として、連続する置換箇所、削除箇所、又は挿入箇所は、まとめて一つの書き換え箇所として連結する。
具体的に、処理対象となる書き換え元の文と書き換え先の文とのペアにおいて、書き換え元の文「{実験}_の/{レポート}_を/{書}_き_まし_た」、書き換え先の文「{実験}_の/{レポート}/{書}_い_た」であるとすると、書き換え箇所アライメント結果(書き換え箇所アライメント済みペア)は、下記(5)に表すようになる。
(5)実験_の/レポート≪|を≫/書≪い|き_まし≫た
上記(5)の書き換え箇所アライメント結果においては、「≪書き換え先表記|書き換え元表記≫」を表している。また、上記書き換え箇所アライメント結果の例においては、「き」、及び「まし」という連続した書き換え箇所が連結され、一つにまとめられている。
なお、書き換え箇所のアライメントは、文字単位や文節単位など、形態素以外の単位を用いて行っても良いし、書き換え箇所のアライメント情報が予め人手によって付与されたコーパスを使用しても良い。
書き換え規則リスト取得部44は、書き換え箇所アライメント部42において取得した、書き換え箇所アライメント済みペアの各々について、形態素文節情報付与部40において取得した、当該書き換え箇所アライメント済みペアに含まれる書き換え元の文と書き換え先の文との係り受け解析結果に基づいて、当該書き換え箇所アライメント済みペアにおいて、書き換え箇所となる文節を対象として、書き換え元と書き換え先の表記をペアにして、表記書き換え規則リスト記憶部46に記憶されている図3に示す書き換え規則リストに記憶する。
具体的に、処理対象となる書き換え箇所アライメント済みペアが、「実験_の/レポート≪|を≫/書≪い|き_まし≫た」であり、当該ペアに含まれる書き換え元の文の形態素情報、及び文節情報が上記(1)及び(2)であり、当該ペアに含まれる書き換え先の文の形態素情報、及び文節情報が上記(3)及び(4)で表される場合を考える。
ここで、当該書き換え箇所アライメント済みペアにおける書き換え元と書き換え先との表現のペアは下記(6)及び(7)となる。
(6)書き換え元:<名詞>を − 書き換え先:<名詞>
(7)書き換え元:<動詞語幹>ました − 書き換え先:<動詞語幹>[連用形−音便]た
なお、本実施形態においては、上記(7)に示すように、機能部では、動詞の活用語尾の表記は使わず、書き換え先の側においてのみ活用形の情報を利用することとする。例えば、「[連用形−音便]た」となる。また、「[]」は、動詞の活用形を表す標識を表す。
また、文節主辞の品詞だけでなく、文節の係り先の情報(名詞を主辞とする文節に係る(連体修飾)か否か)や、文節の生起位置の情報(文末に位置するか否か)、文の種類(疑問文か否か)などその他の情報を文節種別として利用した書き換え規則を作成してもよい。
表記書き換え規則リスト記憶部46には、書き換え規則リストが記憶されている。
印象スコア算出部48は、印象別コーパス記憶部32に記憶されている各文の係り受け解析結果に基づいて、各表記について、印象軸毎に、当該印象軸の印象スコアを算出し、表記別印象スコア記憶部50に記憶する。
具体的には、各表記について、印象軸において対立する2つの印象に対応するコーパス中での出現頻度を数え、一方の印象のコーパスに出現する割合を算出し、その割合を、当該印象軸の印象スコアとして利用する。
例えば、印象軸「改まり度」において対立する印象「改まった」、印象「くだけた」に紐づけられたコーパス中での出現頻度を用いて、印象軸「改まり度」のスコアを算出する場合、以下のように計算される。
<名詞>は のスコア
= <名詞>は の「改まった」コーパスにおける出現回数 ÷
「改まった」コーパスおよび「くだけた」コーパスにおける出現回数の合計
= 1÷(0+1)
=1
また、印象「改まった」のコーパスから、文1の形態素情報及び文節情報(8)、(9)、文2の形態素情報及び文節情報(10)、(11)、文6の形態素情報及び文節情報(12)、(13)が、係り受け解析結果として得られ、また、印象「くだけた」のコーパスから、文4の形態素情報及び文節情報(14)、(15)、文5の形態素情報及び文節情報(16)、(17)、文6の形態素情報及び文節情報(18)、(19)が、係り受け解析結果として得られた場合には、図4に示すような印象軸「改まり度」の印象スコアが算出される。ただし、上記文1〜文6をコーパス全体とみなして算出している。
(8){実験}_が/{難し}_い_です
(9)名詞_助詞/形容詞語幹_活用語尾:終止形_助動詞
(10){レポート}_は/{あ}_り_ます_か
(11)名詞_助詞/動詞語幹:ラ行五段_活用語尾:連用形_助動詞_助詞
(12)お_{弁当}_を/{食}_べ_まし_た
(13)接頭詞_名詞_助詞/動詞語幹:一段_活用語尾:連用形_助動詞_終助詞
(14){レポート}/{むず}_い
(15)名詞/形容詞語幹_活用語尾:終止形
(16){実験}_って/{あ}_っ_た_っけ
(17)名詞_助詞/動詞語幹:ラ行五段_活用語尾:連用形-音便_助動詞_助詞
(18){弁当}/{食}_っ_た
(19)名詞/動詞語幹:一段_活用語尾:連用形-音便_助動詞
なお、各表記の印象スコアとして、その表記が特定の印象のコーパスに出現する割合ではなく、特定の印象に紐づけられたコーパスとその他コーパスにおける各表記の分布の差を表す値(カイ二乗値など)を用いても良い。
表記別印象スコア記憶部50には、図5に示すような印象軸毎の印象スコアが各表現について記憶されている。
表記の持つ印象にどのようなものがあるかは、非特許文献3が参考になる。本実施の形態では4つの印象軸しか扱わないが、4以上に増やしても4未満に減らしても構わない。
[非特許文献3]:小磯花絵, 田中弥生, 小木曽智信, 近藤明日子, テキストの多様性をとらえる分類指標の体系化の試み,言語処理学会第17回年次大会発表論文集, pp. 683-686 (2011)
<第1の実施形態に係る書き換え装置の構成>
次に、第1の実施形態に係る書き換え装置の構成について説明する。図6に示すように、本実施形態に係る書き換え装置200は、CPUと、RAMと、後述する書き換え処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この書き換え装置200は、機能的には図6に示すように入力部210と、演算部220と、出力部290とを含んで構成されている。
入力部210は、書き換え対象である日本語の書き換え元の文と、書き換えるキャラクタの指定とを受け付ける。本実施形態においては、書き換え元の文「今日は非常に大量の雨が降りました」と、キャラクタの指定「女性」と、印象軸とそのスコアの指定「改まり度:0.9」を受け付けるものとする。なお、印象軸とそのスコアの入力は任意であり、キャラクタの入力のみであってもよい。
演算部220は、印象パラメータ設定表記憶部221、印象パラメータ自動設定部222と、形態素文節情報付与部223と、表記書き換え規則リスト記憶部224と、表記別印象スコア記憶部226と、書き換え候補選択部228と、動詞活用表記憶部230と、活用調整部232と、を含んで構成されている。
印象パラメータ設定表記憶部221は、キャラクタ別に印象軸毎の印象スコアが格納された図7に示すような印象パラメータ設定表が記憶されている。
本実施の形態では、印象パラメータ設定表は人手で設定することとするが、自動で設定することも可能である。例えば、女性が書いたテキストデータを収集し、そのデータ中に「改まった」表現がどの程度の割合で含まれるかを算出し、その割合を「改まり度」のスコアとして利用しても良い。この時、ある表現が「改まった」ものであるか、その反対の「くだけた」ものであるかは、印象スコア算出部48と同様の方法で判断できる。
印象パラメータ自動設定部222は、入力部210で受け付けたキャラクタの指定と、印象軸とそのスコアの指定とに基づいて、印象パラメータ設定表記憶部221から、入力されたキャラクタに対応する各印象軸の印象スコアを取得し、取得した各印象軸の印象スコアを、入力された印象とそのスコアで上書きし、得られた各印象軸の印象スコアを、印象パラメータとして書き換え候補選択部228へ出力する。
例えば、キャラクタの指定「女性」と印象スコアの指定「改まり度:0.9」が入力された場合は、まず印象パラメータ設定表記憶部221からキャラクタ「女性」の設定「改まり度:0.7,硬さ:0,重さ:0.7,冷静さ:0.9」を取得し、次に、入力された印象軸とそのスコアの指定「改まり度:0.9」で、取得したキャラクタ「女性」の設定を上書きし、「改まり度:0.9,硬さ:0,重さ:0.7,冷静さ:0.9」を印象パラメータとして出力する。
印象パラメータ自動設定部222を用いることで、印象パラメータのスコアをひとつひとつ設定しなくても、目的のキャラクタに応じた印象パラメータを一括で設定することができる。
なお、印象とそのスコアの指定が入力されなかった場合には、キャラクタの指定に対応する印象パラメータをそのまま出力すればよい。
形態素文節情報付与部223は、入力部210において受け付けた書き換え元の文について、上述した学習装置100の形態素文節情報付与部22と同様に、係り受け解析器を用いて、係り受け解析を行う。形態素情報、及び文節情報の例を(20)及び(21)に示す。
具体的に、文が「今日は非常に大量の雨が降りました」であるとすると、形態素情報、及び文節情報は下記(20)及び(21)となる。
(20){今日}_は/{非常}_に/{大量}_の/{雨}_が/{降}_り_まし_た
(21)名詞_助詞/名詞:形容動詞語幹_助詞/名詞:形容動詞語幹_助詞/名詞_助詞/動詞語幹:ラ行五段_活用語尾:連用形_助動詞_助動詞
表記書き換え規則リスト記憶部224には、学習装置100の表記書き換え規則リスト記憶部46に記憶されている書き換え規則リストと同一の、書き換え規則リストが記憶されている。
表記別印象スコア記憶部226には、学習装置100の表記別印象スコア記憶部50と同一の、各表記についての印象軸毎の印象スコアが記憶されている。
書き換え候補選択部228は、印象パラメータ自動設定部222から出力された印象パラメータと、形態素文節情報付与部223において取得した処理対象となる書き換え元の文の係り受け解析と、表記書き換え規則リスト記憶部224に記憶されている書き換え規則リストと、表記別印象スコア記憶部226に記憶されている、各表記についての印象軸毎の印象スコアとに基づいて、入力部210において受け付けた書き換え元の文の各文節について、書き換え規則リストから、当該文節の表記が、書き換え元の表記と一致する規則の書き換え後の表記を、書き換え候補の表記として抽出し、抽出された書き換え候補の表記の印象スコアと、印象パラメータとに基づいて、抽出された書き換え候補の表記を選択し、選択された表記に置換する。
具体的には、まず、形態素文節情報付与部223において取得した処理対象となる書き換え元の文の係り受け解析と、表記書き換え規則リスト記憶部224に記憶されている書き換え規則リストとに基づいて、入力部210において受け付けた書き換え元の文の各文節について、書き換え規則リストから、処理対象の文節の表記と、当該書き換え規則リストの書き換え元の表記が一致するものを、書き換え候補として抽出する。
次に、各文節について、当該文節について抽出した書き換え候補の各々と、表記別印象スコア記憶部226に記憶されている、当該文節について抽出した書き換え候補の各々の印象軸毎の印象スコアと、印象パラメータとに基づいて、当該文節について取得した書き換え候補の中から、印象パラメータで設定された値との印象スコアの差分(絶対値)の合計(図8の差分計)が最も小さい書き換え候補を、書き換え先として選択する。例えば、図8の例では、差分計が最も小さい書き換え候補「とても」が、書き換え先として選択される。
次に、各文節について、当該文節の表記と、書き換え先として選択された書き換え候補とを置換した文を取得する。
なお、本実施の形態では文節単位で独立に書き換え処理を行っているが、文節を越えた書き換えを施すような処理を行っても良い。例えば、「{大量}_の/{雨}_が/{降}_り_まし_た」という3文節を「豪雨でした」という1文節に置換してもよい。
また、入力文中の機能語列(文節の主辞より後ろの形態素列)を書き換える場合には、上記図3に記載されている「<動詞語幹>と」「<形容詞語幹>いから」「<名詞>でした」のように、その機能語列の前(左)に接続可能な品詞を、規則の適用可否を判定する条件に組み込んでもよい。処理中の文節の係り先の情報(名詞を主辞とする文節に係る(連体修飾)か否か)や、文節の生起位置の情報(文末に位置するか否か)、文の種類(疑問文か否か)などその他の情報を組み込んでもよい。
さらに、書き換え先として書き換え候補をランダムに選択しても良い。その際、印象パラメータとの差分が小さい書き換え候補ほど選ばれやすくなるような仕組みを追加しても良い。
動詞活用表記憶部230には、図9に示すような、動詞の活用型及び活用形に対応する活用語尾が記憶されている動詞活用表が記憶されている。
活用調整部232は、形態素文節情報付与部223において取得した書き換え元の文の係り受け解析結果と、書き換え候補選択部228により取得した、置換された文と、動詞活用表記憶部230に記憶されている動詞活用表とに基づいて、書き換え先の文を取得し、出力部290から出力する。
具体的には、まず、書き換え候補選択部228により取得した、置換された文に含まれる、動詞の活用形を表す標識を含む文節の各々について、当該文節の標識と、動詞活用表記憶部230に記憶されている動詞活用表とに基づいて、当該動詞活用表の標識が表す活用形に対応する列を取得する。次に、標識を含む文節の各々について、形態素文節情報付与部223において取得した書き換え元の文の係り受け解析結果に基づいて、当該文節の主辞である動詞語幹を特定し、動詞活用表の対応する行を取得する。次に、標識を含む文節の各々について、取得した列及び行に基づいて、動詞活用表から置換対象となる活用語尾を抽出し、対象となる活用形を表す標識と置換する。
例えば、書き換え元の文(入力文)の形態素情報及び文節情報(22)、(23)と、各文節に含まれる表記(形態素列)が指定の印象パラメータに基づいて選択された表記現に置換された文(24)とを入力として、図9の動詞活用表を用いて、(25)のような、動詞の活用形を表す標識が、動詞の活用型に合う適切な活用語尾に置換された文が得られる。
(22){今日}_は/{非常}_に/{大量}_の/{雨}_が/{降}_り_まし_た
(23)名詞_助詞/名詞:形容動詞語幹_助詞/名詞:形容動詞語幹_助詞/名詞_助詞/動詞語幹:ラ行五段_活用語尾:連用形_助動詞_助動詞
(24)今日/マジで/いっぱい/雨/降[連用形-音便]た!
(25)今日/マジで/いっぱい/雨/降った!
上記の例では、書き換え対象の文節の主辞である動詞語幹「降」はラ行五段活用に該当し、書き換え先の表現(た!)が連用形(音便形)の活用を要求しているので、上記図9の動詞活用表からラ行五段活用の終止形の活用語尾「っ」を抽出し、活用形を表す標識([連用形-音便])と置換することにより、「今日マジでいっぱい雨降った!」という文を生成する。
なお、図9の動詞活用表における未然形(ア段)とは、母音がaである未然形を表す。これは、「ない」等の形態素に接続する形であり、例えば、「登「ら」ない」である。また、未然形(オ段)とは、母音がоである未然形を表す。これは、「う」当の形態素に接続する形であり、例えば、「登「ろ」う」である。また、連用形(音便形)とは、イ音便、促音便、又は撥音便化した連用形を表す。これは、「て(で)」や「た(だ)」に接続する形で有り、例えば、「登「っ」て」である。
<第1の実施形態に係る学習装置の作用>
次に、第1の実施形態に係る学習装置100の作用について説明する。書き換えコーパス記憶部30から書き換え元の文と書き換え先の文とのペアの各々を読み込むと、学習装置100によって図10に示す書き換え規則学習処理ルーチンを実行する。
まず、図10のステップS100で、取得した書き換え元の文と書き換え先の文とのペアの各々について、当該ペアに含まれる書き換え元の文と書き換え先の文とを係り受け解析器を用いて、係り受け解析する。
次に、ステップS102で、取得したペアの各々から処理対象となるペアを決定する。
次に、ステップS104で、処理対象のペアについて、ステップS100において取得した当該ペアに含まれる書き換え元の文と書き換え先の文との係り受け解析結果に基づいて、動的計画法を利用して、書き換え元の文に含まれる形態素の各々と書き換え先の文に含まれる形態素の各々とにおける形態素単位の対応付けを行い、当該ペアにおける形態素の対応関係を取得する。
次に、ステップS106で、取得した全てのペアについてステップS104の処理を終了したか否かを判定する。取得した全てのペアについてステップS104の処理を終了している場合には、ステップS108へ移行する。一方、取得した全てのペアについてステップS104の処理を終了していない場合には、ステップS102へ移行し、処理対象となるペアを変更し、ステップS104〜ステップS106までの処理を繰り返す。
次に、ステップS108で、取得したペアの各々から処理対象となるペアを決定する。
次に、ステップS110で、処理対象となる書き換え元の文と書き換え先の文とのペアについて、ステップS100において取得した当該ペアの係り受け解析結果と、ステップS104において取得した当該ペアにおける形態素の対応関係とに基づいて、書き換え箇所となる文節を対象として、書き換え元と書き換え先との表記を書き換え規則として取得し、表記書き換え規則リスト記憶部224に記憶されている書き換え規則リストに記憶する。
次に、ステップS112で、取得した全ての書き換え元の文と書き換え先の文とのペアについてステップS110の処理を終了したか否かを判定する。取得した全ての書き換え元の文と書き換え先の文とのペアについてステップS110の処理を終了している場合には、書き換え規則学習処理ルーチンを終了する。一方、取得した全ての書き換え元の文と書き換え先の文とのペアについてステップS110の処理を終了していない場合には、ステップS108へ移行し、処理対象となる書き換え元の文と書き換え先の文とのペアを変更し、ステップS110〜ステップS112までの処理を繰り返す。
また、印象別コーパス記憶部32から、印象軸毎に、当該印象軸において対立する2つの印象の各々について、当該印象を持つ文からなるコーパスを読み込むと、学習装置100によって図11に示す印象スコア学習処理ルーチンを実行する。
まず、図11のステップS120で、取得した各コーパスに含まれる文の各々について、係り受け解析器を用いて、係り受け解析する。
次に、ステップS122で、複数の印象軸から処理対象となる印象軸を選択する。
ステップS124では、印象スコアを算出すべき表記の中から、処理対象となる表記を設定する。
そして、ステップS126において、処理対象の印象軸において対立する2つのコーパスの各文についての係り受け解析結果に基づいて、処理対象となる表記の出現頻度を、処理対象の印象軸において対立する2つのコーパスの各々についてカウントし、処理対象の印象軸のスコアを算出し、表記別印象スコア記憶部50に記憶する。
次に、ステップS122で、処理対象となる全ての表記についてステップS124、S126の処理を終了したか否かを判定する。処理対象となる全ての表記についてステップS124、S126の処理を終了した場合には、ステップS130へ移行する。一方、処理対象となる全ての表記についてステップS124、S126の処理を終了していない場合には、ステップS124へ戻り、処理対象となる表記を変更し、ステップS124、ステップS126の処理を繰り返す。
次に、ステップS30で、全ての印象軸についてステップS122〜ステップS128までの処理を終了したか否かを判定する。全ての印象軸についてステップS122〜ステップS128までの処理を終了した場合には、印象スコア学習処理ルーチンを終了する。一方、全ての印象軸についてステップS122〜ステップS128までの処理を終了していない場合には、ステップS122へ移行し、処理対象となる印象軸を変更し、ステップS122〜ステップS128までの処理を繰り返す。
<第1の実施形態に係る書き換え装置の作用>
次に、第1の実施形態に係る書き換え装置200の作用について説明する。事前に、入力部210において、学習装置100において学習された書き換え規則リストと各表記の印象軸毎の印象スコアを受け付け、各々を、書き換え規則リスト記憶部224、又は表記別印象スコア記憶部226に記憶する。次に、入力部210において書き換え元の文と、キャラクタ及び印象スコアの指定を受け付けると、書き換え装置200によって図12に示す書き換え処理ルーチンを実行する。
まず、図12のステップS204で、入力部210において受け付けたキャラクタの指定に対応する印象パラメータの設定を、印象パラメータ設定表記憶部221から取得し、取得した印象パラメータの設定を、入力部210において受け付けた印象スコアの指定で上書きすることによって、印象パラメータを設定する。
次に、ステップS206で、入力部210において受け付けた書き換え元の文について、ステップS100と同様に、係り受け解析を行う。
次に、ステップS208で、ステップS206において取得した係り受け解析結果に基づいて取得される書き換え元の文に含まれる文節の各々から、処理対象となる文節を決定する。
次に、ステップS210で、処理対象となる文節について、ステップS206において取得した係り受け解析結果と、表記書き換え規則リスト記憶部224に記憶されている書き換え規則リストとに基づいて、当該文節の書き換え候補の各々を抽出する。
次に、ステップS212で、ステップS210において書き換え候補が抽出されたか否かを判定する。書き換え候補が抽出された場合には、ステップS212へ移行する。一方、書き換え候補が抽出されなかった場合には、ステップS216へ移行し、処理対象となる文節を変更し、ステップS210〜ステップS212までの処理を繰り返す。
次に、ステップS214で、処理対象となる文節について、上記ステップS204で設定した印象パラメータと、表記別印象スコア記憶部226に記憶されている、当該文節について取得した書き換え候補の各々に対応する印象スコアと、ステップS210において取得した、当該文節について取得した書き換え候補の各々とに基づいて、書き換え先を選択し、当該文節を選択した書き換え先に置換する。
次に、ステップS216で、全ての文節についてステップS210の処理を終了したか否かを判定する。全ての文節についてステップS210の処理を終了している場合には、ステップS220へ移行する。全ての文節について、ステップS210の処理を終了していない場合には、ステップS208へ移行し、処理対象となる文節を変更し、ステップS210〜ステップS216までの処理を繰り返す。
次に、ステップS218で、処理対象となる文節を決定する。
次に、ステップS220で、処理対象となる文節について、ステップS214において取得した、置換した文に当該文節に対応する活用形を表す標識が存在するか否かを判定する。標識が存在する場合には、ステップS224へ移行する。一方、標識が存在しない場合には、ステップS226へ移行する。
次に、ステップS222で、処理対象となる文節について、ステップS206において取得した係り受け解析結果と、ステップS204において取得した動詞活用表と、ステップS220において取得した標識とに基づいて、活用語尾を取得する。
次に、ステップS224で、処理対象となる文節について、当該文節の標識部分をステップS222で取得した活用語尾に置換する。
次に、ステップS226で、全ての文節についてステップS220の処理を終了したか否かを判定する。全ての文節についてステップS220の処理を終了している場合には、ステップS228へ移行する。全ての文節について、ステップS220の処理を終了していない場合には、ステップS218へ移行し、処理対象となる文節を変更し、ステップS220〜ステップS226までの処理を繰り返す。
次に、ステップS228で、上記各ステップの処理結果である文を出力部290から出力して書き換え処理ルーチンを終了する。
以上説明したように、第1の実施形態に係る学習装置によれば、書き換え先の印象毎に用意されたコーパスを用いて、各表記について、印象軸毎の印象スコアを求めることができる。
また、書き換え先のキャラクタごとにキャラクタに応じたテキストコーパスを用意する必要がなく、コーパスは印象軸の数に応じて用意すればよい。また、書き換え先のキャラクタの種類を容易に増やすことが可能となる。
また、第1の実施形態に係る書き換え装置によれば、表記毎に予め求められた印象スコアと、書き換え先の印象の指定とに基づいて、入力文を構成する表記のうち、書き換え対象となる表記について、書き換え規則リストから得られる書き換え候補の表記を選択し、入力文の表記を置換することにより、簡易に、指定された印象を感じさせる表現に書き換えることができる。
また、書き換え先の印象を、複数の「印象」を組み合わせて指定できるようにし、多様なキャラクタ性(話者・著者の人物像らしさ)を感じさせる表現への書き換えを容易に行うことができる。
また、少ない「印象」の組み合わせによって、たくさんの種類のキャラクタらしさを表現することができる。従来手法では、コーパス(どのような表現をどのくらいの頻度で使用する話者であるか)によってキャラクタ性を規定していたが、本発明では、印象の組み合わせによってキャラクタ性を規定する。また、有限の印象の組み合わせから多様なキャラクタ性を表現することが可能になる。
また、人と対話をするシステム(対話システム)に本発明を適用すると、システムの発話にキャラクタ性を持たせることが可能となり、対話システムをより人間らしく親しみやすい存在にすることができる。
[第2の実施の形態]
次に、第2の実施の形態に係る印象評価装置について説明する。なお、第1の実施の形態と同様の処理については、同一符号を付して説明を省略する。
第2の実施の形態では、入力文の印象を評価する印象評価装置に本発明を適用した場合について説明する。
<第2の実施形態に係る印象評価装置の構成>
次に、第2の実施形態に係る印象評価装置の構成について説明する。図13に示すように、第2の実施形態に係る印象評価装置300は、CPUと、RAMと、後述する印象評価処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この印象評価装置300は、機能的には図13に示すように入力部310と、演算部320と、出力部390とを含んで構成されている。
入力部210は、評価対象である日本語の文を受け付ける。
演算部320は、形態素文節情報付与部223と、表記別印象スコア記憶部226と、評価部330と、を含んで構成されている。
形態素文節情報付与部223は、入力部310において受け付けた評価対象文について、係り受け解析器を用いて、係り受け解析を行う。
評価部330は、形態素文節情報付与部223によって得られた評価対象文の係り受け解析と、表記別印象スコア記憶部226に記憶されている、各表現についての印象軸毎の印象スコアとに基づいて、評価対象文の各文節について、当該文節の表記の印象スコアを、表記別印象スコア記憶部226から取得し、各文節の表記の印象スコアを用いて、評価対象文を評価し、評価結果を、出力部390により出力する。
例えば、印象軸毎に、各文節の表記の当該印象軸の印象スコアの平均値を、評価対象文の印象スコアとして算出する。
<第2の実施形態に係る印象評価装置の作用>
次に、第2の実施形態に係る印象評価装置300の作用について説明する。事前に、入力部310において、上記第1の実施の形態で説明した学習装置100において学習された印象スコアを受け付け、表記別印象スコア記憶部226に記憶する。次に、入力部310において評価対象文を受け付けると、印象評価装置300によって図13に示す印象評価処理ルーチンを実行する。
まず、図14のステップS300で、入力部210において受け付けた評価対象文について、係り受け解析を行う。
次に、ステップS302で、ステップS300において取得した係り受け解析結果に基づいて取得される評価対象文に含まれる文節の各々から、処理対象となる文節を決定する。
次に、ステップS304で、処理対象となる文節について、表記別印象スコア記憶部226に記憶されている、当該文節の表記に対応する印象スコアを取得する。
次に、ステップS306で、全ての文節についてステップS302、S304の処理を終了したか否かを判定する。全ての文節についてステップS302、S304の処理を終了している場合には、ステップS308へ移行する。全ての文節について、ステップS302、S304の処理を終了していない場合には、ステップS302へ移行し、処理対象となる文節を変更し、ステップS302、S304の処理を繰り返す。
次に、ステップS308では、上記ステップS304において文節の各々について得られた印象スコアに基づいて、評価対象文の印象スコアを評価し、ステップS310で、上記ステップS308の評価結果を出力部390により出力して、印象評価処理ルーチンを終了する。
以上説明したように、第2の実施形態に係る印象評価装置によれば、表記毎に予め求められた印象スコアから、入力文に含まれる表記の各々の印象スコアを取得し、入力文を評価することにより、入力文の印象を評価することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記の実施形態においては、書き換え箇所のアライメントを形態素単位で行った場合について説明したが、これに限定されるものではなく、他の文字列単位でもよい。例えば、書き換え箇所のアライメントを、文節単位等で行ってもよい。また、書き換え箇所のアライメントを文字単位で行ってもよい。また、書き換え箇所のアライメント情報が予め人手によって付与されたコーパスを用いてもよい。
また、上記の実施形態においては、学習装置と書き換え装置とを別々の構成とする場合について説明したが、これに限定されるものではない。例えば、一つの装置において、学習装置の機能と書き換え装置の機能とを実現させてもよい。
また、上記の実施形態においては、入力した書き換え元の文の全ての文節について書き換えを施す場合について説明しているが、これに限定されるものではない。例えば、文節種別等によって、書き換え対象となる文節を制限してもよい。また、非文(日本語として不適格な文)が生成される可能性が高いと思われる書き換え(例えば、格助詞からの置換、格助詞への置換など)は行わないように制約してもよい。
また、上記の実施形態においては、書き換え元の文と書き換え先の文とのペア間における書き換え箇所として、連続する置換箇所、削除箇所、又は挿入箇所は、まとめて一つの書き換え箇所として連結する場合について説明したが、これに限定されるものではない。例えば、書き換え元の文と書き換え先の文とのペア間における書き換え箇所として、連続する置換箇所、削除箇所、又は挿入箇所をまとめて一つの書き換え箇所として連結しなくてもよい。
また、上記の実施形態においては、動詞の活用形を表す標識を用いる場合について説明したが、これに限定されるものではない。例えば、動詞の活用形を表す標識は用いずに、適切な活用語尾を自動推定してもよい。具体的には、「書」と「ます」をつなげるために必要な活用語尾を、何らかの機械学習手法によってコーパスから学習しておいた活用語尾推定モデルを用いて推定し、挿入することによって、結果として「書きます」を取得する。
また、上記の実施形態においては、印象スコアの値は0から1の範囲の値になっているが、1〜5まで1刻みなど、予め定めた範囲・粒度の値としても良い。
また、上記の第1の実施形態において、キャラクタ及び印象スコアの指定を入力する場合を例に説明したが、これに限定されるものではなく、印象軸毎の印象スコアを直接指定して入力としてもよい。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
20、220、320 演算部
22、40、223 形態素文節情報付与部
30 書き換えコーパス記憶部
32 印象別コーパス記憶部
42 書き換え箇所アライメント部
44 書き換え規則リスト取得部
46 表記書き換え規則リスト記憶部
48 印象スコア算出部
50 表記別印象スコア記憶部
100 学習装置
200 書き換え装置
210、310 入力部
221 印象パラメータ設定表記憶部
222 印象パラメータ自動設定部
224 表記書き換え規則リスト記憶部
226 表記別印象スコア記憶部
228 書き換え候補選択部
230 動詞活用表記憶部
232 活用調整部
290、390 出力部
300 印象評価装置
330 評価部

Claims (9)

  1. 書き換え先のキャラクタの指定、予め定められた複数の印象軸のうちの少なくとも1つの印象軸の印象スコアの指定、及び入力文を受け付ける入力部と、
    書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め求められた前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定及び前記少なくとも1つの印象軸の印象スコアの指定、キャラクタ毎に予め定められた複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、
    を含む書き換え装置であって、
    前記書き換え候補選択部は、前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの複数の印象軸の各々の印象スコアを、前記少なくとも1つの印象軸の印象スコアで上書きして得られる、複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して、前記書き換え候補の表記を選択する
    書き換え装置
  2. 予め定められた複数の印象軸毎に、当該印象軸に紐づけられた文からなるコーパスを記憶する印象別コーパス記憶部と、
    表記毎に、前記複数の印象軸の各々について、当該印象軸に紐づけられたコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを算出する印象スコア算出部と、
    書き換え先の印象の指定及び入力文を受け付ける入力部と、
    書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、前記印象スコア算出部により表記毎に算出された前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先の印象の指定とに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、
    を含む書き換え装置。
  3. 書き換え先のキャラクタの指定及び入力文を受け付ける入力部と、
    書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め定められた複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定と、キャラクタ毎に予め定められた前記複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、
    を含む書き換え装置であって、
    前記書き換え候補選択部は、前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの前記複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して前記書き換え候補の表記を選択し、
    前記キャラクタに対する前記複数の印象軸の各々の印象スコアは、当該キャラクタに対応するテキストデータに含まれる表記の各々の印象スコアに基づいて予め定められる
    書き換え装置。
  4. 前記印象別コーパス記憶部は、前記複数の印象軸毎に、当該印象軸において対立する2つの印象の各々について、当該印象を持つ文からなるコーパスを記憶し、
    前記印象スコア算出部は、表記毎に、前記複数の印象軸の各々について、当該印象軸において対立する2つの印象の各々のコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを算出する請求項2記載の書き換え装置。
  5. 予め定められた複数の印象軸毎に、当該印象軸に紐づけられた文からなるコーパスを記憶する印象別コーパス記憶部と、
    表記毎に、前記複数の印象軸の各々について、当該印象軸に紐づけられたコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを算出する印象スコア算出部と、
    書き換え先のキャラクタの指定、予め定められた複数の印象軸のうちの少なくとも1つの印象軸の印象スコアの指定、及び入力文を受け付ける入力部と、
    前記入力文に対して形態素情報及び文節情報を付与する形態素文節情報付与部と、
    書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め求められた前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定及び前記少なくとも1つの印象軸の印象スコアの指定、キャラクタ毎に予め定められた複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、
    前記形態素文節情報付与部において付与された形態素情報及び文節情報と、前記書き換え候補選択部により置換された前記入力文と、動詞の活用型及び活用形に対応する活用語尾が格納されている動詞活用表とに基づいて、前記置換された前記入力文に含まれる動詞の活用語尾を置換する活用調整部と、
    を含む書き換え装置であって、
    前記キャラクタに対する前記複数の印象軸の各々の印象スコアは、当該キャラクタに対応するテキストデータに含まれる表記の各々の印象スコアに基づいて予め定められ、
    前記印象別コーパス記憶部は、前記複数の印象軸毎に、当該印象軸において対立する2つの印象の各々について、当該印象を持つ文からなるコーパスを記憶し、
    前記印象スコア算出部は、表記毎に、前記複数の印象軸の各々について、当該印象軸において対立する2つの印象の各々のコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを算出し、
    前記書き換え候補選択部は、前記入力文に含まれる文節の各々について、前記書き換え規則リストから、前記文節の表記が、書き換え元の表記と一致する前記組み合わせの書き換え先の表記を、前記書き換え候補の表記として抽出し、
    前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの複数の印象軸の各々の印象スコアを、前記少なくとも1つの印象軸の印象スコアで上書きして得られる、複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して、前記書き換え候補の表記を選択する
    書き換え装置
  6. 入力部が、書き換え先のキャラクタの指定、予め定められた複数の印象軸のうちの少なくとも1つの印象軸の印象スコアの指定、及び入力文を受け付け、
    書き換え候補選択部が、書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め求められた前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定及び前記少なくとも1つの印象軸の印象スコアの指定、キャラクタ毎に予め定められた複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する
    書き換え方法であって、
    前記書き換え候補選択部が前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの複数の印象軸の各々の印象スコアを、前記少なくとも1つの印象軸の印象スコアで上書きして得られる、複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して、前記書き換え候補の表記を選択する
    書き換え方法
  7. 予め定められた複数の印象軸毎に、当該印象軸に紐づけられた文からなるコーパスを記憶する印象別コーパス記憶部を含む書き換え装置における書き換え方法であって、
    印象スコア算出部が、表記毎に、前記複数の印象軸の各々について、当該印象軸に紐づけられたコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを予め算出しておき、
    入力部が、書き換え先の印象の指定及び入力文を受け付け、
    書き換え候補選択部が、書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、前記印象スコア算出部により表記毎に算出された前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先の印象の指定とに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する
    書き換え方法。
  8. 入力部が、書き換え先のキャラクタの指定及び入力文を受け付け、
    書き換え候補選択部が、書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め定められた複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定と、キャラクタ毎に予め定められた前記複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する
    書き換え方法であって、
    前記書き換え候補選択部が前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの前記複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して前記書き換え候補の表記を選択し、
    前記キャラクタに対する前記複数の印象軸の各々の印象スコアは、当該キャラクタに対応するテキストデータに含まれる表記の各々の印象スコアに基づいて予め定められる
    書き換え方法。
  9. コンピュータを、請求項1〜請求項の何れか1項記載の書き換え装置を構成する各部として機能させるためのプログラム。
JP2016036089A 2016-02-26 2016-02-26 書き換え装置、方法、及びプログラム Active JP6592378B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016036089A JP6592378B2 (ja) 2016-02-26 2016-02-26 書き換え装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016036089A JP6592378B2 (ja) 2016-02-26 2016-02-26 書き換え装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017151902A JP2017151902A (ja) 2017-08-31
JP6592378B2 true JP6592378B2 (ja) 2019-10-16

Family

ID=59741871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016036089A Active JP6592378B2 (ja) 2016-02-26 2016-02-26 書き換え装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6592378B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6712387B2 (ja) * 2016-07-21 2020-06-24 国立大学法人電気通信大学 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP7295429B2 (ja) * 2019-10-16 2023-06-21 富士通株式会社 文書処理プログラム、文書処理方法および文書処理装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0748216B2 (ja) * 1989-08-19 1995-05-24 工業技術院長 表現変換方式
JP3033133B2 (ja) * 1990-06-05 2000-04-17 松下電器産業株式会社 文章編集装置
JP2000250907A (ja) * 1999-02-26 2000-09-14 Fuji Xerox Co Ltd 文書処理装置および記録媒体
JP2009217665A (ja) * 2008-03-12 2009-09-24 Sharp Corp 文章編集装置

Also Published As

Publication number Publication date
JP2017151902A (ja) 2017-08-31

Similar Documents

Publication Publication Date Title
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
JP4762103B2 (ja) 韻律統計モデル訓練方法及び装置、並びに韻律解析方法及び装置
CN109255115B (zh) 一种文本标点调整方法及装置
CN105045777A (zh) 使用互联网语料库的自动的上下文相关的语言校正和增强
CN112115700A (zh) 一种基于依存句法树和深度学习的方面级情感分析方法
US9348901B2 (en) System and method for rule based classification of a text fragment
JP7142435B2 (ja) 要約装置、要約方法、及び要約プログラム
CN111666409A (zh) 一种基于综合深度胶囊网络的复杂评论文本的整体情感智能分类方法
CN111737961B (zh) 一种故事生成的方法、装置、计算机设备和介质
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
Macklin-Cordes et al. Re-evaluating phoneme frequencies
JP6592378B2 (ja) 書き換え装置、方法、及びプログラム
CN114239589A (zh) 语义理解模型的鲁棒性评估方法、装置及计算机设备
CN112200674B (zh) 一种证券市场情绪指数智能计算信息系统
Chennoufi et al. Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization
CN110728133B (zh) 个性语料获取方法及个性语料获取装置
KR100542757B1 (ko) 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치
CN116562240A (zh) 文本生成方法、计算机设备及计算机存储介质
Alqahtani et al. Investigating input and output units in diacritic restoration
US20100145677A1 (en) System and Method for Making a User Dependent Language Model
CN114896966A (zh) 一种中文文本语法错误定位方法、系统、设备及介质
CN111090720B (zh) 一种热词的添加方法和装置
Zhang Comparing the Effect of Smoothing and N-gram Order: Finding the Best Way to Combine the Smoothing and Order of N-gram
JP2006004366A (ja) 機械翻訳システム及びそのためのコンピュータプログラム
CN113988047A (zh) 一种语料筛选方法和装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160303

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180305

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180305

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190917

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190920

R150 Certificate of patent or registration of utility model

Ref document number: 6592378

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150