JP6161656B2

JP6161656B2 - 言語表現書き換え装置、方法、及びプログラム

Info

Publication number: JP6161656B2
Application number: JP2015104613A
Authority: JP
Inventors: 千明宮崎; 太一片山; 平野　徹; 徹平野; 東中　竜一郎; 竜一郎東中; 牧野　俊朗; 俊朗牧野; 松尾　義博; 義博松尾
Original assignee: Nippon Telegraph and Telephone Corp; NTT Inc USA
Current assignee: NTT Inc; NTT Inc USA
Priority date: 2015-05-22
Filing date: 2015-05-22
Publication date: 2017-07-12
Anticipated expiration: 2035-05-22
Also published as: JP2016218848A

Description

本発明は、言語表現書き換え装置、学習装置、方法、及びプログラムに係り、特に、入力されたテキストの言語表現を書き換える言語表現書き換え装置、方法、及びプログラムに関する。

従来、文末の機能語列（文末表現）のみを対象としてテキストを書き換えることにより、言語表現にキャラクタ付けを行う方法が存在する。例えば、著者の属性が付与されたテキストデータを用いて、著者の属性値毎に偏って多く使われる文末表現を抽出し、発話のキャラクタ付けに利用する技術が提案されている（非特許文献１）。

宮崎千明、平野徹、東中竜一郎、牧野俊朗、松尾義博、「発話にキャラクタ性を与えるための文末表現の変換」、人工知能学会研究会資料(SIG-SLUD-68), pp. 41-46, 2013.

しかし、上記非特許文献１の技術では、文末表現のみを書き換えの対象としているため、例えば、テレビアニメや漫画の登場人物のように個性豊かなキャラクタの言語的特徴を、多様なバリエーションで表現するためには十分ではない、という問題がある。

本発明は、上記問題を解決するために成されたものであり、多様なバリエーションの言語表現への書き換えを実現する言語表現書き換え装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、第１の発明に係る言語表現書き換え装置は、文体、述部機能表現、及び人称代名詞を含み、かつキャラクタに応じた特徴が表れる複数種類の言語的特徴の各々について、該言語的特徴に基づく言語表現の書き換えに関する設定値を設定する設定部と、前記設定部により設定された設定値に基づいて、入力文の末尾の文節に含まれる機能表現を対象として文体の種類を変換する処理、入力文の末尾の文節に含まれる機能表現を対象として述部機能表現をキャラクタに応じて変換する処理、及び人称代名詞である形態素をキャラクタに応じた人称代名詞に変換する処理を含む複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用する書き換え処理部と、を含んで構成することができる。

第１の発明に係る言語表現書き換え装置によれば、設定部が、文体、述部機能表現、及び人称代名詞を含み、かつキャラクタに応じた特徴が表れる複数種類の言語的特徴の各々について、言語的特徴に基づく言語表現の書き換えに関する設定値を設定する。そして、書き換え処理部が、設定部により設定された設定値に基づいて、入力文の末尾の文節に含まれる機能表現を対象として文体の種類を変換する処理、入力文の末尾の文節に含まれる機能表現を対象として述部機能表現をキャラクタに応じて変換する処理、及び人称代名詞である形態素をキャラクタに応じた人称代名詞に変換する処理を含む複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用する。

また、第２の発明に係る言語表現書き換え方法は、設定部、及び書き換え処理部を含む言語表現書き換え装置における言語表現書き換え方法であって、前記設定部が、文体、述部機能表現、及び人称代名詞を含み、かつキャラクタに応じた特徴が表れる複数種類の言語的特徴の各々について、該言語的特徴に基づく言語表現の書き換えに関する設定値を設定し、前記書き換え処理部が、前記設定部により設定された設定値に基づいて、入力文の末尾の文節に含まれる機能表現を対象として文体の種類を変換する処理、入力文の末尾の文節に含まれる機能表現を対象として述部機能表現をキャラクタに応じて変換する処理、及び人称代名詞である形態素をキャラクタに応じた人称代名詞に変換する処理を含む複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用する方法である。

このように、文末表現だけでなく、多様な言語表現の書き換え処理を任意に組み合わせて実施するため、多様なバリエーションの言語表現への書き換えを実現することができる。

また、第１及び第２の発明において、前記設定部は、文構造、活用形、言いよどみ、方言又は特殊語彙、特定の音素、及びキャラクタを弁別可能だが意味を持たない弁別的無意味表現をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、前記書き換え処理部は、前記設定部により設定された設定値に基づいて、複文の入力文を単文に分割すると共に、キャラクタに応じた接続表現を分割箇所に挿入することで文構造を変換する処理、活用形を変換する処理、言いよどみの表現に変換する処理、特定の語彙を方言又は特殊語彙へ変換する処理、特定の音素をキャラクタに応じた音素に変換する処理、及びキャラクタに応じた弁別的無意味表現を挿入する処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用することができる。これにより、より多様なバリエーションの言語表現への書き換えを実現することができる。

また、第１及び第２の発明において、前記設定部は、文字種、分かち書き、及び記号類をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、前記書き換え処理部は、前記設定部により設定された設定値に基づいて、前記文字種を変換する処理、分かち書きに変換する処理、及び記号類を挿入する処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用することができる。これにより、より多様なバリエーションの言語表現への書き換えを実現することができる。

また、第３の発明に係る言語表現書き換えプログラムは、コンピュータを、上記の言語表現書き換え装置の各部として機能させるためのプログラムである。

以上説明したように、本発明の言語表現書き換え装置、方法、及びプログラムによれば、文末表現だけでなく、多様な言語表現の書き換え処理を任意に組み合わせて実施するため、多様なバリエーションの言語表現への書き換えを実現することができる。

本実施形態に係る言語表現書き換え装置の概略構成を示す機能ブロック図である。機能表現とその意味との対応表の一例を示す図である。文体別機能表現リストの一例を示す図である。活用表の一例を示す図である。形態素列同士の置換ルールの一例を示す図である。キャラクタ別接続表現リストの一例を示す図である。キャラクタ別機能表現リストの一例を示す図である。崩れ活用ルールの一例を示す図である。キャラクタ別人称代名詞リストの一例を示す図である。キャラクタ別語彙置換ルールの一例を示す図である。キャラクタ別音素置換ルールの一例を示す図である。本実施形態における言語表現書き換え処理ルーチンの一例を示すフローチャートである。

以下、図面を参照して本発明の実施形態を詳細に説明する。

＜言語表現書き換え装置の構成＞
本実施形態に係る言語表現書き換え装置１０は、ＣＰＵと、ＲＡＭと、後述する言語表現書き換え処理ルーチンを実行するための言語表現書き換えプログラムや各種データを記憶したＲＯＭとを含むコンピュータで構成することができる。言語表現書き換え装置１０は、機能的には、図１に示すように、設定部１１と、基本解析部１２と、書き換え処理部１３とを含む構成で表される。

言語表現書き換え装置１０は、日本語の入力文２３（テキストデータ）を入力として受け取り、入力文２３の中に含まれる言語表現を、指定された設定に即して書き換えた書き換え文３２を出力する。本実施形態では、テレビアニメや漫画の登場人物のような個性の強いキャラクタの発話において頻繁に観察される以下の１２種類の言語的特徴に関する書き換え項目を、任意の組み合わせで指定可能にする。

書き換え項目
（ａ）文体、（ｂ）文字種、（ｃ）分かち書き、（ｄ）文構造、（ｅ）述部機能表現・キャラ語尾、（ｆ）活用形、（ｇ）言いよどみ、（ｈ）人称代名詞、（ｉ）方言・特殊語彙、（ｊ）音素置換、（ｋ）弁別的無意味表現、（ｌ）記号類

設定部１１は、後述する書き換え処理部１３での言語表現の書き換えに関する設定値が記載された設定ファイル２１を読み込む。設定ファイル２１には、上記の書き換え項目の各々について、以下のような書き換えに関する設定値（設定を指定するための値、ファイル名、文字列）が記載される。

（ａ）文体変換の設定値（０＝無変換、１＝常体（だ体）、２＝敬体（です・ます体）、３＝敬体（でございます体））
（ｂ）文字種変換の設定値（０＝無変換、１＝ひらがな化）
（ｃ）分かち書き変換の設定値（０＝無変換、１＝読点区切り、２＝空白区切り）
（ｄ）文構造変換用のキャラクタ別接続表現リスト２６（詳細は後述）のファイル名（ファイル名を指定しない場合は、無変換とみなす）
（ｅ）述部機能表現・キャラ語尾変換用のキャラクタ別機能表現リスト２７（詳細は後述）のファイル名（ファイル名を指定しない場合は、無変換とみなす）
（ｆ）活用形変換の設定値（０＝無変換、１＝崩れた活用形に変換）
（ｇ）言いよどみ変換の設定値（０＝無変換、１＝言いよどみ化）
（ｈ）人称代名詞置換用のキャラクタ別人称代名詞リスト２９（詳細は後述）のファイル名（ファイル名を指定しない場合は、無変換とみなす）
（ｉ）方言・特殊語彙置換用のキャラクタ別語彙置換ルール３０（詳細は後述）のファイル名（ファイル名を指定しない場合は、無変換とみなす）
（ｊ）音素置換用のキャラクタ別音素置換ルール３１（詳細は後述）のファイル名（ルールのファイル名を指定しない場合は、無変換とみなす）
（ｋ）使用する弁別的無意味表現を示す文字列（弁別的無意味表現を指定しない場合は、無変換とみなす）
（ｌ）使用する記号類を示す文字列（記号類を指定しない場合は、無変換とみなす）

設定部１１は、読み込んだ設定ファイル２１に記載された各項目についての設定値を、設定値データベース（ＤＢ）２２に記憶する。

なお、各項目の詳細については、対応する書き換え処理部１３の各処理部の説明で合わせて行うこととし、ここでの説明は省略する。

基本解析部１２は、入力文２３を読み込む。入力文２３は、日本語で書かれたテキストデータである。例えば、ブログ、ＳＮＳ（Social Networking Service）等への書き込み、発話の音声認識結果やテキストチャットなど、文字化された日本語のテキストデータであれば、本実施形態の入力文２３として適用可能である。

基本解析部１２は、読み込んだ入力文２３を係り受け解析器にかけ、その出力から形態素境界、各形態素の読み、各形態素の品詞、活用語の活用型・活用形、文節境界、及び文節主辞の情報を取得する。なお、基本解析部１２では、入力文２３の形態素境界、各形態素の読み、各形態素の品詞、活用語の活用型・活用形、文節境界、及び文節主辞の情報が取得できさえすれば、必ずしも係り受け解析器を使用する必要はない。例えば、形態素解析器で形態素境界、読み、品詞、活用語の活用型・活用形を取得し、文節境界や文節主辞は個別のアルゴリズムを使用して求めてもよい。

また、基本解析部１２は、図２に示すような機能表現とその意味との対応表を用いて、文字列マッチによって、入力文２３に含まれる機能表現の意味ラベルを取得する（参考文献１参照）。なお、機能表現の意味ラベルの取得手法として、例えば参考文献２に記載の、機械学習を用いて適切なラベルを推定する手法を用いてもよい。

参考文献１：松吉俊、佐藤理史、宇津呂武仁、“日本語機能表現辞書の編纂”、自然言語処理、１４．５，２００７
参考文献２：今村賢治、泉朋子、菊井玄一郎、佐藤理史、“述部機能表現の意味ラベルタガー”、言語処理学会第１７回年次大会発表論文集、２０１１

例えば、「私は寒がりなので、暖かい服装を選んだ。」という入力文２３を基本解析部１２が読み込んだ場合、以下に示す（１）形態素境界、文節境界、文節主辞、（２）各形態素の読み、（３）各形態素の品詞、活用語の活用型・活用形、（４）機能表現の意味ラベルの情報が取得される。以下、基本解析部１２で取得されるこれらの情報をまとめて、基本解析結果という。

（１）｛私｝＿は／｛寒がり｝＿な＿ので＿、／｛暖か｝＿い／｛服装｝＿を／｛選｝＿ん＿だ＿。
（２）｛ワタシ｝＿ハ／｛サムガリ｝＿ナ＿ノデ＿、／｛アタタカ｝＿イ／｛フクソウ｝＿ヲ／｛エラ｝＿ン＿ダ＿。
（３）｛代名詞｝＿係助詞／｛名詞｝＿助動詞＿接続助詞＿読点／｛形容詞語幹｝＿活用語尾：連体形／｛名詞｝＿格助詞／｛動詞語幹：バ行五段｝＿活用語尾：連用形−音便＿助動詞＿句点
（４）｛＊｝＿＊／｛＊｝＿＊＿理由＿＊／｛＊｝＿＊／｛＊｝＿＊／｛＊｝＿＊＿完了＿＊

上記の基本解析結果では、形態素境界が「＿」、文節境界が「／」、文節主辞が「｛｝」で示されている。なお、文節が区切れているところでは、必ず形態素も区切れているため、文節境界は形態素境界でもある。また、活用語（動詞、形容詞、助動詞）の活用語尾は語幹から切り離しておく（例えば、「選＿ん＿だ」）。さらに、（４）において、「＊」は、機能表現ではない、又は機能表現であっても本実施形態で処理対象となる意味ラベルが付与されなかったことを意味する。

書き換え処理部１３は、図１に示すように、文体変換部１３ａ、文字種変換部１３ｂ、分かち書き変換部１３ｃ、文構造変換部１３ｄ、述部機能表現・キャラ語尾変換部１３ｅ、活用形変換部１３ｆ、言いよどみ変換部１３ｇ、人称代名詞置換部１３ｈ、方言・特殊語彙置換部１３ｉ、音素置換部１３ｊ、弁別的無意味表現挿入部１３ｋ、及び記号類挿入部１３ｌを含む。

書き換え処理部１３の各処理部には、入力文２３について基本解析部１２で解析された基本解析結果が各々入力される。ただし、設定値ＤＢ２２に記憶された各処理部に対応する項目の設定値が、各処理部の書き換え処理を適用しないことを示す場合、その処理部へは基本解析結果は入力されない。例えば、設定値ＤＢ２２に記憶された項目（ａ）文体変換の設定値が０＝無変換の場合、文体変換部１３ａには、基本解析結果は入力されない。

以下、基本解析結果が入力された各処理部の書き換え処理について、詳述する。

文体変換部１３ａは、設定値ＤＢ２２から、項目（ａ）文体変換の設定値（１＝常体（だ体）、２＝敬体（です・ます体）、３＝敬体（でございます体）のいずれか）を取得する。文体変換部１３ａは、入力文２３の述部の機能表現を、取得した設定値が示す文体に合わせて置換することにより、文体を変換した文を出力する。

具体的には、文体変換部１３ａは、例えば図３に示すような文体別機能表現リスト２４を参照して、入力文２３（基本解析結果）の末尾の文節に含まれる機能表現（主辞より後ろの形態素列）の置換後の表記を取得する。図３の例では、文体別機能表現リスト２４は、文体（常体（だ体）、敬体（です・ます体）、敬体（でございます体））別に、「文節主辞の品詞」及び「機能表現の意味」毎の置換先の「機能表現の表記」が定められている。

なお、文体別機能表現リスト２４において、置換の対象となる機能表現が動詞の場合は、置換先の「機能表現の表記」は、置換先の機能表現が要求する動詞の活用語尾の活用形を表すタグ（以下、［活用形］と表記する。例えば、［連用形］）を含む表記で定められている。この場合、文体変換部１３ａは、例えば、図４に示す活用表２５を参照し、タグ［活用形］の部分を、置換先の表記に変換する。図４に示す活用表２５において、空のセルは、活用語尾を挟まずに語幹と後続の形態素とが接続するものを示す。例えば、一段活用の動詞の未然形（ア段）は、語幹「見」と助動詞「ない」とが直に接続し、「見ない」となる。また、「−」が記載されているセルは、日本語として存在しない組み合わせ（考慮不要の組み合わせ）を示す。

上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３の基本解析結果に対する文体の変換を例に、文体変換部１３ａの処理をより詳細に説明する。

文体変換部１３ａは、基本解析結果から、述部の文節主辞の品詞＝｛動詞語幹：バ行五段｝、その文節の機能表現の意味ラベル＝“完了”の情報を取得する。そして、文体変換部１３ａは、図３に示す文体別機能表現リスト２４を参照して、基本解析結果から取得した情報と一致する「文節主辞の品詞」及び「機能表現の意味」に対応付けられた「機能表現の表記」を取得する。設定値ＤＢ２２から取得された設定値が２＝敬体（です・ます体）、又は３＝敬体（でございます体）の場合、下記に示すような処理中間結果が得られる。なお、以下では、置換された箇所を<< >>で表す。

敬体（です・ます体）の例：
私は寒がりなので、暖かい服装を選<<［連用形］ました>>。
敬体（でございます体）の例：
私は寒がりなので、暖かい服装を選<<［連用形−音便］たのでございます>>。

上記の処理中間結果のように、機能表現が置換された文節がタグ［活用形］を含む場合には、文体変換部１３ａは、活用表２５から、タグ［活用形］が示す動詞の活用形と、その文節の主辞である動詞の活用型とが一致する活用形の表記を取得する。そして、文体変換部１３ａは、下記に示すように、処理中間結果に含まれるタグ［活用形］を、活用表２５から取得した活用形の表記に置換する。

敬体（です・ます体）の例：
私は寒がりなので、暖かい服装を選<<［連用形］ました>>。
⇒私は寒がりなので、暖かい服装を選<<びました>>。
文節「選［連用形］ました」における、文節主辞の品詞は「動詞語幹：バ行五段」、タグ「活用形」が示す活用形は「連用形」であるので、この条件にマッチする活用形の表記「び」が取得される。

敬体（でございます体）の例：
私は寒がりなので、暖かい服装を選<<［連用形−音便］たのでございます>>。 ⇒私は寒がりなので、暖かい服装を選<<んだのでございます>>。
文節「選［連用形−音便］たのでございます」における、文節主辞の品詞は「動詞語幹：バ行五段」、タグ「活用形」が示す活用形は「連用形（音便形）」であるので、この条件にマッチする活用形の表記「ん」が取得される。

なお、文節主辞の活用型が「ガ行五段活用」、「バ行五段活用」、「マ行五段活用」、及び「ナ行五段活用」のいずれかである場合は、置換先の機能表現の先頭文字（活用語尾に後続する文字）「て」又は「た」をそれぞれ「で」又は「だ」に置換する。上記の例では、文節主辞の活用型が「バ行五段活用」であるので、「選［連用形−音便］たのでございます」が、「選んだのでございます」に置換されている。

なお、上記では、適切な活用語尾を挿入するために、置換先の機能表現が要求する動詞の活用語尾の活用形を表すタグを利用したが、この方法に限定されない。例えば、２つの形態素を結合する際にどのような活用語尾が挿入されるべきかを、何らかの機械学習の手法によって事前に学習しておき、文体変換部１３ａにおける活用語尾の挿入に利用してもよい。例えば、「選」と「た」との間にどのような活用語尾が入るべきかを推定するモデルを学習しておく。そして、語幹が「選」の動詞を「語幹＋活用語尾＋助動詞「た」」の形に置換したい場合には、学習したモデルの出力から置換先の活用語尾を得る、という使い方ができる。

また、別の方法として、置換対象の形態素（列）の前後にどのような形態素が共起しているかを考慮した形態素列同士の置換ルールを用いて文体を変換することも可能である。この場合、例えば、図５に示すような形態素列同士の置換ルールを用いて、文体を変換することができる。

なお、本実施形態では、取り得る設定値が０＝無変換、１＝常体（だ体）、２＝敬体（です・ます体）、３＝敬体（でございます体）の４種類の場合について説明するが、他の文体（例えば、「常体（である体）」）へ変換するための設定値を追加してもよい。

文字種変換部１３ｂは、設定値ＤＢ２２に記憶された項目（ｂ）文字種変換の設定値（１＝ひらがな化）にしたがって、漢字をひらがなに変換した文を出力する。具体的には、文字種変換部１３ｂは、下記に示すように、基本解析結果に含まれる各形態素の読み（カタカナで書かれた部分）を全てひらがなに置換する。

ひらがな化の例：
わたしはさむがりなので、あたたかいふくそうをえらんだ。

なお、本実施形態では、取り得る設定値が０＝無変換、又は１＝ひらがな化の２種類の場合について説明するが、全ての文字をカタカナに変換する「カタカナ化」のオプションを用意してもよい。また、「５０％（２回に１回の割合で）ひらがな化する」、「２０％（５回に１回の割合で）カタカナ化する」などのように、文字種変換を実施する割合を指定できるようにしてもよい。また、品詞が「名詞」の形態素のみひらがな化する、などのように、文字種変換の対象とする品詞を指定してもよい。

分かち書き変換部１３ｃは、設定値ＤＢ２２から、項目（ｃ）分かち書き変換の設定値（１＝読点区切り、又は２＝空白区切り）を取得する。分かち書き変換部１３ｃは、入力文２３の文節境界に、指定された区切り文字を挿入することにより、下記に示すように、分かち書きが変換された文を出力する。なお、区切り文字（読点又は空白）を挿入することにより、読点や空白が連続してしまう場合は、区切り文字を挿入しないこととする。また、「暖かい」と「服装」との間のように、連体修飾関係にある２つの連続する文節の間には区切り文字を挿入しないこととする。

分かち書き変換（読点区切り）の例：
私は<<、>>寒がりなので、暖かい服装を<<、>>選んだ。

文構造変換部１３ｄは、設定値ＤＢ２２から、項目（ｄ）文構造変換用のキャラクタ別接続表現リスト２６のファイル名を取得する。そして、文構造変換部１３ｄは、入力文２３を単文に分割すると共に、取得したファイル名が示すキャラクタ別接続表現リスト２６から得られる接続表現を分割箇所に挿入することで、文構造を変換した文を出力する。

具体的には、入力文２３が複文である場合は、文構造変換部１３ｄは、例えば図６に示すようなキャラクタ別接続表現リスト２６のうち、取得したファイル名が示すキャラクタ別接続表現リスト２６を参照する。そして、文構造変換部１３ｄは、入力文２３から、キャラクタ別接続表現リスト２６に記載された意味ラベルを持つ文節を探し、該当する意味ラベルが付与されている形態素を削除し、削除箇所に句点を挿入する。また、文構造変換部１３ｄは、上記意味ラベルが付与されている形態素の直前の形態素が活用語（動詞、形容詞、助動詞）である場合は、その活用語を終止形に変換する。終止形としては、形態素解析結果の一部として出力されることの多い「基本形」を利用してもよいし、活用表２５を利用してもよい。そして、文構造変換部１３ｄは、上記意味ラベルに対応する接続表現をキャラクタ別接続表現リスト２６から取得し、挿入した句点の後ろに挿入する。なお、接続表現と共に読点を挿入してもよい。

例えば、設定値ＤＢ２２に記憶された項目（ｄ）文構造変換用のキャラクタ別接続表現リスト２６のファイル名として、キャラＡのキャラクタ別接続表現リスト２６が指定されているとする。上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３では、文節「寒がりなので、」の形態素「ので」の意味ラベル「理由」が、キャラクタ別接続表現リスト２６に記載された意味ラベルの１つに該当する。そこで、「ので」及びその後の読点「、」を削除すると共に、削除箇所に句点「。」を挿入する。また、「ので」の前の助動詞「な」を終止形「だ」に置換する。さらに、挿入した句点「。」の後に、キャラＡのキャラクタ別接続表現リスト２６において、意味ラベル「理由」に対応付けられている接続詞「なので」を取得し、読点「、」と共に挿入する。これにより、下記に示すように、入力文２３の文構造が変換される。

単文化の例：
私は寒がり<<だ。なので、>>暖かい服装を選んだ。

なお、上記では、文の境界を示すために句点を挿入することとしたが、文の境界を示すことができさえすればどのような記号を用いてもよい。

また、「は」などの提題を表す助詞又は主格を表す助詞「が」が複数個現れる入力文２３は、単文化の対象外、すなわち、文構造変換部１３ｄによる書き換え処理の対象外としてもよい。例えば、「私は、彼が寒がりなので、マフラーを貸してあげました。」という入力文２３が、「私は、彼が寒がりだ。なので、マフラーを貸してあげました。」のように書き換えられることを避けるためである。

述部機能表現・キャラ語尾変換部１３ｅは、設定値ＤＢ２２から、項目（ｅ）述部機能表現・キャラ語尾変換用のキャラクタ別機能表現リスト２７のファイル名を取得する。キャラクタ別機能表現リスト２７の一例を図７に示す。キャラクタ別機能表現リスト２７の構成は、文体別機能表現リスト２４と同様である。また、述部機能表現・キャラ語尾変換部１３ｅの処理も、文体変換部１３ａの処理と同様である。ただし、キャラクタ別機能表現リスト２７では、キャラクタの個性を表現可能な述部機能表現及び語尾を任意に定めることができる。図７に示すキャラＢのキャラクタ別機能表現リスト２７の例のように、キャラクタ付けのために日本語文法の範囲外の表現（キャラ語尾）を用いることもできる。これにより、述部機能表現・キャラ語尾変換部１３ｅでは、文体変換部１３ａとは異なる言語表現の書き換えを実現することができる。

例えば、設定値ＤＢ２２に記憶された項目（ｅ）述部機能表現・キャラ語尾変換用のキャラクタ別機能表現リスト２７のファイル名として、キャラＡのキャラクタ別機能表現リスト２７が指定されているとする。この場合、上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３は、下記のように述部機能表現が変換される。

述部機能表現・キャラ語尾変換の例：
私は寒がりなので、暖かい服装を選ん<<だの>>。

活用形変換部１３ｆは、設定値ＤＢ２２に記憶された項目（ｆ）活用形変換の設定値（１＝崩れた活用形に変換）にしたがって、形容詞（語幹及び活用語尾）を崩れた表現に置換することにより、活用形を変換した文を出力する。具体的には、活用形変換部１３ｆは、入力文２３に含まれる形容詞の語幹及び活用語尾の表記を、例えば図８に示すような崩れ活用ルール２８の「入力（表記）」部分と照合し、対応する「出力」部分の語幹及び活用語尾の表記を取得して置換する。

例えば、上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３の場合、形容詞「暖かい」の「かい」の部分が崩れ活用ルール２８の「入力（表記）」の１つに該当する。そこで、「かい」の部分を、対応する「出力（表記）」である「けぇ」に置換することで、下記に示すように、入力文２３の活用形を崩れた活用形に変換する。

崩れた活用形に変換の例：
私は寒がりなので、暖<<けぇ>>服装を選んだ。

なお、本実施形態では、例えば図８に示すような崩れ活用ルール２８を用いたルールベースの手法で変換処理を行う場合について説明したが、これに限定されない。例えば、何らかの機械学習を用いてコーパス（崩れた活用形が使用されるテキストデータ）から学習しておいたモデルを用いて、崩れていない語幹及び活用語尾の置換先となる崩れた語幹及び活用語尾を推定するなどしてもよい。

言いよどみ変換部１３ｇは、設定値ＤＢ２２に記憶された項目（ｇ）言いよどみ変換の設定値（１＝言いよどみ化）にしたがって、入力文２３を、言いよどみが表れた文に変換する。具体的には、言いよどみ変換部１３ｇは、入力文２３の文頭の形態素の読み（本実施形態の基本解析結果の例ではカタカナで記載）の１文字目をひらがな化し、文頭の形態素の前に挿入する。なお、挿入したひらがなの後に、読点を挿入してもよい。

例えば、上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３の場合、下記に示すように、入力文２３が言いよどみ化された文に変換される。

言いよどみ化の例：
<<わ、>>私は寒がりなので、暖かい服装を選んだ。

なお、上記では、文頭の形態素のみを言いよどみ化の対象とする場合について説明したが、節の先頭の形態素を対象として、「わ、私は寒がりなので、あ、暖かい服装を選んだ。」のように変換してもよいし、各文節の先頭の形態素を対象として、「わ、私は、さ、寒がりなので、あ、暖かい服装を、え、選んだ。」のように変換してもよい。また、言いよどみ化対象の形態素の表記がカタカナの場合は、言いよどみ化対象の形態素の前に挿入する文字をカタカナにしてもよい。また、例えば、「わ、わ、私は・・・」のように、挿入するひらがな又はカタカナを２回以上重ねて挿入してもよい。

人称代名詞置換部１３ｈは、設定値ＤＢ２２から、項目（ｈ）人称代名詞置換用のキャラクタ別人称代名詞リスト２９のファイル名を取得する。そして、人称代名詞置換部１３ｈは、入力文２３に含まれる人称代名詞の形態素を、取得したファイル名が示すキャラクタ別人称代名詞リスト２９から得られる人称代名詞に置換した文を出力する。

具体的には、人称代名詞置換部１３ｈは、例えば図９に示すようなキャラクタ別人称代名詞リスト２９のうち、取得したファイル名が示すキャラクタ別人称代名詞リスト２９を参照する。そして、人称代名詞置換部１３ｈは、入力文２３において、キャラクタ別人称代名詞リスト２９の「入力」部分と表記が一致する形態素を、対応する「出力」部分の表記と置換する。

例えば、設定値ＤＢ２２に記憶された項目（ｈ）人称代名詞置換用のキャラクタ別人称代名詞リスト２９のファイル名として、キャラＡのキャラクタ別人称代名詞リスト２９が指定されているとする。この場合、上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３は、下記のように人称代名詞が置換される。

人称代名詞置換の例：
<<あたし>>は寒がりなので、暖かい服装を選んだ。

方言・特殊語彙置換部１３ｉは、設定値ＤＢ２２から、項目（ｉ）方言・特殊語彙置換用のキャラクタ別語彙置換ルール３０のファイル名を取得する。そして、方言・特殊語彙置換部１３ｉは、入力文２３に含まれる特定の形態素を、取得したファイル名が示すキャラクタ別語彙置換ルール３０にしたがって、方言又は特殊語彙に置換した文を出力する。

具体的には、方言・特殊語彙置換部１３ｉは、例えば図１０に示すようなキャラクタ別語彙置換ルール３０のうち、取得したファイル名が示すキャラクタ別語彙置換ルール３０を参照する。そして、方言・特殊語彙置換部１３ｉは、入力文２３において、キャラクタ別語彙置換ルール３０の「入力」部分と表記が一致する形態素を、対応する「出力」部分の表記と置換する。キャラクタ別語彙置換ルール３０では、特定の置換元の語彙を、目的のキャラクタらしい語彙に変換するルールが定められる。

また、方言・特殊語彙置換部１３ｉは、置換先の語彙が活用語（動詞、形容詞、助動詞）である場合は、置換元の語彙（「入力」部分が該当）の活用形に合わせて活用語尾を調整してもよい。なお、助動詞の活用については、動詞型の活用をするものは動詞の活用表を参照し、形容詞型の活用をするものは形容詞の活用表を参照して取得することができる。

例えば、設定値ＤＢ２２に記憶された項目（ｉ）方言・特殊語彙置換用のキャラクタ別語彙置換ルール３０のファイル名として、キャラＡのキャラクタ別語彙置換ルール３０が指定されているとする。この場合、上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３は、下記のように特定の語彙が方言又は特殊語彙に置換される。

方言・特殊語彙置換の例：
私は寒がりなので、<<ぬくとい>>服装を選んだ。

なお、方言・特殊語彙置換部１３ｉで置換された表現は、その他の書き換え処理において更なる書き換え処理が加わらないように保護してもよい。

音素置換部１３ｊは、設定値ＤＢ２２から、項目（ｊ）音素置換用のキャラクタ別音素置換ルール３１のファイル名を取得する。そして、音素置換部１３ｊは、入力文２３に含まれる特定の文字を、取得したファイル名が示すキャラクタ別音素置換ルール３１にしたがって、置換先の文字に置換した文を出力する。

具体的には、音素置換部１３ｊは、例えば図１１に示すようなキャラクタ別音素置換ルール３１のうち、取得したファイル名が示すキャラクタ別音素置換ルール３１を参照する。そして、音素置換部１３ｊは、入力文２３において、キャラクタ別音素置換ルール３１の「入力」部分と表記が一致する文字を、対応する「出力」部分の表記と置換する。なお、本実施形態では、音素の置換を文字単位で捉えて置換することとする。例えば、「な」から「にゃ」、「の」から「にょ」への文字的な置換は、「ｎａ」から「ｎｙａ」へ、「ｎｏ」から「ｎｙｏ」への音素的な置換（「ｎ」から「ｎｙ」への音素置換）を捉えるためのものである。

例えば、設定値ＤＢ２２に記憶された項目（ｊ）音素置換用のキャラクタ別音素置換ルール３１のファイル名として、キャラＡのキャラクタ別音素置換ルール３０が指定されているとする。この場合、上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３は、下記のように特定の文字が置換される。

音素的な置換を捉えた文字置換の例：
私は寒がり<<にゃにょ>>で、暖かい服装を選んだ。

なお、キャラクタ別音素置換ルール３１の「入力」部分と一致する全ての文字を置換する場合に限定されず、文字の置換を実行するか否かを、その文字が属する形態素の品詞や、形態素内での出現位置などを条件（制約）にして決定してもよい。例えば、「ある文字が属する形態素の品詞が名詞である場合は置換しない」、「ある文字が形態素の先頭に位置する場合は置換しない」、などの制約を設けることができる。他にも、「同じ形態素内で複数回の置換を行ってはいけない」という制約や、「連続した２つ以上の文字を置換してはいけない」という制約を設けてもよい。

ここで問題になるのが、制約の数が多くなると、制約のあらゆる組み合わせを考慮したルールを人手で定義するのが困難になるという点である。そこで、置換元（入力）の文字、置換先（出力）の文字、置換元文字が属する形態素の品詞、置換元文字の出現位置、置換元文字が属する形態素内で既に実施された置換の回数、置換元文字までの連続文字置換回数などを特徴量として、何らかの機械学習によりモデルを学習しておき、このモデルを使用して、文字の置換を実施するようにしてもよい。

弁別的無意味表現挿入部１３ｋは、設定値ＤＢ２２に記憶された項目（ｋ）弁別的無意味表現を示す文字列を取得し、入力文２３の末尾に挿入することで、弁別的無意味表現が挿入された文を出力する。本実施形態において、弁別的無意味表現とは、日本語としては何の意味も持たないが、キャラクタの弁別を補助する表現のことを指す。

例えば、弁別的無意味表現を示す文字列として、「ピョン！」が指定されている場合、上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３には、下記のように弁別的無意味表現が挿入される。

弁別的無意味表現挿入の例：
私は寒がりなので、暖かい服装を選んだ。<<ピョン！>>

なお、本実施形態では、文末の句点の後ろに弁別的無意味表現を挿入する。句点がなければ、句点を挿入したうえで、弁別的無意味表現を句点に後続させる。

例えば、風貌がカエルのようなキャラクタ（カエル）、ボールのように丸いキャラクタ（ボール）、トゲがたくさん生えたキャラクタ（トゲ）という３種のキャラクタが存在するとする。この３者が似通った言語表現を使うため、言語的な差異が伝わりづらい場合でも、カエルの発話に弁別的無意味表現「ピョン！」を挿入することで、ボールやトゲではなく、カエルの発話であることを読み手又は聞き手に対して強く印象付けることができる。

なお、上記では、入力文２３の末尾に弁別的無意味表現を挿入する場合について説明したが、「ピョン！私は寒がりなので、暖かい服装を選んだ。」のように、文頭に挿入するなど、その他の箇所に弁別的無意味表現を挿入してもよい。

記号類挿入部１３ｌは、設定値ＤＢ２２に記憶された項目（ｌ）記号類を示す文字列を取得し、入力文２３の末尾に挿入することで、記号類が挿入された文を出力する。記号類挿入部１３ｌの処理は、挿入する文字列が弁別的無意味表現ではなく記号類である点を除いて、弁別的無意味表現挿入部１３ｋと同様である。なお、本実施形態において、記号類とは、★（星）や♪（音符）のような記号や、（＊＾ｏ＾＊）や（＞＿＜；）のような顔文字を指すこととする。

例えば、記号類を示す文字列として、「（＊＾ｏ＾＊）」が指定されている場合、上記の「私は寒がりなので、暖かい服装を選んだ。」という入力文２３には、下記のように記号類が挿入される。

記号類挿入の例：
私は寒がりなので、暖かい服装を選んだ。<<（＊＾ｏ＾＊）>>

上記のように、書き換え処理を行うことが設定された書き換え処理部１３の各処理部１３ａ〜１３ｌにおいて、入力文２３（基本解析結果）に対する書き換え処理が行われ、各処理部１３ａ〜１３ｌから書き換え文３２が出力される。

なお、書き換え処理部１３の各処理部１３ａ〜１３ｌの書き換え処理は任意の組み合わせで実行することができる。例えば、ある処理部で書き換えられた結果を別の処理部でさらに書き換える場合は、ある処理部の出力を再度、基本解析部１２に渡し、新規に取得した基本解析結果を次の処理部に渡せばよい。又は、ある処理部での書き換えに基づいて、入力文２３の基本解析結果を書き換えた上で、次の処理部に渡すようにしてもよい。例えば、文体変換部１３ａで書き換えられた結果を、別の処理部に渡す場合、以下のような基本解析結果を次の処理部へ渡すことができる。

（１）｛私｝＿は／｛寒がり｝＿な＿ので＿、／｛暖か｝＿い／｛服装｝＿を／｛選｝＿<<び>>＿<<ました>>＿。
（２）｛ワタシ｝＿ハ／｛サムガリ｝＿ナ＿ノデ＿、／｛アタタカ｝＿イ／｛フクソウ｝＿ヲ／｛エラ｝＿<<ｄｕｍｍｙ>>＿<<ｄｕｍｍｙ>>＿。
（３）｛代名詞｝＿係助詞／｛名詞｝＿助動詞＿接続助詞＿読点／｛形容詞語幹｝＿活用語尾：連体形／｛名詞｝＿格助詞／｛動詞語幹：バ行五段｝＿<<活用語尾：連用形>>＿<<ｄｕｍｍｙ>>＿句点
（４）｛＊｝＿＊／｛＊｝＿＊＿理由＿＊／｛＊｝＿＊／｛＊｝＿＊／｛＊｝＿＊＿完了＿＊

<< >>箇所は書き換えられた形態素に関する情報を示す。なお、上記の例では、他の処理部で使用される機会のない情報は「ｄｕｍｍｙ」としているが、正しい情報を付与してもよい。なお、（２）形態素の読みは、文字種変換部１３ｂにおけるひらがな化で使用するが、「び＿ました」が既にひらがなであるため、「ｄｕｍｍｙ」としても問題ない。また、本実施形態では、機能表現の品詞を使う処理がないため、「ました」の品詞は「ｄｕｍｍｙ」としても問題ない。

書き換え処理部１３の各処理部１３ａ〜１３ｌの書き換え処理を任意に組み合わせることで、「私は寒がりなので、暖かい服装を選んだ。」という入力文２３について、例えば、「（Ｉ）<<オレ>>は寒がり<<だ。だから>>、暖<<けぇ>>服装を選んだ<<ぜ！>>」や、「（ＩＩ）<<あ、あたしは、さむ>>がりなの。だ、だから、あたたかいふくそう>>を<<、えらんだの>>」のように個性豊かな書き換えが可能となる。複数の処理部１３ａ〜１３ｌの書き換え処理を適用した場合には、最終的な処理部の出力を、書き換え文３２として出力する。なお、（Ｉ）の例は、（ｈ）人称代名詞、（ｃ）分かち書き、（ｆ）活用形、及び（ｅ）述部機能表現・キャラ語尾の項目についての書き換え処理を組み合わせた例である。また、（ＩＩ）の例は、（ｂ）文字種、（ｇ）言いよどみ、（ｈ）人称代名詞、（ｃ）分かち書き、及び（ｅ）述部機能表現・キャラ語尾の項目についての書き換え処理を組み合わせた例である。

なお、本実施形態では、複数の書き換え処理を適用する場合、例えば、以下の点を考慮して、適用する書き換え処理の順番を定めておくことができる。
・（ｄ）文構造の変換は、その他１１種の書き換え処理よりも先に適用するのが良い。
・（ｇ）言いよどみへの変換、及び（ｂ）文字種の変換は、（ｄ）文構造、（ｉ）方言・特殊語彙、（ａ）文体、（ｅ）述部機能表現・キャラ語尾、及び（ｈ）人称代名詞よりも後に適用するのが良い。ここで、（ｇ）言いよどみへの変換と（ｂ）文字種の変換の適用順序はどちらが先でも構わない。
・（ｉ）方言・特殊語彙の置換は、（ｄ）文構造より後、かつ、（ａ）文体、（ｅ）述部機能表現・キャラ語尾の変換よりも先に適用するのが良い。
本実施形態では、上記３点を踏まえ、（ｄ）文構造、（ｉ）方言・特殊語彙置換、（ａ）文体、（ｅ）述部機能表現・キャラ語尾、（ｈ）人称代名詞、（ｂ）文字種、（ｆ）活用形、（ｇ）言いよどみ、（ｊ）音素置換、（ｃ）分かち書き、（ｋ）弁別的無意味表現、（ｌ）記号類の順で書き換え処理を適用するものとする。

なお、図３〜図１１に示した各リスト又は各ルール内の＊は、任意の文字列を表す。また、図３〜図１１に示した各リスト又は各ルール内の「例」又は「備考」は、各リスト又は各ルールの説明を補助する適用例等であり、各リスト又は各ルールの項目として定めておく必要はない。

＜言語表現書き換え装置の作用＞
次に、本実施形態に係る言語表現書き換え装置１０の作用について説明する。目的のキャラクタに応じた言語表現の書き換えに関する設定値が記載された設定ファイル２１、及びキャラクタに応じた言語表現への書き換えの対象となる入力文２３が言語表現書き換え装置１０に入力されると、言語表現書き換え処理装置１０において、図１２に示す言語表現書き換え処理ルーチンが実行される。

ステップＳ１１で、設定部１１が、設定ファイル２１を読み込み、読み込んだ設定ファイル２１に記載された各項目についての設定値を、設定値ＤＢ２２に記憶する。

次に、ステップＳ１２で、基本解析部１２が、入力された入力文２３を読み込み、読み込んだ入力文２３を解析し、形態素境界、各形態素の読み、各形態素の品詞、活用語の活用型・活用形、文節境界、文節主辞、及び機能表現の意味ラベルの情報を取得する。基本解析部１２は、取得した情報を、基本解析結果として、書き換え処理部１３へ出力する。

次に、ステップＳ１３で、上記で詳述したように、書き換え処理部１３の各処理部１３ａ〜１３ｌで、入力文２３（基本解析結果）に対する書き換え処理を行う。次に、ステップＳ１４で、書き換え処理部１３が、上記ステップＳ１３の書き換え処理の結果である書き換え文３２を出力して、言語表現書き換え処理ルーチンは終了する。

以上説明したように、本実施形態に係る言語表現書き換え処理装置によれば、（ａ）文体、（ｂ）文字種、（ｃ）分かち書き、（ｄ）文構造、（ｅ）述部機能表現・キャラ語尾、（ｆ）活用形、（ｇ）言いよどみ、（ｈ）人称代名詞、（ｉ）方言・特殊語彙、（ｊ）音素置換、（ｋ）弁別的無意味表現、及び（ｌ）記号類の１２種類の書き換え項目を任意に組み合わせた書き換え処理を実施する。このため、文末表現だけでなく、多様な言語表現の書き換えを任意に組み合わせて実施することができ、多様なバリエーションの言語表現への書き換えを実現することができる。

また、書き換えの対象を文末表現に限定していないため、非特許文献１の手法では実現が難しかった、テレビアニメや漫画の登場人物のような個性の強いキャラクタらしい言語表現への変換が可能となる。

例えば、入力文が「私は寒がりなので、暖かい服装を選んだ。」という文の場合、文末表現の変換のみを行う従来技術では、例えば「私は寒がりなので、暖かい服装を選んだぜ！」のようになる。一方、本実施形態のように、多様な言語表現の書き換えを任意に組み合わせて実施することで、例えば、上述したような「（Ｉ）オレは寒がりだ。だから、暖けぇ服装を選んだぜ！」や、「（ＩＩ）あ、あたしは、さむがりなの。だ、だから、あたたかいふくそうを、えらんだの」のように多様で、個性豊かな書き換えが可能となる。

人と対話をするシステム（対話システム）に本実施形態を適用した場合には、システムを運営する者（システムのキャラクタをデザインする者）は、キャラクタ別の設定ファイルと数種の表現リスト及び変換ルールとを用意するだけで、多様なキャラクタらしさを持つ発話を簡単に作成することができ、対話システムのキャラクタを増やす際にかかるコストを大幅に削減することができる。

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

例えば、書き換え処理部１３の各処理部１３ａ〜１３ｌでの書き換え処理の方法は、上述した方法に限定されず、他の方法を適用してもよい。また、書き換え項目は、上記の（ａ）〜（ｌ）に限定されず、キャラクタに応じた発話において、そのキャラクタの特徴が表れる言語的特徴に関する書き換え項目であればよい。

また、上記実施形態では、複数の書き換え処理を組み合わせて適用する場合に、予め定めた順番で適用する場合について説明したが、適用される書き換え処理の順番を指定することにより、適用順を変更可能してもよい。この場合、設定ファイルに書き換え処理の順番を指定する情報も記載しておき、この情報に基づいて、各処理部を機能させるようにすればよい。例えば、「野原の花」という入力文２３に対して、図１１に示すキャラＡのキャラクタ別音素置換ルール３１を適用する（ｊ）音素置換と、ひらがな化の（ｂ）文字種とを適用する場合を考える。（ｊ）音素置換→（ｂ）文字種の順で書き換え処理を適用した場合には、「のはらにょはな」と書き換えられる。一方、（ｂ）文字種→（ｊ）音素置換の順で書き換え処理を適用した場合には、「にょはらにょはにゃ」と書き換えられる。このように、書き換え処理の順番を変えることによっても、キャラクタの個性の強さが異なるような、多様なバリエーションを表現することができる。

また、（ｂ）文字種、（ｃ）分かち書き、及び（ｌ）記号類は、出力される書き換え文３２がテキストデータの場合に効果を発揮する書き換え項目である。つまり、最終出力が音声合成による読み上げである対話システム等の発話に適用する場合には、キャラクタ性付与効果を発揮しない。したがって、書き換え文３２の出力が音声合成による読み上げのみの場合には、文字種変換部１３ｂ、分かち書き変換部１３ｃ、及び記号類挿入部１３ｌは、書き換え処理部１３の構成から省略してもよい。又は、書き換え文３２の出力形態に応じて、（ｂ）文字種、（ｃ）分かち書き、及び（ｌ）記号類の書き換え項目の設定値を変更するようにしてもよい。例えば、書き換え文３２の出力が音声合成による読み上げのみの場合であって、設定ファイルに、（ｂ）文字種、（ｃ）分かち書き、及び（ｌ）記号類の書き換え処理を適用することを示す設定値が記載されていた場合には、設定値ＤＢ２２に設定値を記憶する際に、書き換え処理を適用しないことを示す設定値に変更した上で記憶するようにする。

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。

１０言語表現書き換え装置
１１設定部
１２基本解析部
１３書き換え処理部
１３ａ文体変換部
１３ｂ文字種変換部
１３ｃ分かち書き変換部
１３ｄ文構造変換部
１３ｅ述部機能表現・キャラ語尾変換部
１３ｆ活用形変換部
１３ｇ言いよどみ変換部
１３ｈ人称代名詞置換部
１３ｉ方言・特殊語彙置換部
１３ｊ音素置換部
１３ｋ弁別的無意味表現挿入部
１３ｌ記号類挿入部
２１設定ファイル
２２設定値データベース
２３入力文
２４文体別機能表現リスト
２５活用表
２６キャラクタ別接続表現リスト
２７キャラクタ別機能表現リスト
２８崩れ活用ルール
２９キャラクタ別人称代名詞リスト
３０キャラクタ別語彙置換ルール
３１キャラクタ別音素置換ルール
３２書き換え文

Claims

文体、述部機能表現、及び人称代名詞を含み、かつキャラクタに応じた特徴が表れる複数種類の言語的特徴の各々について、該言語的特徴に基づく言語表現の書き換えに関する設定値を設定する設定部と、
前記設定部により設定された設定値に基づいて、入力文の末尾の文節に含まれる機能表現を対象として文体の種類を変換する処理、入力文の末尾の文節に含まれる機能表現を対象として述部機能表現をキャラクタに応じて変換する処理、及び人称代名詞である形態素をキャラクタに応じた人称代名詞に変換する処理を含む複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を前記入力文に適用する書き換え処理部と、
を含む言語表現書き換え装置。
前記設定部は、文構造、活用形、言いよどみ、方言又は特殊語彙、特定の音素、及びキャラクタを弁別可能だが意味を持たない弁別的無意味表現をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、
前記書き換え処理部は、前記設定部により設定された設定値に基づいて、複文の入力文を単文に分割すると共に、キャラクタに応じた接続表現を分割箇所に挿入することで文構造を変換する処理、活用形を変換する処理、言いよどみの表現に変換する処理、特定の語彙を方言又は特殊語彙へ変換する処理、特定の音素をキャラクタに応じた音素に変換する処理、及びキャラクタに応じた弁別的無意味表現を挿入する処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用する
請求項１記載の言語表現書き換え装置。
前記設定部は、文字種、分かち書き、及び記号類をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、
前記書き換え処理部は、前記設定部により設定された設定値に基づいて、前記文字種を変換する処理、分かち書きに変換する処理、及び記号類を挿入する処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用する
請求項１又は請求項２記載の言語表現書き換え装置。
文体、述部機能表現、及び人称代名詞を含み、かつキャラクタに応じた特徴が表れる複数種類の言語的特徴の各々について、該言語的特徴に基づく言語表現の書き換えに関する設定値を設定する設定部と、
前記設定部により設定された設定値に基づいて、文体の種類を変換する処理、述部機能表現をキャラクタに応じて変換する処理、及び人称代名詞である形態素をキャラクタに応じた人称代名詞に変換する処理を含む複数種類の言語的特徴に基づく言語表現の書き換え処理を入力文に適用する書き換え処理部と、
を含む言語表現書き換え装置。
前記設定部は、文構造、活用形、言いよどみ、方言又は特殊語彙、特定の音素、及びキャラクタを弁別可能だが意味を持たない弁別的無意味表現をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、
前記書き換え処理部は、前記設定部により設定された設定値に基づいて、文構造を変換する処理、活用形を変換する処理、言いよどみの表現に変換する処理、特定の語彙を方言又は特殊語彙へ変換する処理、特定の音素をキャラクタに応じた音素に変換する処理、及びキャラクタに応じた弁別的無意味表現を挿入する処理のうち、少なくとも１種類以上の処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理を入力文に適用する
請求項４記載の言語表現書き換え装置。
前記設定部は、文字種、分かち書き、及び記号類をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、
前記書き換え処理部は、前記設定部により設定された設定値に基づいて、前記文字種を変換する処理、分かち書きに変換する処理、及び記号類を挿入する処理のうち、少なくとも１種類以上の処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理を入力文に適用する
請求項４又は請求項５記載の言語表現書き換え装置。
設定部、及び書き換え処理部を含む言語表現書き換え装置における言語表現書き換え方法であって、
前記設定部が、文体、述部機能表現、及び人称代名詞を含み、かつキャラクタに応じた特徴が表れる複数種類の言語的特徴の各々について、該言語的特徴に基づく言語表現の書き換えに関する設定値を設定し、
前記書き換え処理部が、前記設定部により設定された設定値に基づいて、入力文の末尾の文節に含まれる機能表現を対象として文体の種類を変換する処理、入力文の末尾の文節に含まれる機能表現を対象として述部機能表現をキャラクタに応じて変換する処理、及び人称代名詞である形態素をキャラクタに応じた人称代名詞に変換する処理を含む複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用する
言語表現書き換え方法。
前記設定部は、文構造、活用形、言いよどみ、方言又は特殊語彙、特定の音素、及びキャラクタを弁別可能だが意味を持たない弁別的無意味表現をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、
前記書き換え処理部は、前記設定部により設定された設定値に基づいて、複文の入力文を単文に分割すると共に、キャラクタに応じた接続表現を分割箇所に挿入することで文構造を変換する処理、活用形を変換する処理、言いよどみの表現に変換する処理、特定の語彙を方言又は特殊語彙へ変換する処理、特定の音素をキャラクタに応じた音素に変換する処理、及びキャラクタに応じた弁別的無意味表現を挿入する処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用する
請求項７記載の言語表現書き換え方法。
前記設定部は、文字種、分かち書き、及び記号類をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、
前記書き換え処理部は、前記設定部により設定された設定値に基づいて、前記文字種を変換する処理、分かち書きを変換する処理、及び記号類を挿入する処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理のうち、少なくとも１種類以上の書き換え処理を入力文に適用する
請求項７又は請求項８記載の言語表現書き換え方法。
設定部、及び書き換え処理部を含む言語表現書き換え装置における言語表現書き換え方法であって、
前記設定部が、文体、述部機能表現、及び人称代名詞を含み、かつキャラクタに応じた特徴が表れる複数種類の言語的特徴の各々について、該言語的特徴に基づく言語表現の書き換えに関する設定値を設定し、
前記書き換え処理部が、前記設定部により設定された設定値に基づいて、文体の種類を変換する処理、述部機能表現をキャラクタに応じて変換する処理、及び人称代名詞である形態素をキャラクタに応じた人称代名詞に変換する処理を含む複数種類の言語的特徴に基づく言語表現の書き換え処理を入力文に適用する
言語表現書き換え方法。
前記設定部は、文構造、活用形、言いよどみ、方言又は特殊語彙、特定の音素、及びキャラクタを弁別可能だが意味を持たない弁別的無意味表現をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、
前記書き換え処理部は、前記設定部により設定された設定値に基づいて、文構造を変換する処理、活用形を変換する処理、言いよどみの表現に変換する処理、特定の語彙を方言又は特殊語彙へ変換する処理、特定の音素をキャラクタに応じた音素に変換する処理、及びキャラクタに応じた弁別的無意味表現を挿入する処理のうち、少なくとも１種類以上の処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理を入力文に適用する
請求項１０記載の言語表現書き換え方法。
前記設定部は、文字種、分かち書き、及び記号類をさらに含む前記複数種類の言語的特徴の各々について、前記設定値を設定し、
前記書き換え処理部は、前記設定部により設定された設定値に基づいて、前記文字種を変換する処理、分かち書きを変換する処理、及び記号類を挿入する処理のうち、少なくとも１種類以上の書き換え処理をさらに含む前記複数種類の言語的特徴に基づく言語表現の書き換え処理を入力文に適用する
請求項１０又は請求項１１記載の言語表現書き換え方法。
コンピュータを、請求項１〜請求項６の何れか１項記載の言語表現書き換え装置の各部として機能させるための言語表現書き換えプログラム。