JP2017068879A - Style conversion device, method, and program - Google Patents

Style conversion device, method, and program Download PDF

Info

Publication number
JP2017068879A
JP2017068879A JP2017009078A JP2017009078A JP2017068879A JP 2017068879 A JP2017068879 A JP 2017068879A JP 2017009078 A JP2017009078 A JP 2017009078A JP 2017009078 A JP2017009078 A JP 2017009078A JP 2017068879 A JP2017068879 A JP 2017068879A
Authority
JP
Japan
Prior art keywords
morpheme
ending
rule
expression
processing target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017009078A
Other languages
Japanese (ja)
Other versions
JP6472466B2 (en
Inventor
千明 宮崎
Chiaki Miyazaki
千明 宮崎
徹 平野
Toru Hirano
徹 平野
竜一郎 東中
Ryuichiro Higashinaka
竜一郎 東中
俊朗 牧野
Toshiaki Makino
俊朗 牧野
義博 松尾
Yoshihiro Matsuo
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017009078A priority Critical patent/JP6472466B2/en
Publication of JP2017068879A publication Critical patent/JP2017068879A/en
Application granted granted Critical
Publication of JP6472466B2 publication Critical patent/JP6472466B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To highly accurately convert polite forms into casual forms.SOLUTION: An input unit 10 accepts an input sentence. A form replacement unit 26 converts polite forms included in the input sentence into casual forms on the basis of predetermined rules for converting a processing object morpheme being a polite form into a casual form according to at least one of parts of speech or conjugated forms of a morpheme appearing one or two before the processing object morpheme being a polite form, notation of a subsequent morpheme or a subsequent morpheme string subsequently appearing on the processing object morpheme, and the absence of a subsequent morpheme, or the fact whether the subsequent morpheme is a sentence end symbol or not.SELECTED DRAWING: Figure 1

Description

本発明は、文体変換装置、方法、及びプログラムに関する。   The present invention relates to a style conversion device, method, and program.

非特許文献1では、講演音声の書き起こしを対象として、新聞記事から作成された言語モデルを用いた統計的手法によって、文体を「である調」(常体)に統一する手法を説明している。ただし、「である調」(常体)への変換は精度が低い(つまり、変換すべき表現を正しく変換できない事例が多かった)ことが報告されている。さらに、変換できなかった箇所の多くが、動詞の活用形を変化させる必要のある表現であったことが述べられている。   Non-Patent Document 1 describes a method for unifying the style of a sentence into “a key” (normal) by means of a statistical method using a language model created from newspaper articles for the transcription of lecture speech. Yes. However, it has been reported that the conversion to “a key” (normal) has low accuracy (that is, there are many cases where the expression to be converted cannot be converted correctly). Furthermore, it is stated that many of the parts that could not be converted were expressions that needed to change the verb usage.

下岡和也、河原達也、奥乃博、「講演の書き起こしに対する統計的手法を用いた文体の整形」、情報処理学会研究報告自然言語処理研究会報告、2002(44)、p.81-88、2002.Kazuya Shimooka, Tatsuya Kawahara, Hiroshi Okuno, “Shaping the Style Using Statistical Methods for Transcription of Lectures”, Information Processing Society of Japan Report on Natural Language Processing, 2002 (44), p.81-88, 2002.

従来の技術には、前後の形態素によって変化する動詞の活用形を考慮しないために、形態素(列)の置換によって日本語として不適格な文を生成してしまったり、「ます」を含む一部の表現が変換されなかったりするという問題があった。   The conventional technology does not take into account the use of verbs that change depending on the morpheme before and after, so it generates sentences that are ineligible as Japanese by replacing morphemes (columns), and some that include "mas" There was a problem that the expression of was not converted.

本発明は、上記の事情に鑑みてなされたもので、敬体表現を常体表現に精度よく変換することができる文体変換装置、方法、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a stylistic conversion device, method, and program capable of accurately converting a honorific expression into a regular expression.

上記目的を達成するために、本発明の文体変換装置は、入力文を受け付ける入力手段と、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、前記後続形態素が無いこと、又は前記後続形態素が文末記号であるか否かとの少なくとも1つに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換する表現置換手段と、を含んで構成されている。   In order to achieve the above object, the style conversion device of the present invention includes an input unit that receives an input sentence, and a part of speech or a utilization type of a morpheme that appears one or two times before a processing target morpheme that is a sympathetic expression. And the following morpheme or subsequent morpheme string appearing after the processing target morpheme, the absence of the subsequent morpheme, or whether the subsequent morpheme is a sentence ending symbol. An expression replacement means for converting a honorific expression included in the input sentence to a normal expression based on a predetermined rule for converting a processing target morpheme that is a body expression into a normal expression. Has been.

本発明の文体変換方法は、入力手段及び表現置換手段を含む文体変換装置における文体変換方法であって、前記入力手段が、入力文を受け付けるステップと、前記表現置換手段が、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、前記後続形態素が無いこと、又は前記後続形態素が文末記号であるか否かとの少なくとも1つに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するステップと、を含んで構成されている。   The style conversion method of the present invention is a style conversion method in a style conversion apparatus including an input means and an expression replacement means, wherein the input means accepts an input sentence, and the expression replacement means is a honorific expression. Part of speech or inflection type of a morpheme that appears one or two times before a processing target morpheme and a notation of a subsequent morpheme or a subsequent morpheme string that appears following the processing target morpheme, or the absence of the subsequent morpheme, or In accordance with at least one of whether or not the subsequent morpheme is a sentence ending symbol, the input sentence is converted to the input sentence based on a predetermined rule for converting the processing target morpheme that is the honorific expression into a normal expression. And converting the contained honorific expression into a regular expression.

本発明の前記表現置換手段は、前記処理対象形態素より1つ前又は2つ前に出現する形態素の品詞が動詞類であって、前記処理対象形態素と、前記処理対象形態素より1つ前に出現する形態素との間で、「いる」が省略されているか否かに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための前記ルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するようにすることができる。   In the expression replacement means of the present invention, the part of speech of a morpheme that appears one or two times before the processing target morpheme is a verb class, and appears before the processing target morpheme and the processing target morpheme Included in the input sentence based on the rules for converting the processing target morpheme that is a sympathetic expression into a regular expression depending on whether or not “is” is omitted between It is possible to convert the expression of honored body into a regular expression.

本発明の前記表現置換手段は、前記処理対象形態素より1つ前又は2つ前に出現する形態素の品詞が、名詞類、形容詞類、及び動詞類の何れに該当するかに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための前記ルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するようにすることができる。   The expression replacement means according to the present invention is configured so that the part of speech of a morpheme that appears one or two times before the processing target morpheme corresponds to a noun class, an adjective class, or a verb class. Based on the rule for converting a processing target morpheme that is a body expression into a normal expression, the honorific expression included in the input sentence can be converted into a normal expression.

本発明の前記表現置換手段は、「です」、「でし」、「でしょ」、「ます」、「まし」、「ましょ」、又は「ませ」である処理対象形態素を常体表現に変換するための前記ルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するようにすることができる。   The expression replacement means of the present invention converts a processing target morpheme that is “is”, “deshi”, “decho”, “masu”, “masashi”, “maso”, or “no” into a normal expression. On the basis of the rule for the above, it is possible to convert the honorific expression included in the input sentence into a regular expression.

本発明のプログラムは、コンピュータを、本発明の文体変換装置の各手段として機能させるためのプログラムである。   The program of this invention is a program for functioning a computer as each means of the style conversion apparatus of this invention.

以上説明したように、本発明の文体変換装置、方法、及びプログラムによれば、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、後続形態素が無いこと、又は後続形態素が文末記号であるか否かとの少なくとも1つに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、入力文に含まれる敬体表現を常体表現に変換することにより、敬体表現を常体表現に精度よく変換することができる、という効果が得られる。   As described above, according to the stylistic conversion device, method, and program of the present invention, the part-of-speech or inflection type of the morpheme that appears one or two times before the processing target morpheme that is the honorific expression, and the processing A processing target morpheme that is a sympathetic representation, depending on at least one of the following morpheme or subsequent morpheme sequence notation that follows the target morpheme, the absence of the subsequent morpheme, or whether the subsequent morpheme is a sentence ending symbol Based on a predetermined rule for converting to normal expression, by converting the honorific expression contained in the input sentence to the normal expression, it is possible to accurately convert the honorific expression to the normal expression. The effect of being able to be obtained is obtained.

本実施の形態に係る文体変換装置の機能的な構成例を示すブロック図である。It is a block diagram which shows the functional structural example of the style conversion apparatus which concerns on this Embodiment. 動詞活用表の一部分の一例を示すイメージ図である。It is an image figure which shows an example of a part of verb utilization table | surface. 本実施の形態における表現置換処理ルーチンを示すフローチャートである。It is a flowchart which shows the expression substitution process routine in this Embodiment. 本実施の形態における表現置換処理ルーチンを示すフローチャートである。It is a flowchart which shows the expression substitution process routine in this Embodiment. 本実施の形態における表現置換処理ルーチンを示すフローチャートである。It is a flowchart which shows the expression substitution process routine in this Embodiment.

<概要>
まず、本発明の実施の形態の概要について説明する。
<Overview>
First, an outline of an embodiment of the present invention will be described.

本発明の実施の形態で解決する課題は、日本語で書かれた文の中に含まれる敬体(です・ます体)表現を常体(だ・である体)表現に書き換えることである。本発明の実施の形態では、文字列の単純な置換では対処できないような環境に生起する敬体表現であっても、日本語として不適格な文の生成を抑制しつつ、常体表現に変換することを実現する。   The problem to be solved by the embodiment of the present invention is to rewrite a sympathetic expression contained in a sentence written in Japanese into a regular expression. In the embodiment of the present invention, even if the expression is an honorific expression that occurs in an environment that cannot be dealt with by simple substitution of a character string, the expression is converted to a normal expression while suppressing generation of a sentence that is ineligible as Japanese. Realize that.

本発明の実施の形態では、敬体表現を常体表現に置換する際、(A)処理対象形態素の1つ前又は2つ前に出現する形態素の品詞の種別、(B)処理対象形態素の表記、(C)後続形態素又は後続形態素列の表記、(D)テイル省略の有無、という4つの条件に基づく変換ルールを用いることにより、従来研究では扱えなかった、動詞の活用形を変化させる必要がある表現に対しても、日本語として不適格な表現への変換を抑制しながら、「です・ます」表現(「です」「ます」、およびこれらの活用形)を「だ」(または空文字)、および動詞の適切な活用形に変換することを可能とする。   In the embodiment of the present invention, when replacing the honorific expression with the regular expression, (A) the type of part of speech of the morpheme that appears one or two before the processing target morpheme, and (B) the processing target morpheme By using conversion rules based on four conditions: notation, (C) notation of subsequent morpheme or succeeding morpheme string, and (D) presence / absence of tails, it is necessary to change the utilization form of verbs that could not be handled by conventional research Even if there is a certain expression, the expression “is / mass” (“is”, “mas”, and their use forms) is changed to “da” (or an empty string) while suppressing the conversion to an expression that is ineligible as Japanese. ), And can be converted to the proper usage of verbs.

例えば、「富士山はきれいです」「富士山に登ります」という敬体表現で書かれた文を「富士山はきれいだ」「富士山に登る」のような常体表現の文に変換することが可能である。
また、以下の説明における「文」(テキスト)とは日本語で書かれた文をいう。ここで、日本語で書かれた文とは、ブログ・SNS等への書き込み、発話の音声認識結果やテキストチャットなど、文字化された日本語のデータであれば何でも良い。
For example, it is possible to convert sentences written with respectful expressions such as “Mt. Fuji is beautiful” and “I will climb Mt. Fuji” into sentences with a regular expression such as “Mt. Fuji is beautiful” and “Climb Mt. Fuji”. is there.
In the following description, “sentence” (text) refers to a sentence written in Japanese. Here, the sentence written in Japanese may be anything written in Japanese, such as writing to a blog / SNS, speech recognition result of speech, text chat, and the like.

以下、図面を参照して、本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<文体変換装置のシステム構成>
本実施の形態では、日本語で書かれた文を入力文として受け取り、入力された入力文に含まれる「です・ます」表現を、「だ」(または空文字)、及び動詞類の適切な活用形(活用語尾)に置換する。本実施の形態に係る文体変換装置100は、CPUと、RAMと、後述する文体変換処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成される。このコンピュータは、機能的には、図1に示すように、入力部10と、演算部20と、出力部30とを含んだ構成で表すことができる。以下、各部について詳述する。
<System configuration of style conversion device>
In the present embodiment, a sentence written in Japanese is received as an input sentence, and the expression “is / mas” included in the input sentence is appropriately used as “da” (or empty character) and verbs. Replace with form (utilization ending). Stylistic conversion device 100 according to the present embodiment is configured by a computer including a CPU, a RAM, and a ROM that stores a program for executing a style conversion processing routine described later. As shown in FIG. 1, this computer can be functionally represented by a configuration including an input unit 10, a calculation unit 20, and an output unit 30. Hereinafter, each part is explained in full detail.

入力部10は、文体変換対象の文を入力文として受け付ける。   The input unit 10 receives a sentence to be converted to a sentence style as an input sentence.

演算部20は、入力部10によって受け付けた入力文に含まれる敬体表現を常体表現に変換する。演算部20は、形態素解析部22と、動詞活用表データベース24と、表現置換部26とを備えている。   The computing unit 20 converts the honorific expression included in the input sentence received by the input unit 10 into a regular expression. The calculation unit 20 includes a morpheme analysis unit 22, a verb utilization table database 24, and an expression replacement unit 26.

形態素解析部22は、入力部10によって受け付けた入力文に対し、形態素解析を行う。具体的には、形態素解析部22は、入力文に対して形態素解析を行い、形態素境界、品詞、及び動詞類の活用型を取得する。   The morpheme analysis unit 22 performs morpheme analysis on the input sentence received by the input unit 10. Specifically, the morpheme analysis unit 22 performs morpheme analysis on the input sentence, and acquires a morpheme boundary, a part of speech, and a utilization type of verbs.

例えば、「富士山に登ります」を入力文として受け付けた場合、形態素解析部22は入力文に対し形態素解析を行い、形態素境界「富士山/に/登り/ます」と、各形態素の品詞及び動詞類の活用型「名詞/助詞/動詞:ラ行五段/助動詞」とを、形態素解析結果として取得する。
ここで、形態素解析部22で用いる形態素解析器は、形態素境界、品詞、及び動詞類の活用型を取得できさえすれば、どのようなものを使用しても良い。
For example, when “I climb Mt. Fuji” is accepted as an input sentence, the morphological analysis unit 22 performs morphological analysis on the input sentence, and the morpheme boundary “Mt. Fuji / ni / climb / mass” indicates the part of speech and verb class of each morpheme. The utilization type “noun / particle / verb: La line five steps / auxiliary verb” is acquired as a morphological analysis result.
Here, any morpheme analyzer used in the morpheme analyzer 22 may be used as long as the morpheme boundary, the part of speech, and the verb type can be acquired.

動詞活用表データベース24には、動詞活用表が格納されている。図2に、動詞活用表の一部分の例を示す。図2には、動詞活用表の一部分の例として、動詞「見る」の活用型である一段活用の活用語尾リストと、動詞「書く」の活用型であるカ行五段活用の活用語尾リストと、動詞「登る」の活用型であるラ行五段活用の活用語尾リストとを示す。図2に示されるように、動詞活用表は、動詞類の活用型毎の活用語尾リストを備えている。ここで、動詞類とは、後述するように、動詞、動詞型の活用をする助動詞、又は補助動詞を表す。また、活用語尾リストには、動詞類の活用形(未然形(ア段)、未然形(オ段)、連用形、連用形(音便形)、終止形、及び命令形)に対応する活用語尾が格納されている。   The verb utilization table database 24 stores a verb utilization table. FIG. 2 shows an example of a part of the verb utilization table. As an example of a part of the verb utilization table, FIG. 2 shows a one-stage utilization ending list that is a utilization type of the verb “see”, and a utilization ending list that is a utilization form of the verb “writing”. , And a list of utilization endings of the five-stage use of the La row, which is a utilization type of the verb “climb”. As shown in FIG. 2, the verb utilization table includes a utilization ending list for each utilization type of verbs. Here, the verb class represents a verb, an auxiliary verb utilizing a verb type, or an auxiliary verb, as will be described later. In addition, the usage endings corresponding to the usage forms of verbs (former form (A-dan), form (O-dan), continuous form, continuous use form (sound form), end form, and command form)) are used in the inflection list. Stored.

ここで、未然形(ア段)とは母音がaである未然形を指す。これは、「ない」等の形態素に接続する形であり、一例として、「登らない」が挙げられる。未然形(オ段)とは、母音がoである未然形を指す。これは、「う」等の形態素に接続する形であり、一例として、「登ろう」が挙げられる。
また、連用形(音便形)とは、イ音便、促音便、又は撥音便化した連用形を指す。これは、「て(で)」や「た(だ)」に接続する形であり、一例として「登って」が挙げられる。
Here, the green shape (stage A) refers to a green shape whose vowel is a. This is a form connected to a morpheme such as “no”, and one example is “do not climb”. The green form (o stage) refers to a green form whose vowel is o. This is a form connected to a morpheme such as “U”, and “Let ’s climb” is an example.
In addition, the continuous form (sound form) refers to a continuous form that has been turned into a sound stool, a sound stool or a sound-repellent stool. This is a form of connection to “te (de)” and “ta (da)”, and one example is “climb”.

例えば、上記図2に示されるように、動詞類の活用型が「ラ行五段活用」の場合、対応する活用語尾リストには、「ら」、「ろ」、「り」、「っ」、「る」、「れ」が活用語尾として格納されている。   For example, as shown in FIG. 2 above, when the verb usage type is “La line 5 stage usage”, the corresponding usage ending list includes “ra”, “ro”, “ri”, “tsu”. , “RU”, and “RE” are stored as utilization endings.

表現置換部26は、形態素解析部22で得られた形態素解析結果に基づいて、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、後続形態素が無いこと、又は後続形態素が文末記号であるか否かとの少なくとも1つに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められた複数のルールを用いて、入力文に含まれる敬体表現を常体表現に変換する。
なお、処理対象形態素とは、後述するように入力文に含まれる「です・ます」表現に対応する形態素を示す。
Based on the morpheme analysis result obtained by the morpheme analyzer 22, the expression replacement unit 26 processes the part-of-speech or inflection type of the morpheme that appears one or two times before the processing target morpheme that is the honored expression. A processing target morpheme that is a sympathetic representation, depending on at least one of the following morpheme or subsequent morpheme sequence notation that follows the target morpheme, the absence of the subsequent morpheme, or whether the subsequent morpheme is a sentence ending symbol Using a plurality of predetermined rules for converting the symbol to the normal expression, the honorific expression included in the input sentence is converted to the normal expression.
The processing target morpheme indicates a morpheme corresponding to the expression “is / mass” included in the input sentence as described later.

具体的には、表現置換部26は、形態素解析部22で取得された形態素の表記、品詞、及び動詞類の活用型に基づいて、(A)処理対象形態素より1つ前又は2つ前に出現する形態素の品詞の種別、(B)処理対象形態素の表記、(C)後続形態素又は後続形態素列の表記、(D)テイル省略の有無という4つの条件に応じて定められた複数のルールを用いて、入力文に含まれる「です・ます」表現に対する置換処理を行う。表現置換部26は、活用語尾取得処理、及び14種類のルールを用いた置換処理を含んで構成される。   Specifically, the expression replacement unit 26 (A) is one or two before the processing target morpheme, based on the morpheme notation, part of speech, and verb utilization type acquired by the morpheme analysis unit 22. Types of part of speech of morphemes that appear, (B) notation of processing morphemes, (C) notation of subsequent morphemes or subsequent morpheme strings, and (D) whether or not tails are omitted. To perform the replacement process for the “is-mas” expression contained in the input sentence. The expression replacement unit 26 includes a utilization ending acquisition process and a replacement process using 14 types of rules.

(A)1つ前又は2つ前に出現する形態素の品詞の種別、(C)後続形態素又は後続形態素列の表記、(D)テイル省略の有無は、(B)処理対象形態素である「です・ます」表現を検出したのちに、当該処理対象形態素を起点として、前後に現れる形態素を調べることによって把握される。(A)1つ前又は2つ前に出現する形態素の品詞の種別、(B)処理対象形態素の表記、(C)後続形態素又は後続形態素列の表記、及び(D)テイル省略の有無について以下説明する。   (A) Type of part of speech of morpheme that appears one or two before, (C) Notation of succeeding morpheme or succeeding morpheme string, (D) Presence or absence of tail omission is (B) Processing target morpheme After the “mass” expression is detected, it is grasped by examining the morphemes that appear before and after the morpheme to be processed. (A) Type of part of speech of morpheme that appears one or two before, (B) notation of processing target morpheme, (C) notation of subsequent morpheme or subsequent morpheme string, and (D) presence or absence of tail omission explain.

(A)1つ前又は2つ前に出現する形態素の品詞の種別
処理対象形態素(「です・ます」表現)より1つ前に出現する形態素の品詞の種別を参照する。処理対象形態素より1つ前に出現する形態素が接続助詞「て」又は「で」である場合は、処理対象形態素より2つ前に出現する形態素(「て」又は「で」の一つ前の形態素))の品詞の種別を参照する。本実施の形態では、1つ前に出現する形態素の品詞の種別を、下記(ア)〜(ウ)の3種の分類とする。また、動詞類は、活用型(カ行五段活用、一段活用等)によってさらに細分化される。なお、本実施の形態では、処理対象形態素より1つ前又は2つ前に出現する形態素の品詞及び活用型を用いる場合を例に説明する。
(A) Type of part of speech of morpheme that appears one or two times before The reference is made to the type of part of speech of the morpheme that appears one time before the morpheme to be processed ("is / mas" expression). When the morpheme that appears immediately before the processing target morpheme is the connection particle “te” or “de”, the morpheme that appears two times before the processing target morpheme (the one immediately before “te” or “de”) Refer to the type of part of speech of morpheme)). In the present embodiment, the type of part-of-speech of the morpheme that appears immediately before is classified into the following three types (a) to (c). In addition, verbs are further subdivided according to utilization types (such as five-stage utilization and one-stage utilization). In the present embodiment, a case will be described as an example in which the part-of-speech and utilization type of a morpheme that appears one or two before the processing target morpheme is used.

(ア)名詞類
名詞類として、名詞(代名詞、形式名詞、固有表現(人名、地名、日付表現、時間表現等)を含む)と、形容動詞とが含まれる。
(A) Nouns As nouns, nouns (including pronouns, formal nouns, proper expressions (including person names, place names, date expressions, time expressions, etc.)) and adjective verbs are included.

(イ)形容詞類
形容詞類として、形容詞と形容詞型の活用をする助動詞(例えば、「ない」「たい」等)とが含まれる。
(A) Adjectives Examples of adjectives include adjectives and auxiliary verbs (for example, “no”, “tai”, etc.) that make use of adjective forms.

(ウ)動詞類
動詞類として、動詞と、動詞型の活用をする助動詞(例えば、「られる」「させる」等)と、補助動詞(例えば、「いる」「ある」等)とが含まれる。
(C) Verbs As verbs, verbs, auxiliary verbs that make use of the verb type (for example, “being” or “to be”), and auxiliary verbs (for example, “being” or “being”) are included.

従って、表現置換部26は、1つ前又は2つ前に出現する形態素の品詞の種別が、名詞類、形容詞類、及び動詞類の何れに該当するかに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められた複数のルールに基づいて、入力文に含まれる敬体表現を常体表現に変換する。   Therefore, the expression replacement unit 26 is a process that is a sympathetic expression depending on whether the type of part of speech of the morpheme that appears one or two before corresponds to a noun class, an adjective class, or a verb class. Based on a plurality of predetermined rules for converting the target morpheme into the normal expression, the honorary expression included in the input sentence is converted into the normal expression.

(B)処理対象形態素の表記
処理対象形態素は、「です・ます」表現の表記が「です」、「でし」、「でしょ」、「ます」、「まし」、「ましょ」、「ませ」のいずれであるかを指すものとする。
なお、本実施の形態では、処理対象形態素の検出(「です」及び「ます」の活用形の検出)は、形態素解析結果の一部として出力される形態素の「基本形」に基づいて行うが、形態素または形態素列の表記に対する文字列の照合によって「です」及び「ます」の活用形を検出しても良い。
従って、表現置換部26は、「です」、「でし」、「でしょ」、「ます」、「まし」、「ましょ」、又は「ませ」である処理対象形態素を常体表現に変換するための予め定められた複数のルールに基づいて、入力文に含まれる敬体表現を常体表現に変換する。
(B) Notation of processing target morpheme The processing target morpheme is expressed as “is”, “deshi”, “decho”, “masu”, “masashi”, “maso”, “no”. It shall be pointed out either.
In this embodiment, the detection of the morpheme to be processed (detection of the utilization form of “is” and “mas”) is performed based on the “basic form” of the morpheme output as part of the morpheme analysis result. The utilization form of “is” and “masu” may be detected by matching character strings against morpheme or morpheme string notation.
Accordingly, the expression replacement unit 26 converts the processing target morpheme that is “is”, “deshi”, “decho”, “masu”, “masashi”, “maso”, or “no” into a normal expression. Based on a plurality of predetermined rules, the honorific expression included in the input sentence is converted into a regular expression.

(C)後続形態素又は後続形態素列の表記
後続形態素は、処理対象形態素に後続して出現する形態素を表す。後続形態素列は、処理対象形態素に後続して出現する形態素列を表す。本実施の形態では、後続形態素の表記は、「た」(完了の助動詞)、「て」(接続助詞)、「の*」(表記の先頭文字が「の」である形態素)、「ん」、又は疑問の終助詞(「か」「かしら」「かな」)の何れかであるものとする。また、後続形態素列の表記は、「ん」に「でした」を加えた「ん/でした」であるものとする。
また、本実施の形態では、後続形態素が無い(文の終端)場合、又は後続形態素が文末記号である場合に応じて、入力文に含まれる敬体表現を常体表現に変換する。
従って、表現置換部26は、後続形態素若しくは後続形態素列の表記、後続形態素が無いこと、又は後続形態素が文末記号であるか否かに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められた複数のルールに基づいて、入力文に含まれる敬体表現を常体表現に変換する。
(C) Notation of subsequent morpheme or subsequent morpheme string The subsequent morpheme represents a morpheme that appears after the morpheme to be processed. The subsequent morpheme string represents a morpheme string that appears subsequent to the processing target morpheme. In the present embodiment, the subsequent morpheme is represented by “ta” (completion auxiliary verb), “te” (connection particle), “no *” (morpheme whose first character is “no”), “n”. Or a questionable final particle (“ka”, “kashira”, “kana”). Further, the notation of the subsequent morpheme sequence is “n / was” obtained by adding “do” to “n”.
Further, in the present embodiment, the honorific expression included in the input sentence is converted into a regular expression when there is no subsequent morpheme (end of sentence) or when the subsequent morpheme is a sentence end symbol.
Therefore, the expression replacement unit 26 always represents the processing target morpheme that is a honorific expression depending on whether the subsequent morpheme or the subsequent morpheme string is written, there is no subsequent morpheme, or whether the subsequent morpheme is a sentence ending symbol. On the basis of a plurality of predetermined rules for converting to the expression, the honorific expression included in the input sentence is converted into a regular expression.

(D)テイル省略の有無
テイル省略の有無とは、動詞類と「ます」(およびその活用形)との間に「ている」の省略形「てる」が存在しているかどうか、又は「でいる」の省略形「でる」が存在しているかどうかを指すものとする。例えば、処理対象形態素の1つ前に出現する形態素が「て」又は「で」である場合には、テイル省略有りと判定する。処理対象形態素の1つ前に出現する形態素が「て」又は「で」でない場合には、テイル省略無しと判定する。テイル省略がされている一例として、例えば「登ってます」、「嗅いでます」が挙げられる。
表現置換部26は、処理対象形態素より1つ前又は2つ前に出現する形態素の品詞が動詞類であって、処理対象形態素と、処理対象形態素より1つ前に出現する形態素との間で、「いる」が省略されているか否かに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、入力文に含まれる敬体表現を常体表現に変換する。
(D) Presence or absence of tail omission Tail omission is the presence or absence of the abbreviation “teru” between “ver” and “mas” (and its usage), or “ It shall indicate whether or not the abbreviation “de” is present. For example, if the morpheme that appears immediately before the morpheme to be processed is “te” or “de”, it is determined that the tail is omitted. When the morpheme that appears immediately before the morpheme to be processed is not “te” or “de”, it is determined that the tail is not omitted. As an example where the tail is omitted, for example, "I'm climbing" and "I smell".
In the expression replacement unit 26, the part of speech of the morpheme that appears one or two times before the processing target morpheme is a verb class, and between the processing target morpheme and the morpheme that appears one time before the processing target morpheme Depending on whether or not “is” is omitted, based on a predetermined rule for converting a processing target morpheme that is a honorific expression into a regular expression, the honorific expression included in the input sentence is Convert to normal expression.

後述する図3〜図5のフローチャートにおける(A)〜(D)はそれぞれ、(A)処理対象形態素の1つ前又は2つ前に出現する形態素の品詞の種別、(B)処理対象形態素の表記、(C)後続形態素又は後続形態素列の表記、(D)テイル省略の有無、のうちどの条件に相当するかを示す。   (A) to (D) in the flowcharts of FIGS. 3 to 5 to be described later are (A) the type of part of speech of the morpheme that appears one or two before the processing target morpheme, and (B) the processing target morpheme. It shows which condition corresponds to the notation, (C) notation of subsequent morpheme or succeeding morpheme string, and (D) presence or absence of tail omission.

本実施の形態では、表現置換部26は、形態素解析部22で得られた形態素解析結果に基づいて、上述した、(A)〜(D)の4つの条件に応じて定められた複数のルールとして、以下の(1)〜(14)に示すルールを用いて、入力文に含まれる敬体表現を常体表現に変換する。   In the present embodiment, the expression replacement unit 26 is based on the morpheme analysis results obtained by the morpheme analysis unit 22 and has a plurality of rules defined according to the four conditions (A) to (D) described above. As follows, the honorific expression included in the input sentence is converted into the regular expression using the rules shown in the following (1) to (14).

(1)「です」を削除するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が形容詞類であって、かつ処理対象形態素の表記が「です」であるときに、入力文から処理対象形態素「です」を削除する。
例えば、入力文「富士山は美しいです」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/美しい/です)及び品詞(名詞/助詞/形容詞/助動詞)に基づいて、入力文から処理対象形態素「です」を削除し、「です」が削除された文「富士山は美しい」を出力する。
(1) Rule to delete “is” The expression replacement unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the processing target morpheme is an adjective and the processing target morpheme is “is”. Sometimes, delete the target morpheme “is” from the input sentence.
For example, when the input sentence “Mt. Fuji is beautiful” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / ha / beautiful /) obtained by the morpheme analysis unit 22 and the part of speech (noun / particle / particle). Based on the adjective / auxiliary verb), the processing target morpheme “is” is deleted from the input sentence, and the sentence “Mt. Fuji is beautiful” is output.

また、表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「です」であり、かつ処理対象形態素「です」に疑問の終助詞が後続するときに、入力文から処理対象形態素「です」を削除する。
例えば、入力文「富士山は山ですか」が入力された場合には、表現置換部26は、入力文から処理対象形態素「です」を削除し、「です」が削除された文「富士山は山か」を出力する。
ただし、「山か」「美しいか」のように、名詞類又は形容詞類+「か」(+文末記号類(。?!等)または文の終端)という形式は、会話における発話文としては硬い印象を与えてしまうため、「か」に疑問符(「?」)を後続させたり、「か」を疑問符に置換したりしても良い。
In addition, the expression replacement unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a noun, the processing target morpheme is “is”, and the processing target morpheme is “is”. Deletes the target morpheme “is” from the input sentence.
For example, when the input sentence “Is Mount Fuji is a mountain” is input, the expression replacement unit 26 deletes the processing target morpheme “is” from the input sentence, and the sentence “Mt. Fuji is a mountain” is deleted. Is output.
However, the form of nouns or adjectives + "ka" (+ end-of-sentence symbols (.?! Etc.) or end-of-sentence), such as "mountain" or "beautiful", is a hard utterance in conversation. To give an impression, “ka” may be followed by a question mark (“?”), Or “ka” may be replaced with a question mark.

(2)「でしょ」を「だろ」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が形容詞類であって、かつ処理対象形態素の表記が「でしょ」であるときに、処理対象形態素「でしょ」を「だろ」に置換する。
例えば、入力文「富士山はきれいでしょう」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/きれい/でしょ/う)及び品詞(名詞/助詞/形容動詞/助動詞/助動詞)に基づいて、入力文に含まれる処理対象形態素「でしょ」を「だろ」に置換し、「でしょ」が「だろ」に置換された文「富士山はきれいだろう」を出力する。
(2) Rule for Substituting “Doshi” with “Daro” The expression replacement unit 26 has an adjective class for the part of speech of the morpheme that appears immediately before the morpheme to be processed, and the notation of the morpheme to be processed is “ When it is, it replaces the target morpheme “Doshi” with “Daro”.
For example, when the input sentence “Mt. Fuji is beautiful” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / ha / clean / de / u) obtained by the morpheme analysis unit 22 and the part of speech (noun). / Subject / adjective verb / auxiliary verb / auxiliary verb), the sentence “Doshi” to be processed in the input sentence is replaced with “Daro”, and “Doshi” is replaced with “Daro” "Wax" is output.

また、表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「でしょ」であるときに、処理対象形態素「でしょ」を「だろ」に置換する。   In addition, the expression replacement unit 26 performs the processing target morpheme “syo” when the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a noun and the notation of the processing target morpheme is “sho”. "Is replaced with" Daro ".

(3)「でし」を削除し、「て」を「で」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「でし」であり、かつ後続形態素の表記が「て」であるときに、後続形態素「て」を「で」に置換し、処理対象形態素「でし」を削除する。
例えば、入力文「富士山はきれいでして」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/きれい/でし/て)及び品詞(名詞/助詞/形容動詞/助動詞/助詞)に基づいて、後続形態素「て」を「で」に置換し、処理対象形態素「でし」を削除し、「て」が「で」に置換され、「でし」が削除された文「富士山はきれいで」を出力する。
(3) Rule that deletes “deshi” and replaces “te” with “de” The expression replacement unit 26 is a noun class for the part of speech of the morpheme that appears before the morpheme to be processed. And when the notation of the target morpheme is “deshi” and the notation of the subsequent morpheme is “te”, the subsequent morpheme “te” is replaced with “de” and the target morpheme “deshi” is deleted. To do.
For example, when the input sentence “Mt. Fuji is beautiful” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / ha ////) and the part of speech obtained by the morpheme analysis unit 22. Based on (noun / particle / adjective verb / auxiliary verb / particle), the subsequent morpheme “te” is replaced with “de”, the target morpheme “deshi” is deleted, and “te” is replaced with “de”. , The sentence “Mt. Fuji is beautiful” is output with “deshi” removed.

(4)「でし」を「だっ」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「でし」であり、かつ後続形態素の表記が「た」であるときに、処理対象形態素「でし」を「だっ」に置換する。
例えば、入力文「富士山はきれいでした」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/きれい/でし/た)及び品詞(名詞/助詞/形容動詞/助動詞/助動詞)に基づいて、処理対象形態素「でし」を「だっ」に置換し、「でし」が「だっ」に置換された文「富士山はきれいだった」を出力する。
(4) Rules for Substituting “Doshi” with “Da” The expression replacement unit 26 indicates that the type of part-of-speech of the morpheme that appears immediately before the processing target morpheme is a noun, and the processing target morpheme is notated. When it is “deshi” and the notation of the subsequent morpheme is “ta”, the processing target morpheme “deshi” is replaced with “da”.
For example, when the input sentence “Mt. Fuji was beautiful” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / ha // do / do) obtained by the morpheme analysis unit 22 and the part of speech ( Based on nouns / particles / adjective verbs / auxiliary verbs / auxiliary verbs), the sentence “Mt. Fuji was beautiful”, where the target morpheme “Dashi” was replaced with “Da” and “Doshi” was replaced with “Da”. Is output.

(5)「です」を「だ」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「です」であり、かつ後続形態素の表記が「の*」(表記の先頭文字が「の」である形態素)でないときに、処理対象形態素「です」を「だ」に置換する。
例えば、入力文「富士山はきれいです」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/きれい/です)及び品詞(名詞/助詞/形容動詞/助動詞)に基づいて、処理対象形態素「です」を「だ」に置換し、「です」が「だ」に置換された文「富士山はきれいだ」を出力する。
(5) Rule for Substituting “Da” with “Da” The expression replacement unit 26 indicates that the type of part-of-speech of the morpheme that appears immediately before the processing target morpheme is a noun, and the processing target morpheme is represented by “ And the subsequent morpheme notation is not “no *” (the morpheme whose first character is “no”), the processing target morpheme “is” is replaced with “da”.
For example, when the input sentence “Mt. Fuji is beautiful” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / ha / clean /) obtained by the morpheme analysis unit 22 and the part of speech (noun / particle / particle). Based on the adjective verb / auxiliary verb), the processing target morpheme “is” is replaced with “da”, and the sentence “Mt. Fuji is beautiful” in which “da” is replaced with “da” is output.

(6)「です」を「な」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「です」であり、かつ後続形態素の表記が「の*」(表記の先頭文字が「の」である形態素)であるときに、処理対象形態素「です」を「な」に置換する。
例えば、入力文「富士山は火山ですので」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/火山/です/ので)及び品詞(名詞/助詞/名詞/助動詞/助詞)に基づいて、処理対象形態素「です」を「な」に置換し、「です」が「な」に置換された文「富士山は火山なので」を出力する。
(6) Rule for replacing “is” with “na” The expression replacement unit 26 indicates that the type of part-of-speech of the morpheme that appears immediately before the processing target morpheme is a noun, and the processing target morpheme is represented by “ When the notation of the subsequent morpheme is “no *” (the morpheme whose first character is “no”), the processing target morpheme “is” is replaced with “na”.
For example, when the input sentence “Mt. Fuji is a volcano” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / ha / volcano / is / so) obtained by the morpheme analysis unit 22 and the part of speech (noun). Based on / particle / noun / auxiliary verb / particle), the sentence “is” to be processed is replaced with “na”, and the sentence “Mt. Fuji is a volcano” with “na” replaced with “na” is output.

(7)活用語尾を連用形(音便形)に、「た」を「だ」に置換し、「まし」を削除するルール
表現置換部26は、「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用であり、かつ処理対象形態素の表記が「まし」であり、かつ後続形態素の表記が「た」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に変換し、後続形態素「た」を「だ」に置換し、処理対象形態素「まし」を削除する。
なお、表現置換部26は、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の連用形(音便形)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
(7) Rule that replaces the inflection ending with the continuous form (sound form), replaces “ta” with “da”, and deletes “masashi”. The expression replacement unit 26 performs processing when “tail omitted” is “none”. The type of part-of-speech of the morpheme that appears immediately before the target morpheme is a verb class, and the usage type of the verb class is a 5-line utilization, 5-line utilization, 5-line utilization, or 5-line utilization When the morpheme used in the fifth stage is “Masashi” and the subsequent morpheme is “Ta”, the ending of the morpheme that appears immediately before the target morpheme (Sound form), the subsequent morpheme “ta” is replaced with “da”, and the processing target morpheme “masashi” is deleted.
The expression replacement unit 26 reads a utilization ending list corresponding to the utilization type of the verb class from the verb utilization table of the verb utilization table database 24, and uses the continuation form (sound form) of the continuous form in the utilization ending list. Is replaced with a morpheme ending that appears immediately before the processing target morpheme.

例えば、入力文「富士山で叫びました」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/で/叫び/まし/た)と、品詞及び動詞類の活用型(名詞/助詞/動詞:バ行五段/助動詞/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に置換し、後続形態素「た」を「だ」に置換し、処理対象形態素「まし」を削除する。そして、表現置換部26は、活用語尾が連用形(音便形)に置換され、「た」が「だ」に置換され、「まし」が削除された文「富士山で叫んだ」を出力する。   For example, when the input sentence “I screamed at Mt. Fuji” is input, the expression replacement unit 26, the morpheme boundary obtained by the morpheme analysis unit 22 (Mt. Fuji / de / scream / better / ta), the part of speech and the verb Based on the utilization type of a class (noun / particle / verb: ba line 5 dan / auxiliary verb / auxiliary verb), the utilization ending of the morpheme that appears immediately before the morpheme to be processed is replaced with the continuous form (stool form), Subsequent morpheme “ta” is replaced with “da”, and processing target morpheme “masashi” is deleted. Then, the expression replacement unit 26 outputs a sentence “screamed at Mt. Fuji” in which the inflection ending is replaced with the continuous form (sound form), “ta” is replaced with “da”, and “masi” is deleted.

(8)活用語尾を連用形(音便形)に置換し、「まし」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「まし」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に置換し、「まし」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の連用形(音便形)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「まし」であるときに、「まし」を削除する。
(8) A rule that replaces the inflection ending with the continuous form (sound form) and deletes “masashi” The expression replacement unit 26 is one before the morpheme to be processed when “tail omitted” is “none” for the verb class When the type of part of speech of a morpheme that appears in a verb is a verb class and the notation of the processing target morpheme is “better”, the ending of the morpheme that appears immediately before the processing target morpheme is used as a continuous form (sound form ) And delete “Mashi”.
When “tail omission” is “none” for the verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb utilization table database 24 and the consecutive forms in the utilization ending list are read. The utilization ending of (sound form) is acquired and replaced with the utilization ending of the morpheme that appears immediately before the processing target morpheme.
On the other hand, when “tail omitted” is “present”, the expression replacing unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a verb class, and the processing target morpheme has “ ”Is deleted.

例えば、入力文「富士山に登りました」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/まし/た)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞/助動詞)とに基づいて、活用語尾を連用形(音便形)に置換し、処理対象形態素「まし」を削除する。そして、表現置換部26は、活用語尾が連用形(音便形)に置換され、「まし」が削除された文「富士山に登った」を出力する。   For example, when the input sentence “I climbed Mt. Fuji” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / Ni / Climb / Masashi / Ta) obtained by the morpheme analysis unit 22 and the part of speech and Based on the usage type of the verb class (noun / particle / verb: La line five steps / auxiliary verb / auxiliary verb), the usage ending is replaced with the continuous form (sound form), and the processing target morpheme “masashi” is deleted. Then, the expression replacement unit 26 outputs the sentence “Climbed Mt. Fuji” in which the inflection ending is replaced with the continuous form (sound form) and “Mashi” is deleted.

また、表現置換部26は、「テイル省略」が「有」の場合、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用であり、かつ処理対象形態素の表記が「まし」であり、かつ後続形態素の表記が「た」であるときに、処理対象形態素「まし」を削除する。   In addition, when “tail omission” is “present”, the expression replacement unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the morpheme to be processed is a verb class, and the usage type of the verb class is “Gas”. 5 rows of 5 rows, 5 rows of rows, 5 rows of rows, or 5 rows of rows, the morpheme to be processed is “masashi”, and the subsequent morpheme is “ta”. Sometimes, the processing target morpheme “masashi” is deleted.

また、表現置換部26は、「テイル省略」が「有」の場合、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ動詞類の活用型がガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用であり、かつ処理対象形態素の表記が「まし」であり、かつ後続形態素の表記が「て」であるときに、処理対象形態素「まし」を削除する。   In addition, when “tail omission” is “present”, the expression replacement unit 26 uses a verb class for the part of speech of the morpheme that appears immediately before the morpheme to be processed, and the usage type of the verb class When using 5 dan, 5 banks, 5 banks, or 5 banks, and the morpheme to be processed is “Masashi” and the subsequent morpheme is “te” In addition, the processing target morpheme “masashi” is deleted.

(9)活用語尾を連用形(音便形)に、「て」を「で」に置換し、「まし」を削除するルール
表現置換部26は、「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ動詞類の活用型がガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用であり、かつ処理対象形態素の表記が「まし」であり、かつ後続形態素の表記が「て」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に置換し、後続形態素「て」を「で」に置換し、処理対象形態素「まし」を削除する。
なお、表現置換部26は、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の連用形(音便形)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
(9) Rule that replaces the inflection ending with the continuous form (sound form), replaces “te” with “de”, and deletes “masashi”. The expression replacement unit 26 performs processing when “tail omitted” is “none”. The type of part-of-speech of the morpheme that appears immediately before the target morpheme is a verb class, and the usage type of the verb class is a 5-line utilization, 5-line utilization, 5-line utilization, or 5-line utilization If the notation of the target morpheme is “Mashi” and the notation of the subsequent morpheme is “te”, the ending of the morpheme that appears immediately before the target morpheme ), The subsequent morpheme “te” is replaced with “de”, and the processing target morpheme “masashi” is deleted.
The expression replacement unit 26 reads a utilization ending list corresponding to the utilization type of the verb class from the verb utilization table of the verb utilization table database 24, and uses the continuation form (sound form) of the continuous form in the utilization ending list. Is replaced with a morpheme ending that appears immediately before the processing target morpheme.

例えば、入力文「富士山で叫びまして」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/で/叫び/まし/て)と、品詞及び動詞類の活用型(名詞/助詞/動詞:バ行五段/助動詞/助詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に置換し、後続形態素「て」を「で」に置換し、処理対象形態素「まし」を削除する。そして、表現置換部26は、活用語尾が連用形(音便形)に置換され、「て」が「で」に置換され、「まし」が削除された文「富士山で叫んで」を出力する。   For example, when the input sentence “scream at Mt. Fuji” is input, the expression replacement unit 26, the morpheme boundary (Mt. Fuji / de / scream / better / te) obtained by the morpheme analysis unit 22, the part of speech and the verb Based on the utilization type of a class (noun / particle / verb: ba line 5 dan / auxiliary verb / particle), replace the utilization ending of the morpheme that appears immediately before the morpheme to be processed with the continuous form (sound form), Subsequent morpheme “te” is replaced with “de”, and processing target morpheme “masashi” is deleted. Then, the expression replacement unit 26 outputs the sentence “Screaming at Mt. Fuji” in which the inflection ending is replaced with the continuous form (sound form), “te” is replaced with “de”, and “masi” is deleted.

(10)活用語尾を終止形に置換し、「ます」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ます」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を終止形に置換し、処理対象形態素「ます」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の終止形の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ます」であるときに、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の終止形の活用語尾を、「て」又は「で」の後に挿入し、処理対象形態素「ます」を削除する。
(10) Rule that replaces the ending form with the final form and deletes “mas” When the “tail omission” is “none” for the verb class, the expression replacement unit 26 is a morpheme that appears before the morpheme to be processed. When the type of part-of-speech is a verb class and the morpheme of the processing target is "mas", the ending morpheme of the morpheme that appears immediately before the processing target morpheme is replaced with the final form, Delete "mas".
When “tail omitted” is “none” for verbs, the usage ending list corresponding to the usage type of the verbs is read from the verb usage table in the verb usage table database 24, and the end of the usage in the usage ending list. The utilization ending of the shape is acquired and replaced with the utilization ending of the morpheme that appears immediately before the processing target morpheme.
On the other hand, when “tail omitted” is “present”, the expression replacement unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a verb class, and the processing target morpheme is “notified”. ”Is read from the verb usage table in the verb usage table database 24 and the final usage ending in the usage ending list is inserted after“ te ”or“ de ”. Then, the target morpheme “mas” is deleted.

例えば、入力文「富士山に登ります」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/ます)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を終止形に置換し、処理対象形態素「ます」を削除する。そして、表現置換部26は、活用語尾が終止形に置換され、「ます」が削除された文「富士山に登る」を出力する。   For example, when the input sentence “I climb Mt. Fuji” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / Ni / Climb / Make) obtained by the morpheme analysis unit 22 and the part of speech and verb class. Based on the conjugation type (noun / participant / verb: La line 5 dan / auxiliary verb), the morpheme ending in the morpheme that appears immediately before the target morpheme is replaced with the final form, and the target morpheme “mas” is deleted To do. Then, the expression replacing unit 26 outputs the sentence “Climbing Mt. Fuji” in which the ending is replaced with the final form and “mas” is deleted.

(11)活用語尾を未然形(オ段)に置換し、「ましょ」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ましょ」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(オ段)に置換し、「ましょ」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(オ段)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ましょ」であるときに、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(オ段)の活用語尾を、「て」又は「で」の後に挿入し、「ましょ」を削除する。
(11) A rule that replaces the inflection ending with a blank form (o-dan) and deletes “maso” The expression replacement unit 26 is one before the morpheme to be processed when “tail omitted” is “none” for the verb class When the type of part of speech of a morpheme that appears in a verb is a verb class and the notation of the processing target morpheme is “Mashou”, the ending of the morpheme that appears immediately before the processing target morpheme ) And delete “Masho”.
When “tail omission” is “none” for a verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb utilization table database 24, and the occurrence ending list in the utilization ending list is not yet recorded. The utilization ending of the form (o stage) is acquired and replaced with the utilization ending of the morpheme that appears immediately before the morpheme to be processed.
On the other hand, when “tail omitted” is “present”, the expression replacement unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a verb class, and the processing target morpheme is represented by “Mashiyo”. ”Is read from the verb usage table in the verb usage table database 24 and the usage endings of the green form (o-dan) in the usage ending list are read by“ te ”or“ de ” ”Is inserted after and“ Masho ”is deleted.

例えば、入力文「富士山に登りましょう」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/ましょ/う)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(オ段)に置換し、処理対象形態素「ましょ」を削除する。そして、表現置換部26は、活用語尾が未然形(オ段)に置換され、「ましょ」が削除された文「富士山に登ろう」を出力する。   For example, when the input sentence “Let's climb Mt. Fuji” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / Ni / Climb / Masho / U) obtained by the morpheme analysis unit 22 and the part of speech and Based on the verb usage (noun / participant / verb: La line 5dan / auxiliary verb / auxiliary verb), replace the morphological inflection ending in the previous morpheme with the morpheme (odan). The processing target morpheme “Masho” is deleted. Then, the expression replacing unit 26 outputs a sentence “Let's climb Mt. Fuji” in which the ending ending is replaced with a blank form (o-dan) and “Mashou” is deleted.

(12)活用語尾を命令形に置換し、「ませ」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素が無い、又は後続形態素が文末記号類(。?!等)であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を命令形に置換し、処理対象形態素「ませ」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の命令形の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素が無い、又は後続形態素が文末記号類(。?!等)であるときに、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の命令形の活用語尾を、「て」又は「で」の後に挿入し、処理対象形態素「ませ」を削除する。
(12) Rules for replacing the ending utterance with the command form and deleting “no” When the “tail omission” is “none” for the verb class, the expression replacement unit 26 appears before the morpheme to be processed. If the type of part of speech is a verb class and the morpheme to be processed is "No" and there is no subsequent morpheme or the subsequent morpheme is a sentence ending symbol class (.?! Etc.) The ending of the morpheme that appears immediately before the morpheme is replaced with an instruction form, and the processing target morpheme “N” is deleted.
When “tail omitted” is “none” for a verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb utilization table database 24, and the instructions in the utilization ending list are read. The utilization ending of the shape is acquired and replaced with the utilization ending of the morpheme that appears immediately before the processing target morpheme.
On the other hand, when “tail omitted” is “present”, the expression replacement unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a verb class, and the processing target morpheme is not “notified”. ”And there is no subsequent morpheme, or the subsequent morpheme is an end-of-sentence symbol (.?!, Etc.), the utilization ending list of the one-stage utilization is read from the verb utilization table in the verb utilization table database 24, The usage ending of the command form in the usage ending list is inserted after “te” or “de”, and the processing target morpheme “n” is deleted.

例えば、入力文「お帰りなさいませ」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(お/帰り/なさい/ませ)と、品詞及び動詞類の活用型(接頭辞/動詞:ラ行五段/助動詞:ラ行五段/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を命令形に置換し、処理対象形態素「ませ」を削除する。そして、表現置換部26は、活用語尾が命令形に置換され、「ませ」が削除された文「お帰りなさい」を出力する。   For example, when the input sentence “Please return” is input, the expression replacement unit 26 determines the morpheme boundary (O / Return / Please / Ne) obtained by the morpheme analysis unit 22 and the part of speech and verb class. Based on the conjugation type (prefix / verb: La line 5 dan / auxiliary verb: la line 5 dan / auxiliary verb), replace the morphological inflection ending of the morpheme that appears before the morpheme to be processed with the imperative form. Delete the morpheme "Mase". Then, the expression replacement unit 26 outputs the sentence “Please return”, in which the ending is replaced with the command form, and “se” is deleted.

なお、「なさる」「いらっしゃる」「くださる」「おっしゃる」等、ラ行五段活用でありながら、口語体では命令形活用語尾が「い」となるものがある(「なさい」「いらっしゃい」等)。その場合、本実施の形態では「れ」ではなく「い」を用いることとする。   In addition, there are things that use the imperative ending in the colloquial style, such as “Nasaru”, “Isurusuru”, “Suru”, “Osaru”, etc., but in the colloquial style, “I” is used as an imperative inflection. In this case, “i” is used instead of “re” in this embodiment.

(13)活用語尾を未然形(ア段)に、「ん」を「ない」に置換し、「ませ」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素の表記が「ん」であり、かつ後続形態素の後に「でした」が後続しないとき(後続形態素列が「ん/でした」でないとき)に、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(ア段)に置換し、後続形態素「ん」を「ない」に置換し、処理対象形態素「ませ」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(ア段)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素の表記が「ん」であり、かつ後続形態素の後に「でした」が後続しないとき(後続形態素列が「ん/でした」でないとき)に、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(ア段)の活用語尾を「て」又は「で」の後に挿入し、後続形態素「ん」を「ない」に置換し、処理対象形態素「ませ」を削除する。
(13) A rule that replaces the inflection ending with the original form (stage A), replaces “n” with “not”, and deletes “not”. The expression replacement unit 26 sets “tail omitted” to “none” for verbs. The type of part of speech of the morpheme that appears immediately before the processing target morpheme is a verb class, the processing target morpheme is “not”, and the subsequent morpheme is “n”, and When the subsequent morpheme is not followed by “do” (when the subsequent morpheme string is not “n / do”), the morpheme endings that appear immediately before the morpheme to be processed are changed to the previous morpheme. Replace the subsequent morpheme “n” with “not”, and delete the processing target morpheme “n”.
When “tail omission” is “none” for a verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb utilization table database 24, and the occurrence ending list in the utilization ending list is not yet recorded. The utilization ending of the shape (stage) is acquired and replaced with the utilization ending of the morpheme that appears immediately before the processing target morpheme.
On the other hand, when “tail omitted” is “present”, the expression replacement unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a verb class, and the processing target morpheme is not “notified”. , And the subsequent morpheme is “n”, and the subsequent morpheme is not followed by “do” (when the subsequent morpheme string is not “n / do”) The list is read from the verb usage table of the verb usage table database 24, and the usage ending of the green form (A column) in the usage ending list is inserted after “te” or “de”, and the subsequent morpheme “n” is inserted. Replace with “None” and delete the processing target morpheme “N”.

例えば、入力文「富士山に登りません」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/ませ/ん)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(ア段)に置換し、後続形態素「ん」を「ない」に置換し、処理対象形態素「ませ」を削除する。そして、表現置換部26は、活用語尾が未然形(ア段)に置換され、「ん」が「ない」に置換され、「ませ」が削除された文「富士山に登らない」を出力する。   For example, when the input sentence “I do not climb Mt. Fuji” is input, the expression replacement unit 26 uses the morpheme boundary (Mt. Fuji / Ni / Climb / Ne / Nen) obtained by the morpheme analysis unit 22 and the part of speech and Based on the verb type (noun / participant / verb: La line five steps / auxiliary verb / auxiliary verb), replace the morphological inflection ending of the morpheme that appears immediately before the morpheme to be processed with the blank form (A step). The subsequent morpheme “n” is replaced with “not”, and the processing target morpheme “don” is deleted. Then, the expression replacement unit 26 outputs the sentence “Don't climb Mt. Fuji” in which the inflection ending is replaced with a blank form (A-stage), “N” is replaced with “None”, and “N” is deleted.

なお、後続形態素「ん」を「ない」に置換する処理を行わなかったとしても、日本語として文法上の問題は生じない(例:富士山に登らん)。ただし、現代の標準語(東京方言)の口語としては不自然に感じられるため、本実施の形態では後続形態素「ん」を「ない」に置換する処理を行い、活用語尾を未然形(ア段)に置換することとする。   Even if the process of replacing the subsequent morpheme “n” with “not” is not performed, there is no grammatical problem in Japanese (eg, climbing Mt. Fuji). However, because it seems unnatural as a colloquial of modern standard language (Tokyo dialect), in this embodiment, the process of replacing the subsequent morpheme “n” with “not” is performed, and the ending utterance is changed to the unfinished form (A ).

(14)活用語尾を未然形(ア段)に、「んでし」を「なかっ」に置換し、「ませ」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素の表記が「ん」であり、かつ後続形態素の後に「でした」が後続するとき(後続形態素列が「ん/でした」であるとき)に、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(ア段)に置換し、「んでし」を「なかっ」に置換し、処理対象形態素「ませ」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(ア段)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素の表記が「ん」であり、かつ後続形態素の後に「でした」が後続するとき(後続形態素列が「ん/でした」であるとき)に、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(ア段)の活用語尾を「て」又は「で」の後に挿入し、「んでし」を「なかっ」に置換し、処理対象形態素「ませ」を削除する。
(14) A rule that replaces the inflection ending with the original form (A), replaces “Denshi” with “None”, and deletes “Not”. The expression replacement unit 26 sets “tail omission” to “none” for verbs. In this case, the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a verb class, the processing target morpheme is “not”, and the subsequent morpheme is “n”, And when “D” followed the subsequent morpheme (when the subsequent morpheme string is “N / D”), the ending morpheme of the morpheme that appears immediately before the target morpheme is changed to the previous morpheme. ), “Denshi” is replaced with “None”, and the processing target morpheme “N” is deleted.
When “tail omission” is “none” for a verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb utilization table database 24, and the occurrence ending list in the utilization ending list is not yet recorded. The utilization ending of the shape (stage) is acquired and replaced with the utilization ending of the morpheme that appears immediately before the processing target morpheme.
On the other hand, when “tail omitted” is “present”, the expression replacement unit 26 indicates that the type of part of speech of the morpheme that appears immediately before the processing target morpheme is a verb class, and the processing target morpheme is not “notified”. , And the subsequent morpheme is “n”, and the subsequent morpheme is followed by “do” (when the subsequent morpheme string is “n / do”). The ending list is read from the verb usage table in the verb usage table database 24, and the usage ending of the green form (A column) in the usage ending list is inserted after “te” or “de”, and “denshi” is inserted. Replace with “None” and delete the target morpheme “N”.

例えば、入力文「富士山に登りませんでした」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/ませ/ん/でし/た)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞/助動詞/助動詞/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(ア段)に置換し、「んでし」を「なかっ」に置換し、処理対象形態素「ませ」を削除する。そして、表現置換部26は、活用語尾が未然形(ア段)に置換され、「んでし」が「なかっ」に置換され、「ませ」が削除された文「富士山に登らなかった」を出力する。   For example, when the input sentence “I did not climb Mt. Fuji” is input, the expression replacement unit 26 uses the morpheme boundary obtained by the morpheme analysis unit 22 (Mt. Fuji / n / climb / don / don / de / And morphological inflections that appear immediately before the morpheme to be processed, based on the use type of part of speech and verbs (noun / participant / verb: La line five steps / auxiliary verb / auxiliary verb / auxiliary verb / auxiliary verb) Is replaced with a blank form (stage A), “Denshi” is replaced with “None”, and the morpheme to be processed “Not” is deleted. Then, the expression replacement unit 26 outputs the sentence “I did not climb Mt. Fuji” in which the ending ending was replaced with a blank form (A column), “Denshi” was replaced with “None”, and “Not” was deleted. To do.

上記(1)〜(14)のルールにおいて、処理対象形態素の1つ前に出現する形態素が接続助詞「て」又は「で」である場合は、処理対象形態素の1つ前に出現する形態素の代わりに、処理対象形態素より2つ前に出現する形態素(「て」又は「で」の一つ前の形態素))の品詞の種別を参照し、処理対象形態素より2つ前に出現する形態素の品詞に応じてルールを適用する。   In the rules (1) to (14) above, when the morpheme that appears one before the processing target morpheme is the connection particle “te” or “de”, the morpheme that appears one time before the processing target morpheme Instead, refer to the type of part of speech of the morpheme that appears two times before the processing target morpheme (the morpheme immediately before “te” or “de”), and the morpheme that appears two times before the processing target morpheme Apply rules according to part of speech.

出力部30は、表現置換部26によって出力された文を結果として出力する。   The output unit 30 outputs the sentence output by the expression replacement unit 26 as a result.

<文体変換装置の作用>
次に、本実施の形態に係る文体変換装置100の作用について説明する。文体変換装置100に、文体変換対象の文が入力されると、文体変換装置100によって、図3〜図5に示す表現置換処理ルーチンが実行される。
<Operation of style conversion device>
Next, the operation of the style conversion device 100 according to the present embodiment will be described. When a sentence to be converted is input to the style conversion apparatus 100, the expression substitution processing routine shown in FIGS. 3 to 5 is executed by the style conversion apparatus 100.

まず、ステップS100において、入力部10によって、入力された文体変換対象の文を、入力文として受け付ける。   First, in step S <b> 100, the input sentence 10 is received as an input sentence by the input unit 10.

ステップS102において、形態素解析部22によって、上記ステップS100で受け付けた入力文に対して、形態素解析を行い、形態素境界、品詞、及び動詞類の活用型を取得する。   In step S102, the morpheme analysis unit 22 performs morpheme analysis on the input sentence received in step S100, and acquires morpheme boundaries, parts of speech, and utilization types of verbs.

ステップS104において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、入力文の処理対象形態素の1つ前に出現する形態素の品詞の種別を判定する。入力文の処理対象形態素の1つ前に出現する形態素の品詞の種別が形容詞類である場合には、ステップS106へ進む。入力文の処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類である場合には、ステップS112へ進む。入力文の処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類である場合には、ステップS128へ進む。
なお、処理対象形態素の1つ前に出現する形態素が接続助詞「て」又は「で」である場合は、処理対象形態素の1つ前に出現する形態素の代わりに、処理対象形態素の2つ前に出現する形態素を参照して、処理対象形態素より2つ前に出現する形態素の品詞の種別が、形容詞類、名詞類、及び動詞類の何れであるかを判定する。
In step S104, the expression replacement unit 26 determines the type of part of speech of the morpheme that appears immediately before the processing target morpheme of the input sentence based on the morpheme analysis result acquired in step S102. When the type of part of speech of the morpheme that appears immediately before the processing target morpheme of the input sentence is an adjective class, the process proceeds to step S106. When the type of part of speech of the morpheme that appears immediately before the processing target morpheme of the input sentence is a noun class, the process proceeds to step S112. When the type of part of speech of the morpheme that appears immediately before the processing target morpheme of the input sentence is a verb class, the process proceeds to step S128.
In addition, when the morpheme that appears immediately before the processing target morpheme is the connection particle “te” or “de”, instead of the morpheme that appears before the processing target morpheme, it is two before the processing target morpheme. Referring to the morphemes appearing in, it is determined whether the type of part of speech of the morpheme that appears two times before the processing target morpheme is an adjective class, a noun class, or a verb class.

ステップS106において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、処理対象形態素の表記を判定する。処理対象形態素の表記が「です」である場合には、ステップS108へ進む。一方、処理対象形態素の表記が「でしょ」である場合には、ステップS110へ進む。   In step S106, the representation replacement unit 26 determines the notation of the processing target morpheme based on the morpheme analysis result acquired in step S102. If the notation of the morpheme to be processed is “I”, the process proceeds to step S108. On the other hand, if the notation of the processing target morpheme is “de”, the process proceeds to step S110.

ステップS108において、表現置換部26によって、入力文から処理対象形態素「です」を削除する。   In step S108, the expression replacement unit 26 deletes the processing target morpheme “is” from the input sentence.

ステップS110において、表現置換部26によって、入力文に含まれる処理対象形態素「でしょ」を「だろ」に置換する。   In step S 110, the expression replacement unit 26 replaces the processing target morpheme “desh” included in the input sentence with “daro”.

ステップS112において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、処理対象形態素の後に疑問終助詞(「か」等)が後続するか否かを判定する。処理対象形態素の後に疑問終助詞(「か」等)が後続する場合には、ステップS108へ移行する。一方、処理対象形態素の後に疑問終助詞が後続しない場合には、ステップS114へ進む。   In step S112, the expression replacement unit 26 determines whether or not a questionable final particle (such as “ka”) follows the processing target morpheme based on the morpheme analysis result acquired in step S102. When a question final particle (such as “ka”) follows the processing target morpheme, the process proceeds to step S108. On the other hand, if no question final particle follows the processing target morpheme, the process proceeds to step S114.

ステップS114において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、処理対象形態素の表記を判定する。処理対象形態素の表記が「でしょ」である場合には、ステップS110へ進む。処理対象形態素の表記が「でし」である場合には、ステップS116へ進む。処理対象形態素の表記が「です」である場合には、ステップS122へ進む。   In step S114, the representation replacement unit 26 determines the notation of the processing target morpheme based on the morpheme analysis result acquired in step S102. If the notation of the processing target morpheme is “de”, the process proceeds to step S110. If the notation of the processing target morpheme is “deshi”, the process proceeds to step S116. When the notation of the processing target morpheme is “is”, the process proceeds to step S122.

ステップS116において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、後続形態素の表記を判定する。後続形態素の表記が「て」である場合には、ステップS118へ進む。一方、処理対象形態素の表記が「た」である場合には、ステップS120へ進む。   In step S116, the representation replacement unit 26 determines the notation of the subsequent morpheme based on the morpheme analysis result acquired in step S102. If the notation of the subsequent morpheme is “te”, the process proceeds to step S118. On the other hand, if the notation of the processing target morpheme is “ta”, the process proceeds to step S120.

ステップS118において、表現置換部26によって、入力文に含まれる処理対象形態素「でし」を削除し、後続形態素「て」を「で」に置換する。   In step S118, the expression replacement unit 26 deletes the processing target morpheme “deshi” included in the input sentence, and replaces the subsequent morpheme “te” with “de”.

ステップS120において、表現置換部26によって、入力文に含まれる処理対象形態素「でし」を「だっ」に置換する。   In step S120, the expression replacement unit 26 replaces the processing target morpheme “deshi” included in the input sentence with “da”.

ステップS122において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、後続形態素の表記を判定する。後続形態素の表記が「の*」以外である場合には、ステップS124へ進む。一方、処理対象形態素の表記が「の*」である場合には、ステップS126へ進む。   In step S122, the expression replacement unit 26 determines the notation of the subsequent morpheme based on the morpheme analysis result acquired in step S102. If the subsequent morpheme is not “*”, the process proceeds to step S124. On the other hand, if the notation of the processing target morpheme is “no *”, the process proceeds to step S126.

ステップS124において、表現置換部26によって、入力文に含まれる処理対象形態素「です」を「だ」に置換する。   In step S124, the expression replacement unit 26 replaces the processing target morpheme “is” included in the input sentence with “da”.

ステップS126において、表現置換部26によって、入力文に含まれる処理対象形態素「です」を「な」に置換する。   In step S 126, the expression replacement unit 26 replaces the processing target morpheme “is” included in the input sentence with “na”.

ステップS128において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類と処理対象形態素との間で、「テイル」省略がされているか否かを判定する。「テイル」省略がされている場合には、ステップS130へ進む。一方、「テイル」省略がされていない場合には、ステップS132へ進む。   In step S128, the expression replacement unit 26 determines whether or not “tail” is omitted between the verb class and the processing target morpheme, based on the morpheme analysis result acquired in step S102. If “tail” is omitted, the process proceeds to step S130. On the other hand, if “tail” is not omitted, the process proceeds to step S132.

ステップS130において、表現置換部26によって、動詞活用表データベース24の動詞活用表の中から一段活用の活用語尾リストを読み込み、一段活用の活用語尾リスト内の活用語尾を取得する。   In step S130, the expression replacement unit 26 reads the utilization ending list of the one-stage utilization from the verb utilization table of the verb utilization table database 24, and acquires the utilization endings in the utilization ending list of the one-stage utilization.

ステップS132において、表現置換部26によって、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の活用語尾を取得する。   In step S132, the expression replacement unit 26 reads a utilization ending list corresponding to the utilization type of the verb class from the verb utilization table of the verb utilization table database 24, and acquires the utilization ending in the utilization ending list.

ステップS134において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、処理対象形態素の表記を判定する。処理対象形態素の表記が「まし」である場合には、ステップS136へ進む。処理対象形態素の表記が「ます」である場合には、ステップS148へ進む。処理対象形態素の表記が「ましょ」である場合には、ステップS150へ進む。処理対象形態素の表記が「ませ」である場合には、ステップS152へ進む。   In step S134, the representation replacement unit 26 determines the notation of the processing target morpheme based on the morpheme analysis result acquired in step S102. If the notation of the processing target morpheme is “better”, the process proceeds to step S136. If the notation of the morpheme to be processed is “mas”, the process proceeds to step S148. If the notation of the morpheme to be processed is “Masho”, the process proceeds to step S150. If the notation of the processing target morpheme is “not”, the process proceeds to step S152.

ステップS136において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、後続形態素の表記を判定する。後続形態素の表記が「た」である場合には、ステップS138へ進む。後続形態素の表記が「て」である場合には、ステップS144へ進む。   In step S136, the expression replacement unit 26 determines the notation of the subsequent morpheme based on the morpheme analysis result acquired in step S102. If the notation of the subsequent morpheme is “ta”, the process proceeds to step S138. If the notation of the subsequent morpheme is “te”, the process proceeds to step S144.

ステップS138において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類の活用型を判定する。動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用である場合には、ステップS139へ進む。一方、動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、及びマ行五段活用でない場合には、ステップS142へ進む。   In step S138, the expression replacement unit 26 determines the usage type of the verb class based on the morphological analysis result acquired in step S102. When the usage type of the verb class is five-stage utilization, five-stage utilization, five-stage utilization, five-stage utilization, or five-stage utilization, the process proceeds to step S139. On the other hand, if the usage type of the verb class is not the fifth row utilization, the fifth row utilization, the fifth row utilization, or the fifth row utilization of the row, the process proceeds to step S142.

ステップS139において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類と処理対象形態素との間で、「テイル」省略がされているか否かを判定する。「テイル」省略がされている場合には、ステップS142へ進む。一方、「テイル」省略がされていない場合には、ステップS140へ進む。   In step S139, the expression replacement unit 26 determines whether or not “tail” is omitted between the verb class and the processing target morpheme, based on the morpheme analysis result acquired in step S102. If “tail” is omitted, the process proceeds to step S142. On the other hand, if “tail” is not omitted, the process proceeds to step S140.

ステップS140において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の連用形(音便形)の活用語尾に基づいて、入力文の活用語尾を連用形(音便形)に変換し、後続形態素「た」を「だ」に置換し、処理対象形態素「まし」を削除する。   In step S140, based on the utilization ending of the continuous form (sound form) in the utilization ending list acquired in step S130 or S132 by the expression replacement unit 26, the utilization ending of the input sentence is converted to the continuous form (sound form). Then, the subsequent morpheme “ta” is replaced with “da”, and the processing target morpheme “masashi” is deleted.

ステップS142において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の連用形(音便形)の活用語尾に基づいて、入力文の活用語尾を連用形(音便形)に置換し、処理対象形態素「まし」を削除する。   In step S142, based on the utilization ending of the continuous form (sound form) in the utilization ending list acquired in step S130 or step S132 by the expression replacement unit 26, the utilization ending of the input sentence is converted to the continuous form (sound form). Replace and delete the morpheme “masashi” to be processed.

ステップS144において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類の活用型を判定する。動詞類の活用型がガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用である場合には、ステップS145へ進む。一方、動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、及びマ行五段活用でない場合には、ステップS142へ進む。   In step S144, the expression replacement unit 26 determines the verb utilization type based on the morphological analysis result acquired in step S102. If the usage type of the verb class is five-stage utilization, five-stage utilization, five-stage utilization, five-stage utilization, or five-stage utilization, the process proceeds to step S145. On the other hand, if the usage type of the verb class is not the fifth row utilization, the fifth row utilization, the fifth row utilization, or the fifth row utilization of the row, the process proceeds to step S142.

ステップS145において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類と処理対象形態素との間で、「テイル」省略がされているか否かを判定する。「テイル」省略がされている場合には、ステップS142へ進む。一方、「テイル」省略がされていない場合には、ステップS146へ進む。   In step S145, the expression replacement unit 26 determines whether or not “tail” is omitted between the verb class and the processing target morpheme, based on the morpheme analysis result acquired in step S102. If “tail” is omitted, the process proceeds to step S142. On the other hand, if “tail” is not omitted, the process proceeds to step S146.

ステップS146において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の連用形(音便形)の活用語尾に基づいて、入力文の活用語尾を連用形(音便形)に置換し、後続形態素「て」を「で」に置換し、処理対象形態素「まし」を削除する。   In step S146, the expression replacement unit 26 converts the used endings of the input sentence to the continuous form (sound form) based on the used endings of the continuous form (sound form) in the use ending list acquired in step S130 or S132. Replace the subsequent morpheme “te” with “de”, and delete the processing target morpheme “masashi”.

ステップS148において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の終止形の活用語尾に基づいて、入力文の活用語尾を終止形に置換し、処理対象形態素「ます」を削除する。   In step S148, the expression replacement unit 26 replaces the utilized endings of the input sentence with the ending forms based on the ending forms of the ending forms in the utilization ending list acquired in step S130 or step S132, and processes the morpheme to be processed. "Is deleted.

ステップS150において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の未然形(オ段)の活用語尾に基づいて、入力文の活用語尾を未然形(オ段)に置換し、処理対象形態素「ましょ」を削除する。   In step S150, the expression replacement unit 26 changes the used ending of the input sentence to the uncorrected form (o stage) based on the used ending of the unusable form (o stage) in the used ending list acquired in step S130 or step S132. Replace and delete the processing target morpheme “Mashi”.

ステップS152において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、後続形態素を判定する。後続形態素が無い、又は後続形態素が文末記号類(。?!等)である場合には、ステップS154へ進む。一方、処理対象形態素の表記が「ん」である場合には、ステップS156へ進む。   In step S152, the expression replacement unit 26 determines the subsequent morpheme based on the morpheme analysis result acquired in step S102. If there is no subsequent morpheme, or if the subsequent morpheme is a sentence ending symbol (.?!, Etc.), the process proceeds to step S154. On the other hand, if the notation of the processing target morpheme is “n”, the process proceeds to step S156.

ステップS154において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の命令形の活用語尾に基づいて、入力文の活用語尾を命令形に置換し、処理対象形態素「ませ」を削除する。   In step S154, the expression replacement unit 26 replaces the utilization ending of the input sentence with the instruction form based on the utilization ending of the instruction form in the utilization ending list acquired in step S130 or step S132, and processes the morpheme to be processed. "Is deleted.

ステップS156において、表現置換部26によって、後続形態素の後に「でした」が後続するか否かを判定する。後続形態素の後に「でした」が後続する場合には、ステップS160へ進む。一方、後続形態素の後に「でした」が後続しない場合には、ステップS158へ進む。   In step S156, the expression replacement unit 26 determines whether or not “do” follows the subsequent morpheme. If “do” follows the subsequent morpheme, the process proceeds to step S160. On the other hand, if “do” does not follow the subsequent morpheme, the process proceeds to step S158.

ステップS158において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の未然形(ア段)の活用語尾に基づいて、入力文の活用語尾を未然形(ア段)に置換し、後続形態素「ん」を「ない」に置換し、処理対象形態素「ませ」を削除する。   In step S158, the expression replacement unit 26 converts the used endings of the input sentence to the undeformed form (step A) based on the used endings of the undescripted form (step A) in the list of used endings acquired in step S130 or step S132. Replace the subsequent morpheme “n” with “not”, and delete the processing target morpheme “n”.

ステップS160において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の未然形(ア段)の活用語尾に基づいて、入力文の活用語尾を未然形(ア段)に置換し、「んでし」を「なかっ」に置換し、処理対象形態素「ませ」を削除する。   In step S160, the expression replacement unit 26 converts the used endings of the input sentence to the uncorrected form (stage A) based on the used endings in the used form (stage A) in the list of used endings acquired in step S130 or S132. Replace “Denshi” with “None”, and delete the processing target morpheme “Nen”.

ステップS162において、上記ステップS108、S110、S118、S120、S124、S126、S140、S142、S146、S148、S150、S154、S158、及びS160の何れかのステップで変換された文を、結果として出力して、表現置換処理ルーチンを終了する。   In step S162, the sentence converted in any of the steps S108, S110, S118, S120, S124, S126, S140, S142, S146, S148, S150, S154, S158, and S160 is output as a result. Then, the expression replacement processing routine is completed.

以上説明したように、本実施の形態に係る文体変換装置によれば、敬体表現である処理対象形態素より1つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、後続形態素が無いこと、又は後続形態素が文末記号であるか否かとの少なくとも1つに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、入力文に含まれる敬体表現を常体表現に変換することにより、敬体表現を常体表現に精度よく変換することができる。   As described above, according to the stylistic conversion device according to the present embodiment, the part-of-speech or inflection type of the morpheme that appears immediately before the processing target morpheme that is the honorific expression, and the processing target morpheme follow. The morpheme to be processed is a regular expression according to at least one of the following morpheme or subsequent morpheme string notation, absence of a subsequent morpheme, or whether the subsequent morpheme is a sentence ending symbol. Based on a predetermined rule for conversion, the honorific expression included in the input sentence is converted into the normal expression, so that the honorific expression can be accurately converted into the normal expression.

また、本実施の形態に係る文体変換装置によれば、常体表現と敬体表現とが入り混じった文書を、自動的に常体表現に統一することが可能となる。
本実施の形態に係る文体変換装置を文書校正に適用すれば、文書の文体を統一する支援をすることができる。また、本実施の形態に係る文体変換装置を、人間と対話をするコンピュータ(対話システム)の発話生成に適用すれば、システムの発話データベースを全て常体に統一することができ、システムの話し方(文体)に一貫性を持たせることができる。
Further, according to the stylistic conversion device according to the present embodiment, it is possible to automatically unify a document in which normal expression and respected expression are mixed into normal expression.
If the stylistic conversion device according to the present embodiment is applied to document proofreading, it is possible to support unifying the style of the document. Moreover, if the stylistic conversion device according to the present embodiment is applied to utterance generation of a computer (dialogue system) that interacts with humans, the system utterance database can be unified all the time, and the system's way of speaking ( Can be made consistent.

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   Note that the present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.

また、文体変換装置100は、動詞活用表データベース24を備えている場合について説明したが、例えば動詞活用表データベース24が文体変換装置100の外部装置に設けられ、文体変換装置100は、外部装置と通信手段を用いて通信することにより、動詞活用表データベース24を参照するようにしてもよい。   Moreover, although the style conversion apparatus 100 demonstrated the case where the verb utilization table database 24 was provided, the verb utilization table database 24 is provided in the external device of the style conversion apparatus 100, for example, and the style conversion apparatus 100 is connected with an external device. You may make it refer to the verb utilization table | surface database 24 by communicating using a communication means.

上述の文体変換装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   The above-described style conversion device 100 has a computer system inside, but the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   In the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.

10 入力部
20 演算部
22 形態素解析部
24 動詞活用表データベース
26 表現置換部
30 出力部
100 文体変換装置
DESCRIPTION OF SYMBOLS 10 Input part 20 Operation part 22 Morphological analysis part 24 Verb utilization table database 26 Expression substitution part 30 Output part 100 Stylistic conversion apparatus

Claims (3)

入力文を受け付ける入力手段と、
敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、前記後続形態素が無いこと、又は前記後続形態素が文末記号であるか否かとの少なくとも1つに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換する表現置換手段と、を含み
前記ルールは、
(1)「です」を削除するルール
(2)「でしょ」を「だろ」に置換するルール
(3)「でし」を削除し、「て」を「で」に置換するルール
(4)「でし」を「だっ」に置換するルール
(5)「です」を「だ」に置換するルール
(6)「です」を「な」に置換するルール
(7)活用語尾を連用形(音便形)に、「た」を「だ」に置換し、「まし」を削除するルール
(8)活用語尾を連用形(音便形)に置換し、「まし」を削除するルール
(9)活用語尾を連用形(音便形)に、「て」を「で」に置換し、「まし」を削除するルール
(10)活用語尾を終止形に置換し、「ます」を削除するルール
(11)活用語尾を未然形(オ段)に置換し、「ましょ」を削除するルール
(12)活用語尾を命令形に置換し、「ませ」を削除するルール
(13)活用語尾を未然形(ア段)に、「ん」を「ない」に置換し、「ませ」を削除するルール
(14)活用語尾を未然形(ア段)に、「んでし」を「なかっ」に置換し、「ませ」を削除するルール
を含むことを特徴とする文体変換装置。
An input means for receiving an input sentence;
Part-of-speech or inflection type of a morpheme that appears one or two times before a processing target morpheme that is a honorific expression, and a notation of a subsequent morpheme or subsequent morpheme string that appears following the processing target morpheme, the subsequent morpheme Based on a predetermined rule for converting the processing target morpheme that is the honorific expression into a normal expression according to at least one of whether or not the subsequent morpheme is a sentence ending symbol And an expression replacement means for converting the honorific expression included in the input sentence into a regular expression, and the rule is:
(1) Rule to delete “is” (2) Rule to replace “Doshi” with “Daro” (3) Rule to delete “Doshi” and replace “te” with “de” (4) “ Rules for replacing "Dashi" with "Da" (5) Rules for replacing "Da" with "Da" (6) Rules for substituting "Da" with "Na" (7) Consecutive endings (sound form) ), A rule that replaces “ta” with “da”, and deletes “masashi” (8) a rule that replaces the inflection ending with the consecutive form (voice form), and a rule that deletes “masi” (9) the inflection ending A rule that replaces “te” with “de” and deletes “masashi” in the continuous form (sound flight form) (10) A rule that replaces the ending ending with the ending form and deletes “mas” (11) ending ending Is a rule that replaces the original form (o-dan) and deletes “Mashi” (12) A rule that replaces the inflection ending with an instruction form and deletes “not” (13) Rule that replaces the inflection ending with the original form (A column), replaces “N” with “None”, and deletes “N” (14) The ending ending item with the original form (A column), “No” A stylistic conversion device including a rule that replaces “” and deletes “no”.
入力手段及び表現置換手段を含む文体変換装置における文体変換方法であって、
前記入力手段が、入力文を受け付けるステップと、
前記表現置換手段が、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、前記後続形態素が無いこと、又は前記後続形態素が文末記号であるか否かとの少なくとも1つに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するステップと、を含み、
前記ルールは、
(1)「です」を削除するルール
(2)「でしょ」を「だろ」に置換するルール
(3)「でし」を削除し、「て」を「で」に置換するルール
(4)「でし」を「だっ」に置換するルール
(5)「です」を「だ」に置換するルール
(6)「です」を「な」に置換するルール
(7)活用語尾を連用形(音便形)に、「た」を「だ」に置換し、「まし」を削除するルール
(8)活用語尾を連用形(音便形)に置換し、「まし」を削除するルール
(9)活用語尾を連用形(音便形)に、「て」を「で」に置換し、「まし」を削除するルール
(10)活用語尾を終止形に置換し、「ます」を削除するルール
(11)活用語尾を未然形(オ段)に置換し、「ましょ」を削除するルール
(12)活用語尾を命令形に置換し、「ませ」を削除するルール
(13)活用語尾を未然形(ア段)に、「ん」を「ない」に置換し、「ませ」を削除するルール
(14)活用語尾を未然形(ア段)に、「んでし」を「なかっ」に置換し、「ませ」を削除するルール
を含むことを特徴とする文体変換方法。
A stylistic conversion method in a stylistic conversion device including an input means and an expression replacement means,
The input means accepting an input sentence;
The part-of-speech or inflection type of the morpheme that appears one or two times before the processing target morpheme that is the honorific expression, and the subsequent morpheme or subsequent morpheme sequence that appears after the processing target morpheme In accordance with at least one of the following notation, the absence of the succeeding morpheme, or whether the succeeding morpheme is a sentence ending symbol or not. Based on the determined rule, converting the honorific expression included in the input sentence into a regular expression,
The rule is
(1) Rule to delete “is” (2) Rule to replace “Doshi” with “Daro” (3) Rule to delete “Doshi” and replace “te” with “de” (4) “ Rules for replacing "Dashi" with "Da" (5) Rules for replacing "Da" with "Da" (6) Rules for substituting "Da" with "Na" (7) Consecutive endings (sound form) ), A rule that replaces “ta” with “da”, and deletes “masashi” (8) a rule that replaces the inflection ending with the consecutive form (voice form), and a rule that deletes “masi” (9) the inflection ending A rule that replaces “te” with “de” and deletes “masashi” in the continuous form (sound flight form) (10) A rule that replaces the ending ending with the ending form and deletes “mas” (11) ending ending Is a rule that replaces the original form (o-dan) and deletes “Mashi” (12) A rule that replaces the inflection ending with an instruction form and deletes “not” (13) Rule that replaces the inflection ending with the original form (A column), replaces “N” with “None”, and deletes “N” (14) The ending ending item with the original form (A column), “No” The method of stylistic conversion is characterized by including a rule that replaces “” and deletes “No”.
コンピュータを、請求項1に記載の文体変換装置の各手段として機能させるためのプログラム。   The program for functioning a computer as each means of the style conversion apparatus of Claim 1.
JP2017009078A 2017-01-23 2017-01-23 Stylistic conversion device, method, and program Active JP6472466B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017009078A JP6472466B2 (en) 2017-01-23 2017-01-23 Stylistic conversion device, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017009078A JP6472466B2 (en) 2017-01-23 2017-01-23 Stylistic conversion device, method, and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014227573A Division JP6116014B2 (en) 2014-11-07 2014-11-07 Stylistic conversion device, method, and program

Publications (2)

Publication Number Publication Date
JP2017068879A true JP2017068879A (en) 2017-04-06
JP6472466B2 JP6472466B2 (en) 2019-02-20

Family

ID=58492721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017009078A Active JP6472466B2 (en) 2017-01-23 2017-01-23 Stylistic conversion device, method, and program

Country Status (1)

Country Link
JP (1) JP6472466B2 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03248264A (en) * 1990-02-26 1991-11-06 Nippon Telegr & Teleph Corp <Ntt> Japanese-language sentence elaborating device
JPH03259372A (en) * 1990-03-09 1991-11-19 Matsushita Electric Ind Co Ltd Method and device for processing style
JPH05314171A (en) * 1992-05-07 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> Japanese descriptive sentence/colloquial sentence conversion system
JP2003022266A (en) * 2001-07-06 2003-01-24 Communication Research Laboratory Text word/style conversion system and text word/style conversion processing program
JP2003022264A (en) * 2001-07-06 2003-01-24 Communication Research Laboratory System for integrating language conversion processing
JP2012194775A (en) * 2011-03-16 2012-10-11 Fujitsu Ltd Information processor control method, control program and information processor

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03248264A (en) * 1990-02-26 1991-11-06 Nippon Telegr & Teleph Corp <Ntt> Japanese-language sentence elaborating device
JPH03259372A (en) * 1990-03-09 1991-11-19 Matsushita Electric Ind Co Ltd Method and device for processing style
JPH05314171A (en) * 1992-05-07 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> Japanese descriptive sentence/colloquial sentence conversion system
JP2003022266A (en) * 2001-07-06 2003-01-24 Communication Research Laboratory Text word/style conversion system and text word/style conversion processing program
JP2003022264A (en) * 2001-07-06 2003-01-24 Communication Research Laboratory System for integrating language conversion processing
JP2012194775A (en) * 2011-03-16 2012-10-11 Fujitsu Ltd Information processor control method, control program and information processor

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
安達 康昭 山本 和英: "特徴的冗長表現に着目した国会会議録要約", 情報処理学会研究報告, vol. 第2003巻第98号, JPN6018012525, 30 September 2003 (2003-09-30), JP, pages 107 - 114, ISSN: 0003775242 *
山上勝義 外3名: "文体変換テキスト音声合成システムの開発", 日本音響学会2000年 春季研究発表会講演論文集, JPN6018012524, 15 March 2000 (2000-03-15), JP, pages 317 - 318, ISSN: 0003775241 *
齋藤 彰弘 外3名: "意外性のある質問応答システムのための発話文生成手法", 第67回 言語・音声理解と対話処理研究会資料 (SIG−SLUD−B203), JPN6018012522, 5 December 2013 (2013-12-05), JP, pages 1 - 6, ISSN: 0003775240 *

Also Published As

Publication number Publication date
JP6472466B2 (en) 2019-02-20

Similar Documents

Publication Publication Date Title
US7860719B2 (en) Disfluency detection for a speech-to-speech translation system using phrase-level machine translation with weighted finite state transducers
Pennell et al. Normalization of text messages for text-to-speech
Hadni et al. Hybrid part-of-speech tagger for non-vocalized Arabic text
JP6778655B2 (en) Word concatenation discriminative model learning device, word concatenation detection device, method, and program
Rasooli et al. Unsupervised morphology-based vocabulary expansion
Chennoufi et al. Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization
JP5911931B2 (en) Predicate term structure extraction device, method, program, and computer-readable recording medium
JP6472466B2 (en) Stylistic conversion device, method, and program
JP6116014B2 (en) Stylistic conversion device, method, and program
JP2016218848A (en) Language expression rewriting apparatus, method and program
JP6592378B2 (en) Rewriting device, method, and program
KR102182248B1 (en) System and method for checking grammar and computer program for the same
JP2014191484A (en) Sentence end expression conversion device, method and program
Mammadov et al. Part-of-speech tagging for azerbaijani language
CN113158693A (en) Uygur language keyword generation method and device based on Chinese keywords, electronic equipment and storage medium
Lui et al. Recovering casing and punctuation using conditional random fields
JP6058563B2 (en) Model learning device, filter device, method, and program
Li et al. The study of comparison and conversion about traditional Mongolian and Cyrillic Mongolian
JP2019087058A (en) Artificial intelligence apparatus for specifying omission in sentence
KR101604553B1 (en) Apparatus and method for generating pseudomorpheme-based speech recognition units by unsupervised segmentation and merging
JP6325789B2 (en) Translation apparatus and translation program
Rodrigues et al. Arabic data science toolkit: An api for arabic language feature extraction
Mahanta et al. Entity recognition in assamese text
Khorsi et al. Unsupervised detection of morpheme boundaries
Effertz Creating Gender Analyzing Contemporary Loanwords and Gender Assignment in Faroese

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180410

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20180511

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180605

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190122

R150 Certificate of patent or registration of utility model

Ref document number: 6472466

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150