JP2017068879A - Style conversion device, method, and program - Google Patents
Style conversion device, method, and program Download PDFInfo
- Publication number
- JP2017068879A JP2017068879A JP2017009078A JP2017009078A JP2017068879A JP 2017068879 A JP2017068879 A JP 2017068879A JP 2017009078 A JP2017009078 A JP 2017009078A JP 2017009078 A JP2017009078 A JP 2017009078A JP 2017068879 A JP2017068879 A JP 2017068879A
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- ending
- rule
- expression
- processing target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、文体変換装置、方法、及びプログラムに関する。 The present invention relates to a style conversion device, method, and program.
非特許文献1では、講演音声の書き起こしを対象として、新聞記事から作成された言語モデルを用いた統計的手法によって、文体を「である調」(常体)に統一する手法を説明している。ただし、「である調」(常体)への変換は精度が低い(つまり、変換すべき表現を正しく変換できない事例が多かった)ことが報告されている。さらに、変換できなかった箇所の多くが、動詞の活用形を変化させる必要のある表現であったことが述べられている。 Non-Patent Document 1 describes a method for unifying the style of a sentence into “a key” (normal) by means of a statistical method using a language model created from newspaper articles for the transcription of lecture speech. Yes. However, it has been reported that the conversion to “a key” (normal) has low accuracy (that is, there are many cases where the expression to be converted cannot be converted correctly). Furthermore, it is stated that many of the parts that could not be converted were expressions that needed to change the verb usage.
従来の技術には、前後の形態素によって変化する動詞の活用形を考慮しないために、形態素(列)の置換によって日本語として不適格な文を生成してしまったり、「ます」を含む一部の表現が変換されなかったりするという問題があった。 The conventional technology does not take into account the use of verbs that change depending on the morpheme before and after, so it generates sentences that are ineligible as Japanese by replacing morphemes (columns), and some that include "mas" There was a problem that the expression of was not converted.
本発明は、上記の事情に鑑みてなされたもので、敬体表現を常体表現に精度よく変換することができる文体変換装置、方法、及びプログラムを提供することを目的とする。 The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a stylistic conversion device, method, and program capable of accurately converting a honorific expression into a regular expression.
上記目的を達成するために、本発明の文体変換装置は、入力文を受け付ける入力手段と、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、前記後続形態素が無いこと、又は前記後続形態素が文末記号であるか否かとの少なくとも1つに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換する表現置換手段と、を含んで構成されている。 In order to achieve the above object, the style conversion device of the present invention includes an input unit that receives an input sentence, and a part of speech or a utilization type of a morpheme that appears one or two times before a processing target morpheme that is a sympathetic expression. And the following morpheme or subsequent morpheme string appearing after the processing target morpheme, the absence of the subsequent morpheme, or whether the subsequent morpheme is a sentence ending symbol. An expression replacement means for converting a honorific expression included in the input sentence to a normal expression based on a predetermined rule for converting a processing target morpheme that is a body expression into a normal expression. Has been.
本発明の文体変換方法は、入力手段及び表現置換手段を含む文体変換装置における文体変換方法であって、前記入力手段が、入力文を受け付けるステップと、前記表現置換手段が、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、前記後続形態素が無いこと、又は前記後続形態素が文末記号であるか否かとの少なくとも1つに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するステップと、を含んで構成されている。 The style conversion method of the present invention is a style conversion method in a style conversion apparatus including an input means and an expression replacement means, wherein the input means accepts an input sentence, and the expression replacement means is a honorific expression. Part of speech or inflection type of a morpheme that appears one or two times before a processing target morpheme and a notation of a subsequent morpheme or a subsequent morpheme string that appears following the processing target morpheme, or the absence of the subsequent morpheme, or In accordance with at least one of whether or not the subsequent morpheme is a sentence ending symbol, the input sentence is converted to the input sentence based on a predetermined rule for converting the processing target morpheme that is the honorific expression into a normal expression. And converting the contained honorific expression into a regular expression.
本発明の前記表現置換手段は、前記処理対象形態素より1つ前又は2つ前に出現する形態素の品詞が動詞類であって、前記処理対象形態素と、前記処理対象形態素より1つ前に出現する形態素との間で、「いる」が省略されているか否かに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための前記ルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するようにすることができる。 In the expression replacement means of the present invention, the part of speech of a morpheme that appears one or two times before the processing target morpheme is a verb class, and appears before the processing target morpheme and the processing target morpheme Included in the input sentence based on the rules for converting the processing target morpheme that is a sympathetic expression into a regular expression depending on whether or not “is” is omitted between It is possible to convert the expression of honored body into a regular expression.
本発明の前記表現置換手段は、前記処理対象形態素より1つ前又は2つ前に出現する形態素の品詞が、名詞類、形容詞類、及び動詞類の何れに該当するかに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための前記ルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するようにすることができる。 The expression replacement means according to the present invention is configured so that the part of speech of a morpheme that appears one or two times before the processing target morpheme corresponds to a noun class, an adjective class, or a verb class. Based on the rule for converting a processing target morpheme that is a body expression into a normal expression, the honorific expression included in the input sentence can be converted into a normal expression.
本発明の前記表現置換手段は、「です」、「でし」、「でしょ」、「ます」、「まし」、「ましょ」、又は「ませ」である処理対象形態素を常体表現に変換するための前記ルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するようにすることができる。 The expression replacement means of the present invention converts a processing target morpheme that is “is”, “deshi”, “decho”, “masu”, “masashi”, “maso”, or “no” into a normal expression. On the basis of the rule for the above, it is possible to convert the honorific expression included in the input sentence into a regular expression.
本発明のプログラムは、コンピュータを、本発明の文体変換装置の各手段として機能させるためのプログラムである。 The program of this invention is a program for functioning a computer as each means of the style conversion apparatus of this invention.
以上説明したように、本発明の文体変換装置、方法、及びプログラムによれば、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、後続形態素が無いこと、又は後続形態素が文末記号であるか否かとの少なくとも1つに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、入力文に含まれる敬体表現を常体表現に変換することにより、敬体表現を常体表現に精度よく変換することができる、という効果が得られる。 As described above, according to the stylistic conversion device, method, and program of the present invention, the part-of-speech or inflection type of the morpheme that appears one or two times before the processing target morpheme that is the honorific expression, and the processing A processing target morpheme that is a sympathetic representation, depending on at least one of the following morpheme or subsequent morpheme sequence notation that follows the target morpheme, the absence of the subsequent morpheme, or whether the subsequent morpheme is a sentence ending symbol Based on a predetermined rule for converting to normal expression, by converting the honorific expression contained in the input sentence to the normal expression, it is possible to accurately convert the honorific expression to the normal expression. The effect of being able to be obtained is obtained.
<概要>
まず、本発明の実施の形態の概要について説明する。
<Overview>
First, an outline of an embodiment of the present invention will be described.
本発明の実施の形態で解決する課題は、日本語で書かれた文の中に含まれる敬体(です・ます体)表現を常体(だ・である体)表現に書き換えることである。本発明の実施の形態では、文字列の単純な置換では対処できないような環境に生起する敬体表現であっても、日本語として不適格な文の生成を抑制しつつ、常体表現に変換することを実現する。 The problem to be solved by the embodiment of the present invention is to rewrite a sympathetic expression contained in a sentence written in Japanese into a regular expression. In the embodiment of the present invention, even if the expression is an honorific expression that occurs in an environment that cannot be dealt with by simple substitution of a character string, the expression is converted to a normal expression while suppressing generation of a sentence that is ineligible as Japanese. Realize that.
本発明の実施の形態では、敬体表現を常体表現に置換する際、(A)処理対象形態素の1つ前又は2つ前に出現する形態素の品詞の種別、(B)処理対象形態素の表記、(C)後続形態素又は後続形態素列の表記、(D)テイル省略の有無、という4つの条件に基づく変換ルールを用いることにより、従来研究では扱えなかった、動詞の活用形を変化させる必要がある表現に対しても、日本語として不適格な表現への変換を抑制しながら、「です・ます」表現(「です」「ます」、およびこれらの活用形)を「だ」(または空文字)、および動詞の適切な活用形に変換することを可能とする。 In the embodiment of the present invention, when replacing the honorific expression with the regular expression, (A) the type of part of speech of the morpheme that appears one or two before the processing target morpheme, and (B) the processing target morpheme By using conversion rules based on four conditions: notation, (C) notation of subsequent morpheme or succeeding morpheme string, and (D) presence / absence of tails, it is necessary to change the utilization form of verbs that could not be handled by conventional research Even if there is a certain expression, the expression “is / mass” (“is”, “mas”, and their use forms) is changed to “da” (or an empty string) while suppressing the conversion to an expression that is ineligible as Japanese. ), And can be converted to the proper usage of verbs.
例えば、「富士山はきれいです」「富士山に登ります」という敬体表現で書かれた文を「富士山はきれいだ」「富士山に登る」のような常体表現の文に変換することが可能である。
また、以下の説明における「文」(テキスト)とは日本語で書かれた文をいう。ここで、日本語で書かれた文とは、ブログ・SNS等への書き込み、発話の音声認識結果やテキストチャットなど、文字化された日本語のデータであれば何でも良い。
For example, it is possible to convert sentences written with respectful expressions such as “Mt. Fuji is beautiful” and “I will climb Mt. Fuji” into sentences with a regular expression such as “Mt. Fuji is beautiful” and “Climb Mt. Fuji”. is there.
In the following description, “sentence” (text) refers to a sentence written in Japanese. Here, the sentence written in Japanese may be anything written in Japanese, such as writing to a blog / SNS, speech recognition result of speech, text chat, and the like.
以下、図面を参照して、本発明の実施の形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
<文体変換装置のシステム構成>
本実施の形態では、日本語で書かれた文を入力文として受け取り、入力された入力文に含まれる「です・ます」表現を、「だ」(または空文字)、及び動詞類の適切な活用形(活用語尾)に置換する。本実施の形態に係る文体変換装置100は、CPUと、RAMと、後述する文体変換処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成される。このコンピュータは、機能的には、図1に示すように、入力部10と、演算部20と、出力部30とを含んだ構成で表すことができる。以下、各部について詳述する。
<System configuration of style conversion device>
In the present embodiment, a sentence written in Japanese is received as an input sentence, and the expression “is / mas” included in the input sentence is appropriately used as “da” (or empty character) and verbs. Replace with form (utilization ending).
入力部10は、文体変換対象の文を入力文として受け付ける。
The
演算部20は、入力部10によって受け付けた入力文に含まれる敬体表現を常体表現に変換する。演算部20は、形態素解析部22と、動詞活用表データベース24と、表現置換部26とを備えている。
The
形態素解析部22は、入力部10によって受け付けた入力文に対し、形態素解析を行う。具体的には、形態素解析部22は、入力文に対して形態素解析を行い、形態素境界、品詞、及び動詞類の活用型を取得する。
The
例えば、「富士山に登ります」を入力文として受け付けた場合、形態素解析部22は入力文に対し形態素解析を行い、形態素境界「富士山/に/登り/ます」と、各形態素の品詞及び動詞類の活用型「名詞/助詞/動詞:ラ行五段/助動詞」とを、形態素解析結果として取得する。
ここで、形態素解析部22で用いる形態素解析器は、形態素境界、品詞、及び動詞類の活用型を取得できさえすれば、どのようなものを使用しても良い。
For example, when “I climb Mt. Fuji” is accepted as an input sentence, the
Here, any morpheme analyzer used in the
動詞活用表データベース24には、動詞活用表が格納されている。図2に、動詞活用表の一部分の例を示す。図2には、動詞活用表の一部分の例として、動詞「見る」の活用型である一段活用の活用語尾リストと、動詞「書く」の活用型であるカ行五段活用の活用語尾リストと、動詞「登る」の活用型であるラ行五段活用の活用語尾リストとを示す。図2に示されるように、動詞活用表は、動詞類の活用型毎の活用語尾リストを備えている。ここで、動詞類とは、後述するように、動詞、動詞型の活用をする助動詞、又は補助動詞を表す。また、活用語尾リストには、動詞類の活用形(未然形(ア段)、未然形(オ段)、連用形、連用形(音便形)、終止形、及び命令形)に対応する活用語尾が格納されている。
The verb
ここで、未然形(ア段)とは母音がaである未然形を指す。これは、「ない」等の形態素に接続する形であり、一例として、「登らない」が挙げられる。未然形(オ段)とは、母音がoである未然形を指す。これは、「う」等の形態素に接続する形であり、一例として、「登ろう」が挙げられる。
また、連用形(音便形)とは、イ音便、促音便、又は撥音便化した連用形を指す。これは、「て(で)」や「た(だ)」に接続する形であり、一例として「登って」が挙げられる。
Here, the green shape (stage A) refers to a green shape whose vowel is a. This is a form connected to a morpheme such as “no”, and one example is “do not climb”. The green form (o stage) refers to a green form whose vowel is o. This is a form connected to a morpheme such as “U”, and “Let ’s climb” is an example.
In addition, the continuous form (sound form) refers to a continuous form that has been turned into a sound stool, a sound stool or a sound-repellent stool. This is a form of connection to “te (de)” and “ta (da)”, and one example is “climb”.
例えば、上記図2に示されるように、動詞類の活用型が「ラ行五段活用」の場合、対応する活用語尾リストには、「ら」、「ろ」、「り」、「っ」、「る」、「れ」が活用語尾として格納されている。 For example, as shown in FIG. 2 above, when the verb usage type is “La line 5 stage usage”, the corresponding usage ending list includes “ra”, “ro”, “ri”, “tsu”. , “RU”, and “RE” are stored as utilization endings.
表現置換部26は、形態素解析部22で得られた形態素解析結果に基づいて、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、後続形態素が無いこと、又は後続形態素が文末記号であるか否かとの少なくとも1つに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められた複数のルールを用いて、入力文に含まれる敬体表現を常体表現に変換する。
なお、処理対象形態素とは、後述するように入力文に含まれる「です・ます」表現に対応する形態素を示す。
Based on the morpheme analysis result obtained by the
The processing target morpheme indicates a morpheme corresponding to the expression “is / mass” included in the input sentence as described later.
具体的には、表現置換部26は、形態素解析部22で取得された形態素の表記、品詞、及び動詞類の活用型に基づいて、(A)処理対象形態素より1つ前又は2つ前に出現する形態素の品詞の種別、(B)処理対象形態素の表記、(C)後続形態素又は後続形態素列の表記、(D)テイル省略の有無という4つの条件に応じて定められた複数のルールを用いて、入力文に含まれる「です・ます」表現に対する置換処理を行う。表現置換部26は、活用語尾取得処理、及び14種類のルールを用いた置換処理を含んで構成される。
Specifically, the expression replacement unit 26 (A) is one or two before the processing target morpheme, based on the morpheme notation, part of speech, and verb utilization type acquired by the
(A)1つ前又は2つ前に出現する形態素の品詞の種別、(C)後続形態素又は後続形態素列の表記、(D)テイル省略の有無は、(B)処理対象形態素である「です・ます」表現を検出したのちに、当該処理対象形態素を起点として、前後に現れる形態素を調べることによって把握される。(A)1つ前又は2つ前に出現する形態素の品詞の種別、(B)処理対象形態素の表記、(C)後続形態素又は後続形態素列の表記、及び(D)テイル省略の有無について以下説明する。 (A) Type of part of speech of morpheme that appears one or two before, (C) Notation of succeeding morpheme or succeeding morpheme string, (D) Presence or absence of tail omission is (B) Processing target morpheme After the “mass” expression is detected, it is grasped by examining the morphemes that appear before and after the morpheme to be processed. (A) Type of part of speech of morpheme that appears one or two before, (B) notation of processing target morpheme, (C) notation of subsequent morpheme or subsequent morpheme string, and (D) presence or absence of tail omission explain.
(A)1つ前又は2つ前に出現する形態素の品詞の種別
処理対象形態素(「です・ます」表現)より1つ前に出現する形態素の品詞の種別を参照する。処理対象形態素より1つ前に出現する形態素が接続助詞「て」又は「で」である場合は、処理対象形態素より2つ前に出現する形態素(「て」又は「で」の一つ前の形態素))の品詞の種別を参照する。本実施の形態では、1つ前に出現する形態素の品詞の種別を、下記(ア)〜(ウ)の3種の分類とする。また、動詞類は、活用型(カ行五段活用、一段活用等)によってさらに細分化される。なお、本実施の形態では、処理対象形態素より1つ前又は2つ前に出現する形態素の品詞及び活用型を用いる場合を例に説明する。
(A) Type of part of speech of morpheme that appears one or two times before The reference is made to the type of part of speech of the morpheme that appears one time before the morpheme to be processed ("is / mas" expression). When the morpheme that appears immediately before the processing target morpheme is the connection particle “te” or “de”, the morpheme that appears two times before the processing target morpheme (the one immediately before “te” or “de”) Refer to the type of part of speech of morpheme)). In the present embodiment, the type of part-of-speech of the morpheme that appears immediately before is classified into the following three types (a) to (c). In addition, verbs are further subdivided according to utilization types (such as five-stage utilization and one-stage utilization). In the present embodiment, a case will be described as an example in which the part-of-speech and utilization type of a morpheme that appears one or two before the processing target morpheme is used.
(ア)名詞類
名詞類として、名詞(代名詞、形式名詞、固有表現(人名、地名、日付表現、時間表現等)を含む)と、形容動詞とが含まれる。
(A) Nouns As nouns, nouns (including pronouns, formal nouns, proper expressions (including person names, place names, date expressions, time expressions, etc.)) and adjective verbs are included.
(イ)形容詞類
形容詞類として、形容詞と形容詞型の活用をする助動詞(例えば、「ない」「たい」等)とが含まれる。
(A) Adjectives Examples of adjectives include adjectives and auxiliary verbs (for example, “no”, “tai”, etc.) that make use of adjective forms.
(ウ)動詞類
動詞類として、動詞と、動詞型の活用をする助動詞(例えば、「られる」「させる」等)と、補助動詞(例えば、「いる」「ある」等)とが含まれる。
(C) Verbs As verbs, verbs, auxiliary verbs that make use of the verb type (for example, “being” or “to be”), and auxiliary verbs (for example, “being” or “being”) are included.
従って、表現置換部26は、1つ前又は2つ前に出現する形態素の品詞の種別が、名詞類、形容詞類、及び動詞類の何れに該当するかに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められた複数のルールに基づいて、入力文に含まれる敬体表現を常体表現に変換する。
Therefore, the
(B)処理対象形態素の表記
処理対象形態素は、「です・ます」表現の表記が「です」、「でし」、「でしょ」、「ます」、「まし」、「ましょ」、「ませ」のいずれであるかを指すものとする。
なお、本実施の形態では、処理対象形態素の検出(「です」及び「ます」の活用形の検出)は、形態素解析結果の一部として出力される形態素の「基本形」に基づいて行うが、形態素または形態素列の表記に対する文字列の照合によって「です」及び「ます」の活用形を検出しても良い。
従って、表現置換部26は、「です」、「でし」、「でしょ」、「ます」、「まし」、「ましょ」、又は「ませ」である処理対象形態素を常体表現に変換するための予め定められた複数のルールに基づいて、入力文に含まれる敬体表現を常体表現に変換する。
(B) Notation of processing target morpheme The processing target morpheme is expressed as “is”, “deshi”, “decho”, “masu”, “masashi”, “maso”, “no”. It shall be pointed out either.
In this embodiment, the detection of the morpheme to be processed (detection of the utilization form of “is” and “mas”) is performed based on the “basic form” of the morpheme output as part of the morpheme analysis result. The utilization form of “is” and “masu” may be detected by matching character strings against morpheme or morpheme string notation.
Accordingly, the
(C)後続形態素又は後続形態素列の表記
後続形態素は、処理対象形態素に後続して出現する形態素を表す。後続形態素列は、処理対象形態素に後続して出現する形態素列を表す。本実施の形態では、後続形態素の表記は、「た」(完了の助動詞)、「て」(接続助詞)、「の*」(表記の先頭文字が「の」である形態素)、「ん」、又は疑問の終助詞(「か」「かしら」「かな」)の何れかであるものとする。また、後続形態素列の表記は、「ん」に「でした」を加えた「ん/でした」であるものとする。
また、本実施の形態では、後続形態素が無い(文の終端)場合、又は後続形態素が文末記号である場合に応じて、入力文に含まれる敬体表現を常体表現に変換する。
従って、表現置換部26は、後続形態素若しくは後続形態素列の表記、後続形態素が無いこと、又は後続形態素が文末記号であるか否かに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められた複数のルールに基づいて、入力文に含まれる敬体表現を常体表現に変換する。
(C) Notation of subsequent morpheme or subsequent morpheme string The subsequent morpheme represents a morpheme that appears after the morpheme to be processed. The subsequent morpheme string represents a morpheme string that appears subsequent to the processing target morpheme. In the present embodiment, the subsequent morpheme is represented by “ta” (completion auxiliary verb), “te” (connection particle), “no *” (morpheme whose first character is “no”), “n”. Or a questionable final particle (“ka”, “kashira”, “kana”). Further, the notation of the subsequent morpheme sequence is “n / was” obtained by adding “do” to “n”.
Further, in the present embodiment, the honorific expression included in the input sentence is converted into a regular expression when there is no subsequent morpheme (end of sentence) or when the subsequent morpheme is a sentence end symbol.
Therefore, the
(D)テイル省略の有無
テイル省略の有無とは、動詞類と「ます」(およびその活用形)との間に「ている」の省略形「てる」が存在しているかどうか、又は「でいる」の省略形「でる」が存在しているかどうかを指すものとする。例えば、処理対象形態素の1つ前に出現する形態素が「て」又は「で」である場合には、テイル省略有りと判定する。処理対象形態素の1つ前に出現する形態素が「て」又は「で」でない場合には、テイル省略無しと判定する。テイル省略がされている一例として、例えば「登ってます」、「嗅いでます」が挙げられる。
表現置換部26は、処理対象形態素より1つ前又は2つ前に出現する形態素の品詞が動詞類であって、処理対象形態素と、処理対象形態素より1つ前に出現する形態素との間で、「いる」が省略されているか否かに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、入力文に含まれる敬体表現を常体表現に変換する。
(D) Presence or absence of tail omission Tail omission is the presence or absence of the abbreviation “teru” between “ver” and “mas” (and its usage), or “ It shall indicate whether or not the abbreviation “de” is present. For example, if the morpheme that appears immediately before the morpheme to be processed is “te” or “de”, it is determined that the tail is omitted. When the morpheme that appears immediately before the morpheme to be processed is not “te” or “de”, it is determined that the tail is not omitted. As an example where the tail is omitted, for example, "I'm climbing" and "I smell".
In the
後述する図3〜図5のフローチャートにおける(A)〜(D)はそれぞれ、(A)処理対象形態素の1つ前又は2つ前に出現する形態素の品詞の種別、(B)処理対象形態素の表記、(C)後続形態素又は後続形態素列の表記、(D)テイル省略の有無、のうちどの条件に相当するかを示す。 (A) to (D) in the flowcharts of FIGS. 3 to 5 to be described later are (A) the type of part of speech of the morpheme that appears one or two before the processing target morpheme, and (B) the processing target morpheme. It shows which condition corresponds to the notation, (C) notation of subsequent morpheme or succeeding morpheme string, and (D) presence or absence of tail omission.
本実施の形態では、表現置換部26は、形態素解析部22で得られた形態素解析結果に基づいて、上述した、(A)〜(D)の4つの条件に応じて定められた複数のルールとして、以下の(1)〜(14)に示すルールを用いて、入力文に含まれる敬体表現を常体表現に変換する。
In the present embodiment, the
(1)「です」を削除するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が形容詞類であって、かつ処理対象形態素の表記が「です」であるときに、入力文から処理対象形態素「です」を削除する。
例えば、入力文「富士山は美しいです」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/美しい/です)及び品詞(名詞/助詞/形容詞/助動詞)に基づいて、入力文から処理対象形態素「です」を削除し、「です」が削除された文「富士山は美しい」を出力する。
(1) Rule to delete “is” The
For example, when the input sentence “Mt. Fuji is beautiful” is input, the
また、表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「です」であり、かつ処理対象形態素「です」に疑問の終助詞が後続するときに、入力文から処理対象形態素「です」を削除する。
例えば、入力文「富士山は山ですか」が入力された場合には、表現置換部26は、入力文から処理対象形態素「です」を削除し、「です」が削除された文「富士山は山か」を出力する。
ただし、「山か」「美しいか」のように、名詞類又は形容詞類+「か」(+文末記号類(。?!等)または文の終端)という形式は、会話における発話文としては硬い印象を与えてしまうため、「か」に疑問符(「?」)を後続させたり、「か」を疑問符に置換したりしても良い。
In addition, the
For example, when the input sentence “Is Mount Fuji is a mountain” is input, the
However, the form of nouns or adjectives + "ka" (+ end-of-sentence symbols (.?! Etc.) or end-of-sentence), such as "mountain" or "beautiful", is a hard utterance in conversation. To give an impression, “ka” may be followed by a question mark (“?”), Or “ka” may be replaced with a question mark.
(2)「でしょ」を「だろ」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が形容詞類であって、かつ処理対象形態素の表記が「でしょ」であるときに、処理対象形態素「でしょ」を「だろ」に置換する。
例えば、入力文「富士山はきれいでしょう」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/きれい/でしょ/う)及び品詞(名詞/助詞/形容動詞/助動詞/助動詞)に基づいて、入力文に含まれる処理対象形態素「でしょ」を「だろ」に置換し、「でしょ」が「だろ」に置換された文「富士山はきれいだろう」を出力する。
(2) Rule for Substituting “Doshi” with “Daro” The
For example, when the input sentence “Mt. Fuji is beautiful” is input, the
また、表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「でしょ」であるときに、処理対象形態素「でしょ」を「だろ」に置換する。
In addition, the
(3)「でし」を削除し、「て」を「で」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「でし」であり、かつ後続形態素の表記が「て」であるときに、後続形態素「て」を「で」に置換し、処理対象形態素「でし」を削除する。
例えば、入力文「富士山はきれいでして」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/きれい/でし/て)及び品詞(名詞/助詞/形容動詞/助動詞/助詞)に基づいて、後続形態素「て」を「で」に置換し、処理対象形態素「でし」を削除し、「て」が「で」に置換され、「でし」が削除された文「富士山はきれいで」を出力する。
(3) Rule that deletes “deshi” and replaces “te” with “de” The
For example, when the input sentence “Mt. Fuji is beautiful” is input, the
(4)「でし」を「だっ」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「でし」であり、かつ後続形態素の表記が「た」であるときに、処理対象形態素「でし」を「だっ」に置換する。
例えば、入力文「富士山はきれいでした」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/きれい/でし/た)及び品詞(名詞/助詞/形容動詞/助動詞/助動詞)に基づいて、処理対象形態素「でし」を「だっ」に置換し、「でし」が「だっ」に置換された文「富士山はきれいだった」を出力する。
(4) Rules for Substituting “Doshi” with “Da” The
For example, when the input sentence “Mt. Fuji was beautiful” is input, the
(5)「です」を「だ」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「です」であり、かつ後続形態素の表記が「の*」(表記の先頭文字が「の」である形態素)でないときに、処理対象形態素「です」を「だ」に置換する。
例えば、入力文「富士山はきれいです」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/きれい/です)及び品詞(名詞/助詞/形容動詞/助動詞)に基づいて、処理対象形態素「です」を「だ」に置換し、「です」が「だ」に置換された文「富士山はきれいだ」を出力する。
(5) Rule for Substituting “Da” with “Da” The
For example, when the input sentence “Mt. Fuji is beautiful” is input, the
(6)「です」を「な」に置換するルール
表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類であって、かつ処理対象形態素の表記が「です」であり、かつ後続形態素の表記が「の*」(表記の先頭文字が「の」である形態素)であるときに、処理対象形態素「です」を「な」に置換する。
例えば、入力文「富士山は火山ですので」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/は/火山/です/ので)及び品詞(名詞/助詞/名詞/助動詞/助詞)に基づいて、処理対象形態素「です」を「な」に置換し、「です」が「な」に置換された文「富士山は火山なので」を出力する。
(6) Rule for replacing “is” with “na” The
For example, when the input sentence “Mt. Fuji is a volcano” is input, the
(7)活用語尾を連用形(音便形)に、「た」を「だ」に置換し、「まし」を削除するルール
表現置換部26は、「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用であり、かつ処理対象形態素の表記が「まし」であり、かつ後続形態素の表記が「た」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に変換し、後続形態素「た」を「だ」に置換し、処理対象形態素「まし」を削除する。
なお、表現置換部26は、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の連用形(音便形)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
(7) Rule that replaces the inflection ending with the continuous form (sound form), replaces “ta” with “da”, and deletes “masashi”. The
The
例えば、入力文「富士山で叫びました」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/で/叫び/まし/た)と、品詞及び動詞類の活用型(名詞/助詞/動詞:バ行五段/助動詞/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に置換し、後続形態素「た」を「だ」に置換し、処理対象形態素「まし」を削除する。そして、表現置換部26は、活用語尾が連用形(音便形)に置換され、「た」が「だ」に置換され、「まし」が削除された文「富士山で叫んだ」を出力する。
For example, when the input sentence “I screamed at Mt. Fuji” is input, the
(8)活用語尾を連用形(音便形)に置換し、「まし」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「まし」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に置換し、「まし」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の連用形(音便形)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「まし」であるときに、「まし」を削除する。
(8) A rule that replaces the inflection ending with the continuous form (sound form) and deletes “masashi” The
When “tail omission” is “none” for the verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb
On the other hand, when “tail omitted” is “present”, the
例えば、入力文「富士山に登りました」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/まし/た)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞/助動詞)とに基づいて、活用語尾を連用形(音便形)に置換し、処理対象形態素「まし」を削除する。そして、表現置換部26は、活用語尾が連用形(音便形)に置換され、「まし」が削除された文「富士山に登った」を出力する。
For example, when the input sentence “I climbed Mt. Fuji” is input, the
また、表現置換部26は、「テイル省略」が「有」の場合、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用であり、かつ処理対象形態素の表記が「まし」であり、かつ後続形態素の表記が「た」であるときに、処理対象形態素「まし」を削除する。
In addition, when “tail omission” is “present”, the
また、表現置換部26は、「テイル省略」が「有」の場合、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ動詞類の活用型がガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用であり、かつ処理対象形態素の表記が「まし」であり、かつ後続形態素の表記が「て」であるときに、処理対象形態素「まし」を削除する。
In addition, when “tail omission” is “present”, the
(9)活用語尾を連用形(音便形)に、「て」を「で」に置換し、「まし」を削除するルール
表現置換部26は、「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ動詞類の活用型がガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用であり、かつ処理対象形態素の表記が「まし」であり、かつ後続形態素の表記が「て」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に置換し、後続形態素「て」を「で」に置換し、処理対象形態素「まし」を削除する。
なお、表現置換部26は、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の連用形(音便形)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
(9) Rule that replaces the inflection ending with the continuous form (sound form), replaces “te” with “de”, and deletes “masashi”. The
The
例えば、入力文「富士山で叫びまして」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/で/叫び/まし/て)と、品詞及び動詞類の活用型(名詞/助詞/動詞:バ行五段/助動詞/助詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を連用形(音便形)に置換し、後続形態素「て」を「で」に置換し、処理対象形態素「まし」を削除する。そして、表現置換部26は、活用語尾が連用形(音便形)に置換され、「て」が「で」に置換され、「まし」が削除された文「富士山で叫んで」を出力する。
For example, when the input sentence “scream at Mt. Fuji” is input, the
(10)活用語尾を終止形に置換し、「ます」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ます」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を終止形に置換し、処理対象形態素「ます」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の終止形の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ます」であるときに、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の終止形の活用語尾を、「て」又は「で」の後に挿入し、処理対象形態素「ます」を削除する。
(10) Rule that replaces the ending form with the final form and deletes “mas” When the “tail omission” is “none” for the verb class, the
When “tail omitted” is “none” for verbs, the usage ending list corresponding to the usage type of the verbs is read from the verb usage table in the verb
On the other hand, when “tail omitted” is “present”, the
例えば、入力文「富士山に登ります」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/ます)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を終止形に置換し、処理対象形態素「ます」を削除する。そして、表現置換部26は、活用語尾が終止形に置換され、「ます」が削除された文「富士山に登る」を出力する。
For example, when the input sentence “I climb Mt. Fuji” is input, the
(11)活用語尾を未然形(オ段)に置換し、「ましょ」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ましょ」であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(オ段)に置換し、「ましょ」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(オ段)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ましょ」であるときに、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(オ段)の活用語尾を、「て」又は「で」の後に挿入し、「ましょ」を削除する。
(11) A rule that replaces the inflection ending with a blank form (o-dan) and deletes “maso” The
When “tail omission” is “none” for a verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb
On the other hand, when “tail omitted” is “present”, the
例えば、入力文「富士山に登りましょう」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/ましょ/う)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(オ段)に置換し、処理対象形態素「ましょ」を削除する。そして、表現置換部26は、活用語尾が未然形(オ段)に置換され、「ましょ」が削除された文「富士山に登ろう」を出力する。
For example, when the input sentence “Let's climb Mt. Fuji” is input, the
(12)活用語尾を命令形に置換し、「ませ」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素が無い、又は後続形態素が文末記号類(。?!等)であるときに、処理対象形態素の1つ前に出現する形態素の活用語尾を命令形に置換し、処理対象形態素「ませ」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の命令形の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素が無い、又は後続形態素が文末記号類(。?!等)であるときに、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の命令形の活用語尾を、「て」又は「で」の後に挿入し、処理対象形態素「ませ」を削除する。
(12) Rules for replacing the ending utterance with the command form and deleting “no” When the “tail omission” is “none” for the verb class, the
When “tail omitted” is “none” for a verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb
On the other hand, when “tail omitted” is “present”, the
例えば、入力文「お帰りなさいませ」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(お/帰り/なさい/ませ)と、品詞及び動詞類の活用型(接頭辞/動詞:ラ行五段/助動詞:ラ行五段/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を命令形に置換し、処理対象形態素「ませ」を削除する。そして、表現置換部26は、活用語尾が命令形に置換され、「ませ」が削除された文「お帰りなさい」を出力する。
For example, when the input sentence “Please return” is input, the
なお、「なさる」「いらっしゃる」「くださる」「おっしゃる」等、ラ行五段活用でありながら、口語体では命令形活用語尾が「い」となるものがある(「なさい」「いらっしゃい」等)。その場合、本実施の形態では「れ」ではなく「い」を用いることとする。 In addition, there are things that use the imperative ending in the colloquial style, such as “Nasaru”, “Isurusuru”, “Suru”, “Osaru”, etc., but in the colloquial style, “I” is used as an imperative inflection. In this case, “i” is used instead of “re” in this embodiment.
(13)活用語尾を未然形(ア段)に、「ん」を「ない」に置換し、「ませ」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素の表記が「ん」であり、かつ後続形態素の後に「でした」が後続しないとき(後続形態素列が「ん/でした」でないとき)に、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(ア段)に置換し、後続形態素「ん」を「ない」に置換し、処理対象形態素「ませ」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(ア段)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素の表記が「ん」であり、かつ後続形態素の後に「でした」が後続しないとき(後続形態素列が「ん/でした」でないとき)に、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(ア段)の活用語尾を「て」又は「で」の後に挿入し、後続形態素「ん」を「ない」に置換し、処理対象形態素「ませ」を削除する。
(13) A rule that replaces the inflection ending with the original form (stage A), replaces “n” with “not”, and deletes “not”. The
When “tail omission” is “none” for a verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb
On the other hand, when “tail omitted” is “present”, the
例えば、入力文「富士山に登りません」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/ませ/ん)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(ア段)に置換し、後続形態素「ん」を「ない」に置換し、処理対象形態素「ませ」を削除する。そして、表現置換部26は、活用語尾が未然形(ア段)に置換され、「ん」が「ない」に置換され、「ませ」が削除された文「富士山に登らない」を出力する。
For example, when the input sentence “I do not climb Mt. Fuji” is input, the
なお、後続形態素「ん」を「ない」に置換する処理を行わなかったとしても、日本語として文法上の問題は生じない(例:富士山に登らん)。ただし、現代の標準語(東京方言)の口語としては不自然に感じられるため、本実施の形態では後続形態素「ん」を「ない」に置換する処理を行い、活用語尾を未然形(ア段)に置換することとする。 Even if the process of replacing the subsequent morpheme “n” with “not” is not performed, there is no grammatical problem in Japanese (eg, climbing Mt. Fuji). However, because it seems unnatural as a colloquial of modern standard language (Tokyo dialect), in this embodiment, the process of replacing the subsequent morpheme “n” with “not” is performed, and the ending utterance is changed to the unfinished form (A ).
(14)活用語尾を未然形(ア段)に、「んでし」を「なかっ」に置換し、「ませ」を削除するルール
表現置換部26は、動詞類について「テイル省略」が「無」の場合、処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素の表記が「ん」であり、かつ後続形態素の後に「でした」が後続するとき(後続形態素列が「ん/でした」であるとき)に、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(ア段)に置換し、「んでし」を「なかっ」に置換し、処理対象形態素「ませ」を削除する。
なお、動詞類について「テイル省略」が「無」の場合、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(ア段)の活用語尾を取得し、処理対象形態素の1つ前に出現する形態素の活用語尾と置換する。
一方、「テイル省略」が「有」の場合、表現置換部26は、処理対象形態素の2つ前に出現する形態素の品詞の種別が動詞類であって、かつ処理対象形態素の表記が「ませ」であり、かつ後続形態素の表記が「ん」であり、かつ後続形態素の後に「でした」が後続するとき(後続形態素列が「ん/でした」であるとき)に、一段活用の活用語尾リストを動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の未然形(ア段)の活用語尾を「て」又は「で」の後に挿入し、「んでし」を「なかっ」に置換し、処理対象形態素「ませ」を削除する。
(14) A rule that replaces the inflection ending with the original form (A), replaces “Denshi” with “None”, and deletes “Not”. The
When “tail omission” is “none” for a verb class, a utilization ending list corresponding to the utilization type of the verb class is read from the verb utilization table of the verb
On the other hand, when “tail omitted” is “present”, the
例えば、入力文「富士山に登りませんでした」が入力された場合には、表現置換部26は、形態素解析部22によって得られた形態素境界(富士山/に/登り/ませ/ん/でし/た)と、品詞及び動詞類の活用型(名詞/助詞/動詞:ラ行五段/助動詞/助動詞/助動詞/助動詞)とに基づいて、処理対象形態素の1つ前に出現する形態素の活用語尾を未然形(ア段)に置換し、「んでし」を「なかっ」に置換し、処理対象形態素「ませ」を削除する。そして、表現置換部26は、活用語尾が未然形(ア段)に置換され、「んでし」が「なかっ」に置換され、「ませ」が削除された文「富士山に登らなかった」を出力する。
For example, when the input sentence “I did not climb Mt. Fuji” is input, the
上記(1)〜(14)のルールにおいて、処理対象形態素の1つ前に出現する形態素が接続助詞「て」又は「で」である場合は、処理対象形態素の1つ前に出現する形態素の代わりに、処理対象形態素より2つ前に出現する形態素(「て」又は「で」の一つ前の形態素))の品詞の種別を参照し、処理対象形態素より2つ前に出現する形態素の品詞に応じてルールを適用する。 In the rules (1) to (14) above, when the morpheme that appears one before the processing target morpheme is the connection particle “te” or “de”, the morpheme that appears one time before the processing target morpheme Instead, refer to the type of part of speech of the morpheme that appears two times before the processing target morpheme (the morpheme immediately before “te” or “de”), and the morpheme that appears two times before the processing target morpheme Apply rules according to part of speech.
出力部30は、表現置換部26によって出力された文を結果として出力する。
The
<文体変換装置の作用>
次に、本実施の形態に係る文体変換装置100の作用について説明する。文体変換装置100に、文体変換対象の文が入力されると、文体変換装置100によって、図3〜図5に示す表現置換処理ルーチンが実行される。
<Operation of style conversion device>
Next, the operation of the
まず、ステップS100において、入力部10によって、入力された文体変換対象の文を、入力文として受け付ける。
First, in step S <b> 100, the
ステップS102において、形態素解析部22によって、上記ステップS100で受け付けた入力文に対して、形態素解析を行い、形態素境界、品詞、及び動詞類の活用型を取得する。
In step S102, the
ステップS104において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、入力文の処理対象形態素の1つ前に出現する形態素の品詞の種別を判定する。入力文の処理対象形態素の1つ前に出現する形態素の品詞の種別が形容詞類である場合には、ステップS106へ進む。入力文の処理対象形態素の1つ前に出現する形態素の品詞の種別が名詞類である場合には、ステップS112へ進む。入力文の処理対象形態素の1つ前に出現する形態素の品詞の種別が動詞類である場合には、ステップS128へ進む。
なお、処理対象形態素の1つ前に出現する形態素が接続助詞「て」又は「で」である場合は、処理対象形態素の1つ前に出現する形態素の代わりに、処理対象形態素の2つ前に出現する形態素を参照して、処理対象形態素より2つ前に出現する形態素の品詞の種別が、形容詞類、名詞類、及び動詞類の何れであるかを判定する。
In step S104, the
In addition, when the morpheme that appears immediately before the processing target morpheme is the connection particle “te” or “de”, instead of the morpheme that appears before the processing target morpheme, it is two before the processing target morpheme. Referring to the morphemes appearing in, it is determined whether the type of part of speech of the morpheme that appears two times before the processing target morpheme is an adjective class, a noun class, or a verb class.
ステップS106において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、処理対象形態素の表記を判定する。処理対象形態素の表記が「です」である場合には、ステップS108へ進む。一方、処理対象形態素の表記が「でしょ」である場合には、ステップS110へ進む。
In step S106, the
ステップS108において、表現置換部26によって、入力文から処理対象形態素「です」を削除する。
In step S108, the
ステップS110において、表現置換部26によって、入力文に含まれる処理対象形態素「でしょ」を「だろ」に置換する。
In step S 110, the
ステップS112において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、処理対象形態素の後に疑問終助詞(「か」等)が後続するか否かを判定する。処理対象形態素の後に疑問終助詞(「か」等)が後続する場合には、ステップS108へ移行する。一方、処理対象形態素の後に疑問終助詞が後続しない場合には、ステップS114へ進む。
In step S112, the
ステップS114において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、処理対象形態素の表記を判定する。処理対象形態素の表記が「でしょ」である場合には、ステップS110へ進む。処理対象形態素の表記が「でし」である場合には、ステップS116へ進む。処理対象形態素の表記が「です」である場合には、ステップS122へ進む。
In step S114, the
ステップS116において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、後続形態素の表記を判定する。後続形態素の表記が「て」である場合には、ステップS118へ進む。一方、処理対象形態素の表記が「た」である場合には、ステップS120へ進む。
In step S116, the
ステップS118において、表現置換部26によって、入力文に含まれる処理対象形態素「でし」を削除し、後続形態素「て」を「で」に置換する。
In step S118, the
ステップS120において、表現置換部26によって、入力文に含まれる処理対象形態素「でし」を「だっ」に置換する。
In step S120, the
ステップS122において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、後続形態素の表記を判定する。後続形態素の表記が「の*」以外である場合には、ステップS124へ進む。一方、処理対象形態素の表記が「の*」である場合には、ステップS126へ進む。
In step S122, the
ステップS124において、表現置換部26によって、入力文に含まれる処理対象形態素「です」を「だ」に置換する。
In step S124, the
ステップS126において、表現置換部26によって、入力文に含まれる処理対象形態素「です」を「な」に置換する。
In step S 126, the
ステップS128において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類と処理対象形態素との間で、「テイル」省略がされているか否かを判定する。「テイル」省略がされている場合には、ステップS130へ進む。一方、「テイル」省略がされていない場合には、ステップS132へ進む。
In step S128, the
ステップS130において、表現置換部26によって、動詞活用表データベース24の動詞活用表の中から一段活用の活用語尾リストを読み込み、一段活用の活用語尾リスト内の活用語尾を取得する。
In step S130, the
ステップS132において、表現置換部26によって、動詞類の活用型に応じた活用語尾リストを、動詞活用表データベース24の動詞活用表の中から読み込み、当該活用語尾リスト内の活用語尾を取得する。
In step S132, the
ステップS134において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、処理対象形態素の表記を判定する。処理対象形態素の表記が「まし」である場合には、ステップS136へ進む。処理対象形態素の表記が「ます」である場合には、ステップS148へ進む。処理対象形態素の表記が「ましょ」である場合には、ステップS150へ進む。処理対象形態素の表記が「ませ」である場合には、ステップS152へ進む。
In step S134, the
ステップS136において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、後続形態素の表記を判定する。後続形態素の表記が「た」である場合には、ステップS138へ進む。後続形態素の表記が「て」である場合には、ステップS144へ進む。
In step S136, the
ステップS138において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類の活用型を判定する。動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用である場合には、ステップS139へ進む。一方、動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、及びマ行五段活用でない場合には、ステップS142へ進む。
In step S138, the
ステップS139において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類と処理対象形態素との間で、「テイル」省略がされているか否かを判定する。「テイル」省略がされている場合には、ステップS142へ進む。一方、「テイル」省略がされていない場合には、ステップS140へ進む。
In step S139, the
ステップS140において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の連用形(音便形)の活用語尾に基づいて、入力文の活用語尾を連用形(音便形)に変換し、後続形態素「た」を「だ」に置換し、処理対象形態素「まし」を削除する。
In step S140, based on the utilization ending of the continuous form (sound form) in the utilization ending list acquired in step S130 or S132 by the
ステップS142において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の連用形(音便形)の活用語尾に基づいて、入力文の活用語尾を連用形(音便形)に置換し、処理対象形態素「まし」を削除する。
In step S142, based on the utilization ending of the continuous form (sound form) in the utilization ending list acquired in step S130 or step S132 by the
ステップS144において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類の活用型を判定する。動詞類の活用型がガ行五段活用、ナ行五段活用、バ行五段活用、又はマ行五段活用である場合には、ステップS145へ進む。一方、動詞類の活用型が、ガ行五段活用、ナ行五段活用、バ行五段活用、及びマ行五段活用でない場合には、ステップS142へ進む。
In step S144, the
ステップS145において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、動詞類と処理対象形態素との間で、「テイル」省略がされているか否かを判定する。「テイル」省略がされている場合には、ステップS142へ進む。一方、「テイル」省略がされていない場合には、ステップS146へ進む。
In step S145, the
ステップS146において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の連用形(音便形)の活用語尾に基づいて、入力文の活用語尾を連用形(音便形)に置換し、後続形態素「て」を「で」に置換し、処理対象形態素「まし」を削除する。
In step S146, the
ステップS148において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の終止形の活用語尾に基づいて、入力文の活用語尾を終止形に置換し、処理対象形態素「ます」を削除する。
In step S148, the
ステップS150において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の未然形(オ段)の活用語尾に基づいて、入力文の活用語尾を未然形(オ段)に置換し、処理対象形態素「ましょ」を削除する。
In step S150, the
ステップS152において、表現置換部26によって、上記ステップS102で取得された形態素解析結果に基づいて、後続形態素を判定する。後続形態素が無い、又は後続形態素が文末記号類(。?!等)である場合には、ステップS154へ進む。一方、処理対象形態素の表記が「ん」である場合には、ステップS156へ進む。
In step S152, the
ステップS154において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の命令形の活用語尾に基づいて、入力文の活用語尾を命令形に置換し、処理対象形態素「ませ」を削除する。
In step S154, the
ステップS156において、表現置換部26によって、後続形態素の後に「でした」が後続するか否かを判定する。後続形態素の後に「でした」が後続する場合には、ステップS160へ進む。一方、後続形態素の後に「でした」が後続しない場合には、ステップS158へ進む。
In step S156, the
ステップS158において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の未然形(ア段)の活用語尾に基づいて、入力文の活用語尾を未然形(ア段)に置換し、後続形態素「ん」を「ない」に置換し、処理対象形態素「ませ」を削除する。
In step S158, the
ステップS160において、表現置換部26によって、上記ステップS130又はステップS132で取得した活用語尾リスト内の未然形(ア段)の活用語尾に基づいて、入力文の活用語尾を未然形(ア段)に置換し、「んでし」を「なかっ」に置換し、処理対象形態素「ませ」を削除する。
In step S160, the
ステップS162において、上記ステップS108、S110、S118、S120、S124、S126、S140、S142、S146、S148、S150、S154、S158、及びS160の何れかのステップで変換された文を、結果として出力して、表現置換処理ルーチンを終了する。 In step S162, the sentence converted in any of the steps S108, S110, S118, S120, S124, S126, S140, S142, S146, S148, S150, S154, S158, and S160 is output as a result. Then, the expression replacement processing routine is completed.
以上説明したように、本実施の形態に係る文体変換装置によれば、敬体表現である処理対象形態素より1つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、後続形態素が無いこと、又は後続形態素が文末記号であるか否かとの少なくとも1つに応じて、敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、入力文に含まれる敬体表現を常体表現に変換することにより、敬体表現を常体表現に精度よく変換することができる。 As described above, according to the stylistic conversion device according to the present embodiment, the part-of-speech or inflection type of the morpheme that appears immediately before the processing target morpheme that is the honorific expression, and the processing target morpheme follow. The morpheme to be processed is a regular expression according to at least one of the following morpheme or subsequent morpheme string notation, absence of a subsequent morpheme, or whether the subsequent morpheme is a sentence ending symbol. Based on a predetermined rule for conversion, the honorific expression included in the input sentence is converted into the normal expression, so that the honorific expression can be accurately converted into the normal expression.
また、本実施の形態に係る文体変換装置によれば、常体表現と敬体表現とが入り混じった文書を、自動的に常体表現に統一することが可能となる。
本実施の形態に係る文体変換装置を文書校正に適用すれば、文書の文体を統一する支援をすることができる。また、本実施の形態に係る文体変換装置を、人間と対話をするコンピュータ(対話システム)の発話生成に適用すれば、システムの発話データベースを全て常体に統一することができ、システムの話し方(文体)に一貫性を持たせることができる。
Further, according to the stylistic conversion device according to the present embodiment, it is possible to automatically unify a document in which normal expression and respected expression are mixed into normal expression.
If the stylistic conversion device according to the present embodiment is applied to document proofreading, it is possible to support unifying the style of the document. Moreover, if the stylistic conversion device according to the present embodiment is applied to utterance generation of a computer (dialogue system) that interacts with humans, the system utterance database can be unified all the time, and the system's way of speaking ( Can be made consistent.
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。 Note that the present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.
また、文体変換装置100は、動詞活用表データベース24を備えている場合について説明したが、例えば動詞活用表データベース24が文体変換装置100の外部装置に設けられ、文体変換装置100は、外部装置と通信手段を用いて通信することにより、動詞活用表データベース24を参照するようにしてもよい。
Moreover, although the
上述の文体変換装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
The above-described
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。 In the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.
10 入力部
20 演算部
22 形態素解析部
24 動詞活用表データベース
26 表現置換部
30 出力部
100 文体変換装置
DESCRIPTION OF
Claims (3)
敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、前記後続形態素が無いこと、又は前記後続形態素が文末記号であるか否かとの少なくとも1つに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換する表現置換手段と、を含み
前記ルールは、
(1)「です」を削除するルール
(2)「でしょ」を「だろ」に置換するルール
(3)「でし」を削除し、「て」を「で」に置換するルール
(4)「でし」を「だっ」に置換するルール
(5)「です」を「だ」に置換するルール
(6)「です」を「な」に置換するルール
(7)活用語尾を連用形(音便形)に、「た」を「だ」に置換し、「まし」を削除するルール
(8)活用語尾を連用形(音便形)に置換し、「まし」を削除するルール
(9)活用語尾を連用形(音便形)に、「て」を「で」に置換し、「まし」を削除するルール
(10)活用語尾を終止形に置換し、「ます」を削除するルール
(11)活用語尾を未然形(オ段)に置換し、「ましょ」を削除するルール
(12)活用語尾を命令形に置換し、「ませ」を削除するルール
(13)活用語尾を未然形(ア段)に、「ん」を「ない」に置換し、「ませ」を削除するルール
(14)活用語尾を未然形(ア段)に、「んでし」を「なかっ」に置換し、「ませ」を削除するルール
を含むことを特徴とする文体変換装置。 An input means for receiving an input sentence;
Part-of-speech or inflection type of a morpheme that appears one or two times before a processing target morpheme that is a honorific expression, and a notation of a subsequent morpheme or subsequent morpheme string that appears following the processing target morpheme, the subsequent morpheme Based on a predetermined rule for converting the processing target morpheme that is the honorific expression into a normal expression according to at least one of whether or not the subsequent morpheme is a sentence ending symbol And an expression replacement means for converting the honorific expression included in the input sentence into a regular expression, and the rule is:
(1) Rule to delete “is” (2) Rule to replace “Doshi” with “Daro” (3) Rule to delete “Doshi” and replace “te” with “de” (4) “ Rules for replacing "Dashi" with "Da" (5) Rules for replacing "Da" with "Da" (6) Rules for substituting "Da" with "Na" (7) Consecutive endings (sound form) ), A rule that replaces “ta” with “da”, and deletes “masashi” (8) a rule that replaces the inflection ending with the consecutive form (voice form), and a rule that deletes “masi” (9) the inflection ending A rule that replaces “te” with “de” and deletes “masashi” in the continuous form (sound flight form) (10) A rule that replaces the ending ending with the ending form and deletes “mas” (11) ending ending Is a rule that replaces the original form (o-dan) and deletes “Mashi” (12) A rule that replaces the inflection ending with an instruction form and deletes “not” (13) Rule that replaces the inflection ending with the original form (A column), replaces “N” with “None”, and deletes “N” (14) The ending ending item with the original form (A column), “No” A stylistic conversion device including a rule that replaces “” and deletes “no”.
前記入力手段が、入力文を受け付けるステップと、
前記表現置換手段が、敬体表現である処理対象形態素より1つ前又は2つ前に出現する形態素の、品詞又は活用型と、前記処理対象形態素に後続して出現する後続形態素若しくは後続形態素列の表記、前記後続形態素が無いこと、又は前記後続形態素が文末記号であるか否かとの少なくとも1つに応じて、前記敬体表現である処理対象形態素を常体表現に変換するための予め定められたルールに基づいて、前記入力文に含まれる敬体表現を常体表現に変換するステップと、を含み、
前記ルールは、
(1)「です」を削除するルール
(2)「でしょ」を「だろ」に置換するルール
(3)「でし」を削除し、「て」を「で」に置換するルール
(4)「でし」を「だっ」に置換するルール
(5)「です」を「だ」に置換するルール
(6)「です」を「な」に置換するルール
(7)活用語尾を連用形(音便形)に、「た」を「だ」に置換し、「まし」を削除するルール
(8)活用語尾を連用形(音便形)に置換し、「まし」を削除するルール
(9)活用語尾を連用形(音便形)に、「て」を「で」に置換し、「まし」を削除するルール
(10)活用語尾を終止形に置換し、「ます」を削除するルール
(11)活用語尾を未然形(オ段)に置換し、「ましょ」を削除するルール
(12)活用語尾を命令形に置換し、「ませ」を削除するルール
(13)活用語尾を未然形(ア段)に、「ん」を「ない」に置換し、「ませ」を削除するルール
(14)活用語尾を未然形(ア段)に、「んでし」を「なかっ」に置換し、「ませ」を削除するルール
を含むことを特徴とする文体変換方法。 A stylistic conversion method in a stylistic conversion device including an input means and an expression replacement means,
The input means accepting an input sentence;
The part-of-speech or inflection type of the morpheme that appears one or two times before the processing target morpheme that is the honorific expression, and the subsequent morpheme or subsequent morpheme sequence that appears after the processing target morpheme In accordance with at least one of the following notation, the absence of the succeeding morpheme, or whether the succeeding morpheme is a sentence ending symbol or not. Based on the determined rule, converting the honorific expression included in the input sentence into a regular expression,
The rule is
(1) Rule to delete “is” (2) Rule to replace “Doshi” with “Daro” (3) Rule to delete “Doshi” and replace “te” with “de” (4) “ Rules for replacing "Dashi" with "Da" (5) Rules for replacing "Da" with "Da" (6) Rules for substituting "Da" with "Na" (7) Consecutive endings (sound form) ), A rule that replaces “ta” with “da”, and deletes “masashi” (8) a rule that replaces the inflection ending with the consecutive form (voice form), and a rule that deletes “masi” (9) the inflection ending A rule that replaces “te” with “de” and deletes “masashi” in the continuous form (sound flight form) (10) A rule that replaces the ending ending with the ending form and deletes “mas” (11) ending ending Is a rule that replaces the original form (o-dan) and deletes “Mashi” (12) A rule that replaces the inflection ending with an instruction form and deletes “not” (13) Rule that replaces the inflection ending with the original form (A column), replaces “N” with “None”, and deletes “N” (14) The ending ending item with the original form (A column), “No” The method of stylistic conversion is characterized by including a rule that replaces “” and deletes “No”.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017009078A JP6472466B2 (en) | 2017-01-23 | 2017-01-23 | Stylistic conversion device, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017009078A JP6472466B2 (en) | 2017-01-23 | 2017-01-23 | Stylistic conversion device, method, and program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014227573A Division JP6116014B2 (en) | 2014-11-07 | 2014-11-07 | Stylistic conversion device, method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017068879A true JP2017068879A (en) | 2017-04-06 |
JP6472466B2 JP6472466B2 (en) | 2019-02-20 |
Family
ID=58492721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017009078A Active JP6472466B2 (en) | 2017-01-23 | 2017-01-23 | Stylistic conversion device, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6472466B2 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03248264A (en) * | 1990-02-26 | 1991-11-06 | Nippon Telegr & Teleph Corp <Ntt> | Japanese-language sentence elaborating device |
JPH03259372A (en) * | 1990-03-09 | 1991-11-19 | Matsushita Electric Ind Co Ltd | Method and device for processing style |
JPH05314171A (en) * | 1992-05-07 | 1993-11-26 | Nippon Telegr & Teleph Corp <Ntt> | Japanese descriptive sentence/colloquial sentence conversion system |
JP2003022266A (en) * | 2001-07-06 | 2003-01-24 | Communication Research Laboratory | Text word/style conversion system and text word/style conversion processing program |
JP2003022264A (en) * | 2001-07-06 | 2003-01-24 | Communication Research Laboratory | System for integrating language conversion processing |
JP2012194775A (en) * | 2011-03-16 | 2012-10-11 | Fujitsu Ltd | Information processor control method, control program and information processor |
-
2017
- 2017-01-23 JP JP2017009078A patent/JP6472466B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03248264A (en) * | 1990-02-26 | 1991-11-06 | Nippon Telegr & Teleph Corp <Ntt> | Japanese-language sentence elaborating device |
JPH03259372A (en) * | 1990-03-09 | 1991-11-19 | Matsushita Electric Ind Co Ltd | Method and device for processing style |
JPH05314171A (en) * | 1992-05-07 | 1993-11-26 | Nippon Telegr & Teleph Corp <Ntt> | Japanese descriptive sentence/colloquial sentence conversion system |
JP2003022266A (en) * | 2001-07-06 | 2003-01-24 | Communication Research Laboratory | Text word/style conversion system and text word/style conversion processing program |
JP2003022264A (en) * | 2001-07-06 | 2003-01-24 | Communication Research Laboratory | System for integrating language conversion processing |
JP2012194775A (en) * | 2011-03-16 | 2012-10-11 | Fujitsu Ltd | Information processor control method, control program and information processor |
Non-Patent Citations (3)
Title |
---|
安達 康昭 山本 和英: "特徴的冗長表現に着目した国会会議録要約", 情報処理学会研究報告, vol. 第2003巻第98号, JPN6018012525, 30 September 2003 (2003-09-30), JP, pages 107 - 114, ISSN: 0003775242 * |
山上勝義 外3名: "文体変換テキスト音声合成システムの開発", 日本音響学会2000年 春季研究発表会講演論文集, JPN6018012524, 15 March 2000 (2000-03-15), JP, pages 317 - 318, ISSN: 0003775241 * |
齋藤 彰弘 外3名: "意外性のある質問応答システムのための発話文生成手法", 第67回 言語・音声理解と対話処理研究会資料 (SIG−SLUD−B203), JPN6018012522, 5 December 2013 (2013-12-05), JP, pages 1 - 6, ISSN: 0003775240 * |
Also Published As
Publication number | Publication date |
---|---|
JP6472466B2 (en) | 2019-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7860719B2 (en) | Disfluency detection for a speech-to-speech translation system using phrase-level machine translation with weighted finite state transducers | |
Pennell et al. | Normalization of text messages for text-to-speech | |
Hadni et al. | Hybrid part-of-speech tagger for non-vocalized Arabic text | |
JP6778655B2 (en) | Word concatenation discriminative model learning device, word concatenation detection device, method, and program | |
Rasooli et al. | Unsupervised morphology-based vocabulary expansion | |
Chennoufi et al. | Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization | |
JP5911931B2 (en) | Predicate term structure extraction device, method, program, and computer-readable recording medium | |
JP6472466B2 (en) | Stylistic conversion device, method, and program | |
JP6116014B2 (en) | Stylistic conversion device, method, and program | |
JP2016218848A (en) | Language expression rewriting apparatus, method and program | |
JP6592378B2 (en) | Rewriting device, method, and program | |
KR102182248B1 (en) | System and method for checking grammar and computer program for the same | |
JP2014191484A (en) | Sentence end expression conversion device, method and program | |
Mammadov et al. | Part-of-speech tagging for azerbaijani language | |
CN113158693A (en) | Uygur language keyword generation method and device based on Chinese keywords, electronic equipment and storage medium | |
Lui et al. | Recovering casing and punctuation using conditional random fields | |
JP6058563B2 (en) | Model learning device, filter device, method, and program | |
Li et al. | The study of comparison and conversion about traditional Mongolian and Cyrillic Mongolian | |
JP2019087058A (en) | Artificial intelligence apparatus for specifying omission in sentence | |
KR101604553B1 (en) | Apparatus and method for generating pseudomorpheme-based speech recognition units by unsupervised segmentation and merging | |
JP6325789B2 (en) | Translation apparatus and translation program | |
Rodrigues et al. | Arabic data science toolkit: An api for arabic language feature extraction | |
Mahanta et al. | Entity recognition in assamese text | |
Khorsi et al. | Unsupervised detection of morpheme boundaries | |
Effertz | Creating Gender Analyzing Contemporary Loanwords and Gender Assignment in Faroese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180410 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20180511 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180605 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20180605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180803 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6472466 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |