JP2022029869A - Program, device and method for creating dialog scenario with verbs replaced so as to correspond to character attribute - Google Patents
Program, device and method for creating dialog scenario with verbs replaced so as to correspond to character attribute Download PDFInfo
- Publication number
- JP2022029869A JP2022029869A JP2020133426A JP2020133426A JP2022029869A JP 2022029869 A JP2022029869 A JP 2022029869A JP 2020133426 A JP2020133426 A JP 2020133426A JP 2020133426 A JP2020133426 A JP 2020133426A JP 2022029869 A JP2022029869 A JP 2022029869A
- Authority
- JP
- Japan
- Prior art keywords
- verb
- synonymous
- character attribute
- utterance
- dialogue scenario
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 7
- 230000006855 networking Effects 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 abstract 2
- 241000209094 Oryza Species 0.000 description 29
- 235000007164 Oryza sativa Nutrition 0.000 description 29
- 235000009566 rice Nutrition 0.000 description 29
- 238000010586 diagram Methods 0.000 description 10
- 235000016496 Panda oleosa Nutrition 0.000 description 6
- 240000000220 Panda oleosa Species 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、ユーザと対話するエージェントの対話シナリオを作成する技術に関する。 The present invention relates to a technique for creating a dialogue scenario of an agent interacting with a user.
スマートフォンやタブレット端末、ロボットを用いて、ユーザに対して自然に対話する対話システムが普及している。コンピュータグラフィックスのエージェントが、ディスプレイに表示され、ユーザに対して音声やテキストで対話する。エージェントは、ユーザから見て対話可能な1人の人物として認識でき、ユーザの状況や、趣味趣向、感情に応じた対話を成立させる。
エージェントは、人物のプロフィールと同様に、個性的なキャラクタ属性(年齢、性別、出身地等)を有する。ユーザは、例えば自らが好むキャラクタ属性のエージェントと対話することによって、より親近感を持つことができる。
Dialogue systems that naturally interact with users using smartphones, tablet terminals, and robots have become widespread. A computer graphics agent appears on the display and interacts with the user by voice or text. The agent can be recognized as one person who can interact with the user, and establishes a dialogue according to the user's situation, hobbies, and emotions.
Agents have unique character attributes (age, gender, hometown, etc.) as well as a person's profile. The user can have a more intimate feeling, for example, by interacting with an agent having a character attribute that he / she likes.
図1は、エージェントとの対話によって、ユーザが抱く違和感を表す説明図である。 FIG. 1 is an explanatory diagram showing a sense of incongruity that a user feels through dialogue with an agent.
図1(a)によれば、20代・女性のキャラクタ属性のエージェントが、以下のようにユーザと対話をしている。
ユーザ :「夜、ご飯どうするの?」
エージェント:「炒飯を食べるよ」
ユーザ :「よく聞く音楽って何ですか?」
エージェント:「KANAを聴くよ」
According to FIG. 1 (a), an agent with a character attribute of a woman in her twenties has a dialogue with a user as follows.
User: "What do you do with rice at night?"
Agent: "I'll eat fried rice."
User: "What is the music you listen to often?"
Agent: "Listen to KANA"
これに対し、図1(b)によれば、10代・男性のキャラクタ属性のエージェントが、図1(a)と同じ対話シナリオを用いて、同じようにユーザと対話している。
ユーザ :「夜、ご飯どうするの?」
エージェント:「炒飯を食べるよ」
ユーザ :「よく聞く音楽って何ですか?」
エージェント:「KANAを聴くよ」
この場合、ユーザは、10代・男性のキャラクタ属性のエージェントと対話しているにも拘わらず、例えば「食べるよ」のように発話をすることに違和感を抱いてしまう。10代・男性であれば、荒っぽい発話をする場合が多いためである。
On the other hand, according to FIG. 1 (b), a teenage / male character attribute agent interacts with the user in the same manner using the same dialogue scenario as in FIG. 1 (a).
User: "What do you do with rice at night?"
Agent: "I'll eat fried rice."
User: "What is the music you listen to often?"
Agent: "Listen to KANA"
In this case, the user feels uncomfortable to speak, for example, "I'll eat", even though he / she is interacting with an agent having a character attribute of a teenager / male. This is because teenagers and men often make rough utterances.
そのために、エージェントの対話シナリオは、一般的に、キャラクタ属性に合わせて人手で作成する必要がある。人手で作成することによって、キャラクタ属性に応じた個性を感じるエージェントを作り込むことができる。しかしながら、多様なエージェントの対話シナリオを人手で作成するには、コスト的な問題が生じる。 Therefore, the agent dialogue scenario generally needs to be manually created according to the character attribute. By creating it manually, it is possible to create an agent that feels individuality according to the character attributes. However, there is a cost problem in manually creating dialogue scenarios for various agents.
従来、所望のキャラクタ属性のエージェントに合わせて、発話文の各文節を自動的に書き換える技術がある(例えば特許文献1参照)。この技術によれば、年代・性別などのキャラクタ属性に応じて、人手で作成された発話の「書き換え規則集」を参照する。
例えば、50代・男性のキャラクタ属性の対話シナリオ「ゴルフが好きだな」から、10代・女性のキャラクタ属性の対話シナリオを作成する際に、「な」を「よ」と書き換える。これによって、10代・女性のキャラクタ属性の対話シナリオとして「ゴルフが好きだよ」を作成する。
一般に、ゴルフは、50代・男性に人気のスポーツである。そのために、50代・男性のエージェントが、「ゴルフが好きだな」と発話することには全く違和感がない。しかしながら、10代・女性のエージェントが、「ゴルフが好きだよ」と発話することには違和感がある。一般的な10代・女性が発話する内容ではないためである。
Conventionally, there is a technique for automatically rewriting each phrase of an utterance sentence according to an agent having a desired character attribute (see, for example, Patent Document 1). According to this technique, a "rewriting rule collection" of utterances created by hand is referred to according to character attributes such as age and gender.
For example, when creating a dialogue scenario with a character attribute of a teenager / woman from the dialogue scenario "I like golf" with a character attribute of a man in his 50s, "na" is rewritten as "yo". This creates "I like golf" as a dialogue scenario for teenage and female character attributes.
In general, golf is a popular sport for men in their 50s. Therefore, there is no sense of discomfort when a male agent in his 50s says, "I like golf." However, it feels strange for a teenage female agent to say, "I like golf." This is because it is not the content spoken by general teenagers and women.
これに対して、対話シナリオの発話文に含まれる名詞を、所望のキャラクタ属性に相応しい名詞に置換する技術がある(例えば非特許文献1参照)。この技術によれば、以下のステップを実行することによって、キャラクタ属性に合わせた対話シナリオを作成する。
(S1)キャラクタ属性(例えば20代女性、50代男性など)を指定する。
(S2)対話シナリオにおける当該キャラクタの発話文に含まれる名詞について、当該名詞の類似候補をWikipedia(登録商標)から抽出する。
(S3)抽出された類似候補の中から、指定されたキャラクタ属性と同じキャラクタ属性のSNSユーザの投稿文を抽出する。
(S4)当該SNSユーザの投稿文の中で、特徴的に出現する名詞を1つ決定する。
(S5)対話シナリオにおける当該キャラクタの発話文に含まれる当該名詞を、S4で決定された名詞に置換する。
例えば、20代女性のキャラクタ属性の対話シナリオの発話文「私はKANAをよく聴きます」に対して、50代男性のキャラクタ属性の対話シナリオの発話文「私はHAMADAをよく聴きます」と書き換えることができる。
On the other hand, there is a technique of replacing a noun included in an utterance sentence of a dialogue scenario with a noun suitable for a desired character attribute (see, for example, Non-Patent Document 1). According to this technique, a dialogue scenario tailored to a character attribute is created by performing the following steps.
(S1) A character attribute (for example, a woman in her twenties, a man in her fifties, etc.) is specified.
(S2) With respect to the noun included in the utterance sentence of the character in the dialogue scenario, similar candidates of the noun are extracted from Wikipedia (registered trademark).
(S3) From the extracted similar candidates, the posted text of the SNS user having the same character attribute as the specified character attribute is extracted.
(S4) One noun that appears characteristically in the posted sentence of the SNS user is determined.
(S5) The noun included in the utterance sentence of the character in the dialogue scenario is replaced with the noun determined in S4.
For example, the utterance sentence "I often listen to KANA" in the dialogue scenario of the character attribute of a woman in her twenties is rewritten as the utterance sentence "I often listen to HAMADA" in the dialogue scenario of the character attribute of a man in her fifties. be able to.
しかしながら、例えば非特許文献1に記載の技術のように名詞の置換だけでは、ユーザは、その対話シナリオの発話文に違和感を抱く場合がある。
例えば「KANA」は、20代・女性に人気のあるアーティストであり、「HAMADA」は50代・男性に人気のあるアーティストであるとする。
このとき、20代・女性のキャラクタ属性のエージェントの発話文として、「私のKANAのCDをパクられた」があるとする。この発話に含まれる名詞を、非特許文献1に記載の技術によって、50代・男性用のキャラクタの発話文に置換するとする。ここでは、20代・女性のキャラクタの発話文に含まれる「KANA」が、50代・男性のキャラクタに適した「HAMADA」に置換される。そうすると、「私のHAMADAのCDをパクられた」という発話文に置換されることとなる。
しかしながら、書き換えた発話文の動詞「パクる」は若年層によく使われる言葉であり、50代男性を特徴付ける発話としては違和感がある。即ち、発話文に含まれる動詞が、キャラクタ属性に合った動詞に置換されていないために、キャラクタ表現としては違和感が残る。
However, for example, as in the technique described in
For example, "KANA" is an artist popular with women in their twenties, and "HAMADA" is an artist popular with men in their fifties.
At this time, it is assumed that there is "I was struck by my KANA CD" as an utterance sentence of an agent with a character attribute of a woman in her twenties. It is assumed that the noun included in this utterance is replaced with the utterance sentence of a character for men in their 50s by the technique described in Non-Patent
However, the verb "pakuru" in the rewritten utterance sentence is a word often used by young people, and it feels strange as an utterance that characterizes a man in his 50s. That is, since the verb included in the utterance sentence is not replaced with the verb that matches the character attribute, a sense of incongruity remains as a character expression.
これに対し、本願発明者らは、対話シナリオの中で単に名詞や文節を置換しても、そのキャラクタ属性に基づく人物の特徴を表すことにはならない、のではないかと考えた。実は、そのキャラクタ属性に基づく人物が、実際に発話することが想起される「動詞」こそ、そのキャラクタ属性に基づく人物の特徴を最も表すのではないか、と考えた。 On the other hand, the inventors of the present application thought that simply replacing a noun or a phrase in a dialogue scenario would not represent the characteristics of a person based on the character attribute. In fact, I thought that the "verb" that the person based on the character attribute is reminded to actually speak might be the most representative of the characteristics of the person based on the character attribute.
また、例えばWikipedia(登録商標)におけるページは名詞が大多数を占めており、動詞に関連する記事が少ない。そのため、動詞の置換候補が少ないという問題もある。例えばカテゴリ「動詞」を見ると、動詞の記事が47記事しかない。そのために、単にWikipediaの動詞を参照しても、対話シナリオの発話文に含まれる動詞を、キャラクタ属性に応じた動詞に置換することは極めて難しい。 Also, for example, pages on Wikipedia (registered trademark) are dominated by nouns, and there are few articles related to verbs. Therefore, there is also a problem that there are few verb replacement candidates. For example, looking at the category "verbs", there are only 47 articles about verbs. Therefore, it is extremely difficult to replace the verb contained in the utterance sentence of the dialogue scenario with the verb corresponding to the character attribute by simply referring to the verb of Wikipedia.
そこで、本発明は、キャラクタ属性に応じた動詞に置換した対話シナリオを作成するプログラム、装置及び方法を提供することを目的とする。 Therefore, an object of the present invention is to provide a program, a device, and a method for creating a dialogue scenario in which a verb is replaced according to a character attribute.
本発明のプログラムによれば、
キャラクタ属性毎に、対話シナリオを蓄積した対話シナリオ蓄積手段と、
キャラクタ属性毎に、複数のユーザにおける複数の投稿文を蓄積する投稿文蓄積手段と、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された発話動詞における意義素を決定し、意義素を同一とする複数の類義動詞を対応付ける意義素決定手段と、
第2キャラクタ属性に基づくユーザの投稿文を用いて、同一の意義素における複数の類義動詞の中で出現頻度が最も偏る類義動詞を、特徴類義動詞として選択する特徴類義動詞選択手段と、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された当該発話動詞を、特徴類義動詞に置換して、第2キャラクタ属性の対話シナリオの発話文とする動詞置換手段と
してコンピュータを機能させることを特徴とする。
According to the program of the present invention
Dialogue scenario storage means that accumulates dialogue scenarios for each character attribute,
Post-sentence storage means for accumulating multiple posts by multiple users for each character attribute,
Meaning element determination means for determining the meaning element in the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute, and associating a plurality of synonymous verbs with the same meaning element.
Characteristic synonymous verb selection means for selecting a synonymous verb whose appearance frequency is most biased among multiple synonymous verbs in the same meaning element as a characteristic synonymous verb using a user's post based on the second character attribute. When,
Replacing the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute with a characteristic verb, and making the computer function as a verb replacement means to be the utterance sentence of the dialogue scenario of the second character attribute. It is characterized by.
本発明のプログラムにおける他の実施形態によれば、
意義素決定手段は、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された発話動詞について、複数の意義素が決定された際に、
類義語コーパスを用いて、意義素毎に、当該意義素を同一とする複数の類義動詞を検索し、
第1キャラクタ属性に基づくユーザの投稿文の中で、意義素毎に各類義動詞の出現頻度を計数し、
各類義動詞の出現頻度が最も高い意義素に決定する
ようにコンピュータを機能させることも好ましい。
According to other embodiments in the program of the invention
Meaning factor determination means
When multiple meanings are determined for the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute,
Using the synonym corpus, search for multiple synonymous verbs that have the same meaning for each meaning element.
In the user's post based on the first character attribute, the frequency of appearance of each synonymous verb is counted for each meaning element, and
It is also preferable to make the computer function so as to determine the meaning element having the highest frequency of appearance of each synonymous verb.
本発明のプログラムにおける他の実施形態によれば、
意義素決定手段は、
第1キャラクタ属性に基づく対話シナリオの発話文から、係り受け関係となる名詞と動詞とを抽出する品詞抽出手段と、
類義語コーパスを用いて、意義素毎に、係り受け動詞に類似する類義動詞を検索する類義動詞検索手段と、
第1キャラクタ属性に基づくユーザの投稿文の中から、係り受け名詞と各類義動詞との共起頻度を検索し、各類義動詞の共起頻度が最も高い意義素を決定する共起頻度検索手段と
してコンピュータを機能させることも好ましい。
According to other embodiments in the program of the invention
Meaning factor determination means
Part-of-speech extraction means for extracting nouns and verbs that are dependent on each other from the utterance sentences of the dialogue scenario based on the first character attribute.
A synonym verb search method for searching for synonymous verbs similar to dependent verbs for each meaning element using a synonym corpus,
The co-occurrence frequency of searching the co-occurrence frequency of the dependent noun and each synonymous verb from the user's post based on the first character attribute, and determining the co-occurrence element with the highest co-occurrence frequency of each synonymous verb. It is also preferable to make the computer function as a search means.
本発明のプログラムにおける他の実施形態によれば、
特徴類義動詞選択手段は、
以下のように、赤池情報量規準(AIC:Akaike's Information Criterion)を用いて、キャラクタ属性P1に対する類義動詞P2の評価値V(P1,P2)を算出し、当該評価値V(P1,P2)が所定閾値以上となる、又は、当該評価値V(P1,P2)が大きいものから順に所定数となる、類義動詞P2を検出対象とする
p11:キャラクタ属性P1のユーザが、類義動詞P2に関する投稿文を投稿した数
p12:キャラクタ属性P1のユーザが、類義動詞P2以外の投稿文を投稿した数
p21:キャラクタ属性P1以外のユーザが、類義動詞P2に関する投稿文を投稿した数
p22:キャラクタ属性P1以外のユーザが、類義動詞P2以外の投稿文を投稿した数
p11+p12+p21+p22=全てのユーザが、投稿文を投稿した数
MLL_IM(P1,P2)=(p11+p12) log(p11+p12)
+(p11+p21) log(p11+p21)
+(p21+p22) log(p21+p22)
+(p12+p22) log(p12+p22)-2N log N
MLL_DM(P1,P2)=p11 log p11+p12 log p12+p21 log p21+p22 log p22-N log N
但し、N=p11+p12+p21+p22
AIC_IM(P1,P2)=-2 × MLL_IM(P1,P2) + 2×2
AIC_IM(P1,P2):キャラクタ属性P1と類義動詞P2との組の従属AIC
AIC_DM(P1,P2)=-2 × MLL_DM(P1,P2) + 2×3
AIC_DM(P1,P2):キャラクタ属性P1と類義動詞P2との組の独立AIC
V(P1,P2)=AIC_IM(P1,P2) - AIC_DM(P1,P2)
ようにコンピュータを機能させることも好ましい。
According to other embodiments in the program of the invention
Characteristic verb selection means
As shown below, using the Akaike's Information Criterion (AIC), the evaluation value V (P1, P2) of the synonymous verb P2 for the character attribute P1 is calculated, and the evaluation value V (P1, P2). The synonymous verb P2 whose evaluation value V (P1, P2) is greater than or equal to the predetermined threshold or whose evaluation value V (P1, P2) is the largest is the predetermined number.
p11: The number of posts related to the synonymous verb P2 by the user of the character attribute P1.
p12: The number of posted sentences other than the synonymous verb P2 by the user of the character attribute P1.
p21: The number of posts related to the synonymous verb P2 by users other than the character attribute P1.
p22: The number of posted sentences other than the synonymous verb P2 by users other than the character attribute P1.
p11 + p12 + p21 + p22 = Number of posts posted by all users
MLL_IM (P1, P2) = (p11 + p12) log (p11 + p12)
+ (p11 + p21) log (p11 + p21)
+ (p21 + p22) log (p21 + p22)
+ (p12 + p22) log (p12 + p22) -2N log N
MLL_DM (P1, P2) = p11 log p11 + p12 log p12 + p21 log p21 + p22 log p22-N log N
However, N = p11 + p12 + p21 + p22
AIC_IM (P1, P2) = -2 x MLL_IM (P1, P2) + 2 x 2
AIC_IM (P1, P2): Subordinate AIC of a set of character attribute P1 and synonymous verb P2
AIC_DM (P1, P2) = -2 x MLL_DM (P1, P2) + 2 x 3
AIC_DM (P1, P2): Independent AIC of a pair of character attribute P1 and synonymous verb P2
V (P1, P2) = AIC_IM (P1, P2) -AIC_DM (P1, P2)
It is also preferable to make the computer function as such.
本発明のプログラムにおける他の実施形態によれば、
投稿文は、不特定複数のユーザがSNS(Social Networking Service)又はブログに投稿したテキストであり、
キャラクタ属性は、年代、性別、出身地のいずれか又はそれらの組み合わせに基づく分類属性である
ようにコンピュータを機能させることも好ましい。
According to other embodiments in the program of the invention
The posted text is a text posted on an SNS (Social Networking Service) or a blog by an unspecified number of users.
It is also preferable to make the computer function so that the character attribute is a classification attribute based on any one of age, gender, birthplace, or a combination thereof.
本発明のプログラムにおける他の実施形態によれば、
対話シナリオを用いて、エージェントがユーザと対話する対話手段と、
対話手段によってユーザとの対話中に、対話シナリオの中で特徴類義動詞に置換された発話文がユーザに向けて発話された際に又はその後、ユーザに対して当該発話文に違和感を生じるか否かをテキスト又は音声によって問い合わせ、ユーザが違和感を生じると判定した際に、置換された特徴類義動詞を元の発話動詞に戻すべく再度置換する発話動詞修正手段と
してコンピュータを更に機能させることも好ましい。
According to other embodiments in the program of the invention
A means of dialogue in which an agent interacts with a user using a dialogue scenario,
Whether the utterance sentence replaced with the characteristic synonymous verb in the dialogue scenario causes a sense of discomfort to the user when or after the utterance sentence is spoken to the user during the dialogue with the user by the dialogue means. It is also possible to further function the computer as an utterance verb correction means that replaces the replaced feature synonymous verb with the original utterance verb when the user inquires by text or voice and determines that the user feels uncomfortable. preferable.
本発明の対話シナリオ作成装置によれば、
キャラクタ属性毎に、対話シナリオを蓄積した対話シナリオ蓄積手段と、
キャラクタ属性毎に、複数のユーザにおける複数の投稿文を蓄積する投稿文蓄積手段と、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された発話動詞における意義素を決定し、意義素を同一とする複数の類義動詞を対応付ける意義素決定手段と、
第2キャラクタ属性に基づくユーザの投稿文を用いて、同一の意義素における複数の類義動詞の中で出現頻度が最も偏る類義動詞を、特徴類義動詞として選択する特徴類義動詞選択手段と、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された当該発話動詞を、特徴類義動詞に置換して、第2キャラクタ属性の対話シナリオの発話文とする動詞置換手段と
を有することを特徴とする。
According to the dialogue scenario creating device of the present invention.
Dialogue scenario storage means that accumulates dialogue scenarios for each character attribute,
Post-sentence storage means for accumulating multiple posts by multiple users for each character attribute,
Meaning element determination means for determining the meaning element in the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute, and associating a plurality of synonymous verbs with the same meaning element.
Characteristic synonymous verb selection means for selecting a synonymous verb whose appearance frequency is most biased among multiple synonymous verbs in the same meaning element as a characteristic synonymous verb using a user's post based on the second character attribute. When,
It is characterized by having a verb replacement means for replacing the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute with a characteristic synonymous verb to be the utterance sentence of the dialogue scenario of the second character attribute. And.
本発明の対話シナリオ作成方法によれば、
装置は、
キャラクタ属性毎に、対話シナリオを蓄積した対話シナリオ蓄積手段と、
キャラクタ属性毎に、複数のユーザにおける複数の投稿文を蓄積する投稿文蓄積手段と
を有し、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された発話動詞における意義素を決定し、意義素を同一とする複数の類義動詞を対応付ける第1のステップと、
第2キャラクタ属性に基づくユーザの投稿文を用いて、同一の意義素における複数の類義動詞の中で出現頻度が最も偏る類義動詞を、特徴類義動詞として選択する第2のステップと、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された当該発話動詞を、特徴類義動詞に置換して、第2キャラクタ属性の対話シナリオの発話文とする第3のステップと
を実行することを特徴とする。
According to the dialogue scenario creation method of the present invention.
The device is
Dialogue scenario storage means that accumulates dialogue scenarios for each character attribute,
It has a post sentence storage means for accumulating a plurality of post sentences by a plurality of users for each character attribute.
The first step of determining the meaning elements in the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute, and associating a plurality of synonymous verbs having the same meaning element,
The second step of selecting the synonymous verb whose appearance frequency is most biased among multiple synonymous verbs of the same meaning as the characteristic synonymous verb by using the user's posted sentence based on the second character attribute.
The third step of replacing the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute with a characteristic synonymous verb and making it the utterance sentence of the dialogue scenario of the second character attribute is executed. It is characterized by.
本発明のプログラム、装置及び方法によれば、キャラクタ属性に応じた動詞に置換した対話シナリオを作成することができる。 According to the program, device, and method of the present invention, it is possible to create a dialogue scenario in which verbs are replaced according to character attributes.
以下、本発明の実施の形態について、図面を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図2は、本発明における対話シナリオ作成装置の機能構成図である。 FIG. 2 is a functional configuration diagram of the dialogue scenario creating device in the present invention.
本発明の対話シナリオ作成装置1は、エージェントのキャラクタ属性に応じた対話シナリオを自動的に作成する。
図2によれば、対話シナリオ作成装置1は、対話部100と、対話シナリオ蓄積部101と、投稿文蓄積部102と、意義素決定部11と、特徴類義動詞選択部12と、動詞置換部13と、発話動詞修正部14とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、対話シナリオ作成方法としても理解できる。
The dialogue
According to FIG. 2, the dialogue
本発明の対話シナリオ作成装置1は、
第1キャラクタ属性のエージェントにおける第1対話シナリオの発話文に含まれる動詞に関係する意義素を決定し(意義素決定部11)、
意義素の中に複数存在する類義動詞の中から、作成したい第2の対話シナリオの第2キャラクタ属性を特徴付ける類義動詞を選択し(特徴類義動詞選択部12)、
第1対話シナリオの発話文に含まれる当該動詞を、第2キャラクタ属性に応じた類義動詞に置換する(動詞置換部13)
ことによって、第2キャラクタ属性のエージェントにおける第2対話シナリオを自動的に作成する。
The dialogue
The meaning element related to the verb included in the utterance sentence of the first dialogue scenario in the agent of the first character attribute is determined (meaning element determination unit 11).
From among the multiple synonymous verbs that exist in the meaning element, select the synonymous verb that characterizes the second character attribute of the second dialogue scenario that you want to create (characteristic synonymous verb selection unit 12).
The verb included in the utterance sentence of the first dialogue scenario is replaced with a synonymous verb corresponding to the second character attribute (verb replacement part 13).
By doing so, the second dialogue scenario in the agent of the second character attribute is automatically created.
[対話部100]
対話部100は、ユーザが所持する端末2に対して、ユーザインタフェースを介して、音声やテキストで対話するエージェントが起動する。ユーザは、所望のキャラクタ属性(年齢、性別、出身地等)に応じたエージェントを選択することができる。エージェントは、対話シナリオ蓄積部101を参照し、そのキャラクタ属性に応じた対話シナリオを用いてユーザと対話する。エージェントは、ユーザから見て、そのキャラクタ属性に基づく人物として認識できる。
[Dialogue unit 100]
The
[対話シナリオ蓄積部101]
対話シナリオ蓄積部101は、キャラクタ属性毎に、対話シナリオを蓄積したものである。
対話シナリオ蓄積部101は、対話シナリオを、受話文と発話文とによって構成する。受話文は、ユーザが発話するであろうテキストを想定したものであり、発話文は、その受話文に対してエージェントが発話するテキストである。
また、エージェントのキャラクタ属性は、例えば年代、性別、出身地のいずれか又はそれらの組み合わせに基づく分類属性とする。
[Dialogue scenario storage unit 101]
The dialogue
The dialogue
Further, the character attribute of the agent is, for example, a classification attribute based on any one of age, gender, hometown, or a combination thereof.
図3は、本発明における対話シナリオ蓄積部及び投稿文蓄積部の説明図である。 FIG. 3 is an explanatory diagram of a dialogue scenario storage unit and a posted text storage unit in the present invention.
図3(a)によれば、対話シナリオ蓄積部101に蓄積された第1キャラクタ属性の対話シナリオが表されている。ここで、第1キャラクタ属性は、例えば20代・女性とする。
(受話文) (発話文)
・・・・・・・・・・・・ ・・・・・・・
「夜、ご飯、どうするの?」 「炒飯を食べるよ」
・・・・・・・・・・・・ ・・・・・・・
エージェントの発話文の動詞は、「食べるよ」となっており、第1キャラクタ属性「20代・女性」を想定する話し方となっている。キャラクタ属性に応じた微妙な動詞の発話文に調整するために、従来技術によれば人手によって作成されていた。
本発明の実施形態によれば、第1キャラクタ属性「20代・女性」の第1対話シナリオから、第2キャラクタ属性「10代・男性」の第2対話シナリオを自動的に作成する。
According to FIG. 3A, the dialogue scenario of the first character attribute stored in the dialogue
(Received sentence) (Spoken sentence)
・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・
"What do you do with rice at night?""I'll eat fried rice."
・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・
The verb of the agent's utterance is "I'll eat", which is a way of speaking assuming the first character attribute "female in her twenties". According to the prior art, it was created manually in order to adjust the utterance sentence of a delicate verb according to the character attribute.
According to the embodiment of the present invention, the second dialogue scenario of the second character attribute "teens / male" is automatically created from the first dialogue scenario of the first character attribute "twenties / female".
[投稿文蓄積部102]
投稿文蓄積部102は、キャラクタ属性(ユーザ属性、デモグラフィック)毎に、複数のユーザにおける複数の投稿文を蓄積したものである。
投稿文は、例えばSNS(Social Networking Service)又はブログに投稿されたテキストであって、不特定多数の第三者、又は、特定人物によって送信されたものであってもよい。
[Posted text storage unit 102]
The posted
The posted text may be, for example, a text posted on an SNS (Social Networking Service) or a blog, and may be sent by an unspecified number of third parties or a specific person.
図3(b)によれば、キャラクタ属性毎に、例えば以下のような投稿文が列挙されている。
第1キャラクタ属性(20代・女性)に基づく投稿文
「炒飯でも食べるよ」
・・・・・・
「炒飯食べて元気だそう」
「炒飯を召し上がっちゃおう」
第2キャラクタ属性(10代・男性)に基づく投稿文
・・・・・・
「飯食うよ」
・・・・・・
「飯、食って腹一杯」
「炒飯でも召し上がろうかね」
投稿文には、男性らしい口調や、女性らしい口調、若者らしい口調、老年者らしい口調、地方の方言のような口調が表れる。これらは、キャラクタ属性に応じて投稿文の動詞に影響を与える。
According to FIG. 3B, for example, the following posted sentences are listed for each character attribute.
Posts based on the first character attribute (female in their 20s)
"I'll eat fried rice"
・ ・ ・ ・ ・ ・
"I'm fine eating fried rice."
"Let's eat fried rice"
Posts based on the second character attribute (teens / male)
・ ・ ・ ・ ・ ・
"I'll eat"
・ ・ ・ ・ ・ ・
"Rice, eat and be full"
"Would you like to eat fried rice?"
Posts have a masculine tone, a feminine tone, a youthful tone, an elderly tone, and a local dialect-like tone. These affect the verbs in the post depending on the character attributes.
不特定多数の投稿文をキャラクタ属性毎に分類するために、例えば特許文献1のように、投稿文毎に、性別・年代や出身地のようなキャラクタ属性を推定する技術を用いることもできる。SNSサイトサーバから取得可能な投稿者間の交流関係を用いて、投稿者のプロフィール(キャラクタ属性)を推定する。
投稿文のキャラクタ属性は、対話シナリオのキャラクタ属性と同様の分類属性とする。キャラクタ属性は、発話文における特に動詞(例えば語尾)に影響する。
In order to classify an unspecified number of posted texts by character attribute, for example, as in
The character attribute of the posted text shall be the same classification attribute as the character attribute of the dialogue scenario. Character attributes affect verbs (eg, flexion) in particular in spoken sentences.
第1キャラクタ属性の投稿文は、置換元となる第1対話シナリオと同一又は類似のキャラクタ属性のユーザ(不特定多数又は特定人物)から投稿された投稿文である。
第2キャラクタ属性の投稿文は、置換先となる第2対話シナリオと同一又は類似のキャラクタ属性のユーザ(不特定多数又は特定人物)から投稿された投稿文である。
The posted text of the first character attribute is a posted text posted by a user (unspecified majority or specific person) having the same or similar character attribute as the first dialogue scenario to be replaced.
The post text of the second character attribute is a post text posted by a user (unspecified majority or specific person) with the same or similar character attribute as the second dialogue scenario to be replaced.
[意義素決定部11]
意義素決定部11は、第1キャラクタ属性に基づく対話シナリオの発話文に記述された「発話動詞」における「意義素」を決定し、意義素を同一とする複数の「類義動詞」を対応付ける。ここで、第1キャラクタ属性に基づく対話シナリオの発話文に記述された「発話動詞」について、複数の意義素が決定された場合、いずれか1つの意義素に決定する。
[Meaning element determination unit 11]
The meaning
「意義素(sememe)」とは、単語の意味を構成する概念に基づく単位をいう。言語学では、「文の意味」と「語の意義」とを使い分けている。語の「意義」を構成する要素として、音素(phoneme)や形態素 (morpheme)に準じて意義素がある。 A "sememe" is a unit based on a concept that constitutes the meaning of a word. In linguistics, "meaning of sentence" and "meaning of word" are used properly. As an element that constitutes the "meaning" of a word, there is a meaning element according to a phoneme or a morpheme.
図4は、本発明における意義素決定部の機能構成図である。 FIG. 4 is a functional configuration diagram of the meaning element determination unit in the present invention.
図4によれば、意義素決定部11は、第1キャラクタ属性の対話シナリオを入力し、決定した意義素及び類義語からなる意義素テーブルを出力する。
例えば入力される第1キャラクタ属性の対話シナリオとして、20代・女性のエージェントの対話シナリオが入力されるとする。
(発話文)
「炒飯を食べるよ」
According to FIG. 4, the meaning
For example, it is assumed that a dialogue scenario of a female agent in her twenties is input as a dialogue scenario of the first character attribute to be input.
(Utterance)
"I'll eat fried rice"
図4によれば、意義素決定部11は、品詞抽出部111と、類義動詞検索部112と、共起頻度検索部113とを有する。
According to FIG. 4, the meaning
<品詞抽出部111>
品詞抽出部111は、第1キャラクタ属性に基づく対話シナリオの発話文から、係り受け関係となる名詞と動詞とを抽出する。
品詞抽出部111は、例えば日本語係り受け解析器CaboChaを用いたものであってもよい。このような解析器に、文を入力すると、名詞及び動詞が出力される。
図4によれば、品詞抽出部111は、以下のように名詞及び動詞を抽出する。
(発話文) (名詞) (動詞)
「炒飯を食べるよ」 「炒飯」 「食べる」
品詞抽出部111は、動詞「食べる」を類義動詞検索部112へ出力し、名詞「炒飯」を出力する。
<Part of
The part-of-
The part-
According to FIG. 4, the part of
(Utterance) (Noun) (Verb)
"I'll eat fried rice""Friedrice""Eat"
The part-
<類義動詞検索部112>
類義動詞検索部112は、「類義語コーパス」を用いて、意義素毎に、係り受け動詞に類似する「類義動詞」を検索する。
<Synonymous
The synonym
類義語コーパスは、意義素と類義語とから構成され、例えば以下のようなものがある。
・Weblio類語辞典(非特許文献3参照)
・連想類語辞典(非特許文献4参照)
・類語辞書(非特許文献5参照)
例えば、類義動詞検索部112は、動詞「食べる」を入力した場合、動詞「食べる」に類似する1つ以上の類義動詞を検索する。
このとき、動詞「食べる」には、「ご飯を食べる」「魚を食べる」「野菜を食べる」のように「食事をする」という意義素(意味合い)と、「社長業で食っていく」「好きなことをして食っていく」のように「自活をする」という意義素とがある。そして、意義素毎に複数の類義動詞が検索される。
(動詞) (意義素) (類義動詞)
「食べる」 「食事をする」 食う
召し上がる
食事する
喫する
「自活をする」 生活する
生きていく
食べる
複数の類義動詞「食う」「召し上がる」「食事する」「喫する」は、意義素「食事をする」を同一とする。また、複数の類義動詞「生活する」「生きていく」「食べる」は、意義素「自活をする」を同一とする。
The synonym corpus is composed of meaning elements and synonyms, and includes, for example, the following.
・ Weblio Thesaurus (see Non-Patent Document 3)
-Associative thesaurus (see Non-Patent Document 4)
-Synonyms dictionary (see Non-Patent Document 5)
For example, when the verb "eat" is input, the synonymous
At this time, the verb "eat" has the meaning (meaning) of "eating" such as "eating rice", "eating fish", and "eating vegetables", and "eating in the president's business" and "eating". There is a meaning of "self-supporting" such as "do what you like and eat". Then, a plurality of synonymous verbs are searched for each meaning element.
(Verb) (Meaning element) (Synonymous verb)
"Eat""Eat" Eat
Eat
To eat
To enjoy
"Self-supporting" to live
Live
Eat Multiple synonymous verbs "eat", "eat", "eat", and "eat" have the same meaning "eat". In addition, the multiple synonymous verbs "living", "living", and "eating" have the same meaning "self-supporting".
類義動詞検索部112は、入力された動詞について、全ての意義素を導出し、意義素毎に全ての類義動詞を検索する。検索された意義素テーブルは、共起頻度検索部113へ出力される。
The synonymous
<共起頻度検索部113>
共起頻度検索部113は、第1キャラクタ属性に基づくユーザの投稿文の中から、「係り受け名詞と各類義動詞との共起頻度」を検索し、意義素毎に各類義動詞の出現頻度を計数する。そして、類義動詞の共起頻度が最も高い意義素を決定する。
<Co-occurrence
The co-occurrence
図4によれば、共起頻度検索部113は、例えば、類義動詞検索部112から動詞「食べる」の意義素テーブルを入力すると共に、品詞抽出部111から名詞「炒飯」を入力する。また、共起頻度検索部113は、投稿文蓄積部102を参照し、第1キャラクタ属性の投稿文を取得する。
ここで、共起頻度検索部113は、名詞「炒飯」と、意義素テーブルの各類義動詞とが共起する頻度が高い意義素を決定する。
According to FIG. 4, the co-occurrence
Here, the co-occurrence
図4によれば、投稿文蓄積部102には、第1キャラクタ属性の投稿文が8件あるとする。その中で、以下の3件の投稿文について、名詞「炒飯」と、意義素「食べる」に類義する類義動詞とが共起している。
(投稿文) (名詞)(類義動詞)
「炒飯でも食べるよ」 「炒飯」「食べる」
「炒飯食べて元気だそう」 「炒飯」「食べる」
「炒飯を召し上がっちゃおう」 「炒飯」「召し上がる」
図4によれば、名詞「炒飯」に対して共起頻度が高い類義動詞として「食べる」「召し上がる」がある。これら類義動詞は、意義素「食事をする」に対応する。そうすると、意義素「食事をする」と「自活をする」とを比較すると、共起頻度が最も高い意義素としては、「食事をする」となる。
即ち、共起頻度検索部113は、意義素「食事をする」を決定し、類義動詞「食う」「召し上がる」「食べる」「喫する」が対応付けられた意義素テーブルを出力する。
According to FIG. 4, it is assumed that the posted
(Posted text) (Noun) (Synonymous verb)
"Eat fried rice""Friedrice""Eat"
"Eat fried rice and feel fine""Friedrice""Eat"
"Let's eat fried rice""Friedrice""Eat"
According to FIG. 4, there are “eat” and “eat” as synonymous verbs that frequently co-occur with the noun “fried rice”. These synonymous verbs correspond to the meaning "eat". Then, when comparing the meaning elements "eat" and "self-support", the meaning element with the highest co-occurrence frequency is "eat".
That is, the co-occurrence
[特徴類義動詞選択部12]
特徴類義動詞選択部12は、第2キャラクタ属性に基づくユーザの投稿文を用いて、同一の意義素における複数の類義動詞の中で出現頻度が最も偏る類義動詞を、特徴類義動詞として選択する。
[Characteristic verb selection unit 12]
The feature synonymous
第2キャラクタ属性は、新たに作成する第2対話シナリオのエージェントに基づくものである。そのエージェントが、特定人物(例えば芸能人やタレント)をユーザに想起させるものであってもよい。その場合、第2キャラクタ属性に基づくユーザの投稿文として、その特定人物が過去に投稿した投稿文を用いることもできる。これによって、不特定人物に基づく一般的な第1対話シナリオから、特定人物に基づく第2対話シナリオを自動的に作成することができる。 The second character attribute is based on the agent of the newly created second dialogue scenario. The agent may remind the user of a specific person (eg, entertainer or personality). In that case, as the user's post based on the second character attribute, the post posted by the specific person in the past can also be used. This makes it possible to automatically create a second dialogue scenario based on a specific person from a general first dialogue scenario based on an unspecified person.
図5は、本発明における特徴類義動詞選択部の説明図である。 FIG. 5 is an explanatory diagram of a characteristic synonymous verb selection unit in the present invention.
図5によれば、意義素決定部11から意義素テーブルを入力すると共に、作成したい対話シナリオに基づく第2のキャラクタ属性の投稿文を参照する。
ここでは、10代・男性を、第2キャラクタ属性と設定し、そのエージェントの対話シナリオを作成するとする。
特徴類義動詞選択部12は、第2キャラクタ属性に基づくユーザの投稿文を用いて、同一の意義素における以下の複数の類義動詞について、出現頻度を検索する。
意義素 「食事をする」
類義動詞「食う」「召し上がる」「食べる」「喫する」
そして、特徴類義動詞選択部12は、類義動詞毎に、当該類義動詞が記述された第2キャラクタ属性の投稿文を検索し、出現頻度が最も偏る類義動詞を、特徴類義動詞として選択する。
According to FIG. 5, the meaning element table is input from the meaning
Here, it is assumed that a teenager / male is set as the second character attribute and a dialogue scenario of the agent is created.
The feature synonymous
Meaning "Eat"
Synonymous verbs "eat""eat""eat""eat"
Then, the characteristic synonymous
特徴類義動詞選択部12は、以下のように、赤池情報量規準(AIC:Akaike's Information Criterion)を用いて、キャラクタ属性P1に対する類義動詞P2の評価値V(P1,P2)を算出し、当該評価値V(P1,P2)が所定閾値以上となる、又は、当該評価値V(P1,P2)が大きいものから順に所定数となる、類義動詞P2を検出対象とする
p11:キャラクタ属性P1のユーザが、類義動詞P2に関する投稿文を投稿した数
p12:キャラクタ属性P1のユーザが、類義動詞P2以外の投稿文を投稿した数
p21:キャラクタ属性P1以外のユーザが、類義動詞P2に関する投稿文を投稿した数
p22:キャラクタ属性P1以外のユーザが、類義動詞P2以外の投稿文を投稿した数
p11+p12+p21+p22=全てのユーザが、投稿文を投稿した数
MLL_IM(P1,P2)=(p11+p12) log(p11+p12)
+(p11+p21) log(p11+p21)
+(p21+p22) log(p21+p22)
+(p12+p22) log(p12+p22)-2N log N
MLL_DM(P1,P2)=p11 log p11+p12 log p12+p21 log p21+p22 log p22-N log N
但し、N=p11+p12+p21+p22
AIC_IM(P1,P2)=-2 × MLL_IM(P1,P2) + 2×2
AIC_IM(P1,P2):キャラクタ属性P1と類義動詞P2との組の従属AIC
AIC_DM(P1,P2)=-2 × MLL_DM(P1,P2) + 2×3
AIC_DM(P1,P2):キャラクタ属性P1と類義動詞P2との組の独立AIC
V(P1,P2)=AIC_IM(P1,P2) - AIC_DM(P1,P2)
The feature synonymous
p11: The number of posts related to the synonymous verb P2 by the user of the character attribute P1.
p12: The number of posted sentences other than the synonymous verb P2 by the user of the character attribute P1.
p21: The number of posts related to the synonymous verb P2 by users other than the character attribute P1.
p22: The number of posted sentences other than the synonymous verb P2 by users other than the character attribute P1.
p11 + p12 + p21 + p22 = Number of posts posted by all users
MLL_IM (P1, P2) = (p11 + p12) log (p11 + p12)
+ (p11 + p21) log (p11 + p21)
+ (p21 + p22) log (p21 + p22)
+ (p12 + p22) log (p12 + p22) -2N log N
MLL_DM (P1, P2) = p11 log p11 + p12 log p12 + p21 log p21 + p22 log p22-N log N
However, N = p11 + p12 + p21 + p22
AIC_IM (P1, P2) = -2 x MLL_IM (P1, P2) + 2 x 2
AIC_IM (P1, P2): Subordinate AIC of a set of character attribute P1 and synonymous verb P2
AIC_DM (P1, P2) = -2 x MLL_DM (P1, P2) + 2 x 3
AIC_DM (P1, P2): Independent AIC of a pair of character attribute P1 and synonymous verb P2
V (P1, P2) = AIC_IM (P1, P2) -AIC_DM (P1, P2)
特徴類義動詞選択部12は、赤池情報量規準に応じて、1件の類義動詞を選択する。ここで、上位数件の類義動詞を選択し、それらの中からランダムに1件の類義動詞を選択するものであってもよい。
The feature synonymous
図5によれば、キャラクタ属性の10代・男性について、類義動詞毎の赤池情報量規準を算出すると、類義動詞「食う」に偏って出現頻度が多いことが理解できる。
最終的に、特徴類義動詞選択部12は、動詞「食べる」と、類義動詞「食う」とを、動詞置換部13へ出力する。
According to FIG. 5, when the Akaike information criterion for each synonymous verb is calculated for teenagers and males with character attributes, it can be understood that the frequency of appearance is biased toward the synonymous verb "eating".
Finally, the feature synonymous
[動詞置換部13]
動詞置換部13は、第1キャラクタ属性に基づく対話シナリオの発話文に記述された当該発話動詞を、特徴類義動詞に置換して、第2キャラクタ属性の対話シナリオの発話文とする。
[Verb substitution part 13]
The
図6は、本発明における動詞置換部の説明図である。 FIG. 6 is an explanatory diagram of a verb substitution part in the present invention.
図6によれば、動詞置換部13は、第1キャラクタ属性(20代・女性)の対話シナリオの中で、動詞「食べる」を類義動詞「食う」に置換し、第2キャラクタ属性(10代・男性)の対話シナリオとして作成する。
第1キャラクタ属性の対話テキストの発話文:「炒飯を食べるよ」
第2キャラクタ属性の対話テキストの発話文:「炒飯を食うよ」
According to FIG. 6, the
Speech text of the dialogue text of the first character attribute: "I will eat fried rice"
The utterance of the dialogue text of the second character attribute: "I will eat fried rice"
前述したように、意義素決定部11と、特徴類義動詞選択部12と、動詞置換部13とを繰り返すことによって、最終的に、異なるキャラクタ属性の対話シナリオから、所望のキャラクタ属性の対話シナリオを自動的に作成することができる。
As described above, by repeating the meaning
図7は、本発明によって置換された対話シナリオを表す説明図である。 FIG. 7 is an explanatory diagram showing a dialogue scenario replaced by the present invention.
図7によれば、図1(a)のような20代・女性のキャラクタ属性の対話シナリオから、10代・男性のキャラクタ属性の対話シナリオを作成したものである。
ユーザ :「夜、ご飯どうするの?」
エージェント:「炒飯を食うよ」
ユーザは、10代・男性のキャラクタ属性のエージェントと対話しており、「食うよ」と発話されることに違和感を生じない。10代・男性であれば、荒っぽい発話をする場合が多いためである。
According to FIG. 7, a dialogue scenario with a character attribute of a teenager / male is created from a dialogue scenario with a character attribute of a woman in her twenties as shown in FIG. 1 (a).
User: "What do you do with rice at night?"
Agent: "I'll eat fried rice."
The user is interacting with an agent with a teenage / male character attribute, and does not feel uncomfortable when he / she is told "I will eat". This is because teenagers and men often make rough utterances.
ここで、ユーザから見て、動詞が置換された対話シナリオの発話文に対して、日本語に不自然な違和感を抱く場合もある。例えば、対話シナリオの発話文に以下のようなものがあるとする。
「炒飯を食べたい」-> 動詞:「食べ」、機能語:「たい」
置換される類義動詞「食う」が選択された場合、以下のような発話文が作成される。
「炒飯を食べたい」-> 「炒飯を食うたい」
このように、動詞の活用形を考慮せずに、動詞を置換するために、日本語として違和感が生じてしまう。
Here, from the user's point of view, Japanese may have an unnatural sense of discomfort with respect to the utterance sentence of the dialogue scenario in which the verb is replaced. For example, suppose that the utterance sentence of the dialogue scenario is as follows.
"I want to eat fried rice"-> Verb: "Eat", Function word: "Tai"
When the synonymous verb "eat" to be replaced is selected, the following utterance sentence is created.
"I want to eat fried rice"->"I want to eat fried rice"
In this way, because the verb is replaced without considering the inflected form of the verb, a sense of incongruity arises in Japanese.
図8は、本発明によって置換された動詞を修正するインタフェースを表す説明図である。 FIG. 8 is an explanatory diagram showing an interface for modifying a verb replaced by the present invention.
[発話動詞修正部14]
発話動詞修正部14は、対話部100におけるユーザとの対話中に、対話シナリオの中で特徴類義動詞に置換された発話文がユーザに向けて発話された際に又はその後、ユーザに対して当該発話文に違和感を生じるか否かをテキスト又は音声によって問い合わせる。このとき、発話動詞修正部14は、対話部100を介して、端末2のユーザインタフェースに対して問い合わせ情報を送信する。
図8によれば、端末2の対話アプリケーション上に、以下のような、2択の問い合わせボタンが表示される。
「返答に違和感有り」
「返答に違和感無し」
[Utterance verb correction part 14]
The utterance
According to FIG. 8, the following two-choice inquiry button is displayed on the interactive application of the
"There is something wrong with the reply"
"No discomfort in reply"
ユーザが違和感を生じると判定した際に、「返答に違和感有り」がタップされる。このタップ情報は、端末2から、対話シナリオ作成装置1へ送信される。そのタップ情報は、発話動詞修正部14によって認識され、置換された特徴類義動詞を元の発話動詞に戻すべく再度置換する。
このように、エージェントがユーザと対話することによって、動詞の置換の正当性を判断していくことができる。
When the user determines that a feeling of strangeness is generated, "there is a feeling of strangeness in the reply" is tapped. This tap information is transmitted from the
In this way, the agent can interact with the user to determine the validity of the verb substitution.
以上、詳細に説明したように、本発明のプログラム、装置及び方法によれば、キャラクタ属性に応じた動詞に置換した対話シナリオを作成することができる。これによって、キャラクタ属性として違和感の無い対話シナリオを自動的に作成することができる As described above in detail, according to the program, device, and method of the present invention, it is possible to create a dialogue scenario in which verbs are replaced according to character attributes. This makes it possible to automatically create a dialogue scenario that does not feel strange as a character attribute.
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。 Various modifications, modifications and omissions of the above-mentioned various embodiments of the present invention within the scope of the technical idea and viewpoint of the present invention can be easily carried out by those skilled in the art. The above explanation is just an example and does not attempt to limit anything. The present invention is limited only to the scope of claims and their equivalents.
1 対話シナリオ作成装置
100 対話部
101 対話シナリオ蓄積部
102 投稿文蓄積部
11 意義素決定部
111 品詞抽出部
112 類義動詞検索部
113 共起頻度検索部
12 特徴類義動詞選択部
13 動詞置換部
14 発話動詞修正部
2 端末
1 Dialogue
Claims (8)
キャラクタ属性毎に、複数のユーザにおける複数の投稿文を蓄積する投稿文蓄積手段と、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された発話動詞における意義素を決定し、意義素を同一とする複数の類義動詞を対応付ける意義素決定手段と、
第2キャラクタ属性に基づくユーザの投稿文を用いて、同一の意義素における複数の類義動詞の中で出現頻度が最も偏る類義動詞を、特徴類義動詞として選択する特徴類義動詞選択手段と、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された当該発話動詞を、特徴類義動詞に置換して、第2キャラクタ属性の対話シナリオの発話文とする動詞置換手段と
してコンピュータを機能させることを特徴とするプログラム。 Dialogue scenario storage means that accumulates dialogue scenarios for each character attribute,
Post-sentence storage means for accumulating multiple posts by multiple users for each character attribute,
Meaning element determination means for determining the meaning element in the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute, and associating a plurality of synonymous verbs with the same meaning element.
Characteristic synonymous verb selection means for selecting a synonymous verb whose appearance frequency is most biased among multiple synonymous verbs in the same meaning element as a characteristic synonymous verb using a user's post based on the second character attribute. When,
Replacing the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute with a characteristic verb, and making the computer function as a verb replacement means to be the utterance sentence of the dialogue scenario of the second character attribute. A program featuring.
第1キャラクタ属性に基づく対話シナリオの発話文に記述された発話動詞について、複数の意義素が決定された際に、
類義語コーパスを用いて、意義素毎に、当該意義素を同一とする複数の類義動詞を検索し、
第1キャラクタ属性に基づくユーザの投稿文の中で、意義素毎に各類義動詞の出現頻度を計数し、
各類義動詞の出現頻度が最も高い意義素に決定する
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。 Meaning factor determination means
When multiple meanings are determined for the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute,
Using the synonym corpus, search for multiple synonymous verbs that have the same meaning for each meaning element.
In the user's post based on the first character attribute, the frequency of appearance of each synonymous verb is counted for each meaning element, and
The program according to claim 1, wherein the computer functions so as to determine the meaning element having the highest frequency of appearance of each synonymous verb.
第1キャラクタ属性に基づく対話シナリオの発話文から、係り受け関係となる名詞と動詞とを抽出する品詞抽出手段と、
類義語コーパスを用いて、意義素毎に、係り受け動詞に類似する類義動詞を検索する類義動詞検索手段と、
第1キャラクタ属性に基づくユーザの投稿文の中から、係り受け名詞と各類義動詞との共起頻度を検索し、各類義動詞の共起頻度が最も高い意義素を決定する共起頻度検索手段と
してコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。 Meaning factor determination means
Part-of-speech extraction means for extracting nouns and verbs that are dependent on each other from the utterance sentences of the dialogue scenario based on the first character attribute.
A synonym verb search method for searching for synonymous verbs similar to dependent verbs for each meaning element using a synonym corpus,
The co-occurrence frequency of searching the co-occurrence frequency of the dependent noun and each synonymous verb from the user's post based on the first character attribute, and determining the co-occurrence element with the highest co-occurrence frequency of each synonymous verb. The program according to claim 1 or 2, wherein the computer functions as a search means.
以下のように、赤池情報量規準(AIC:Akaike's Information Criterion)を用いて、キャラクタ属性P1に対する類義動詞P2の評価値V(P1,P2)を算出し、当該評価値V(P1,P2)が所定閾値以上となる、又は、当該評価値V(P1,P2)が大きいものから順に所定数となる、類義動詞P2を検出対象とする
p11:キャラクタ属性P1のユーザが、類義動詞P2に関する投稿文を投稿した数
p12:キャラクタ属性P1のユーザが、類義動詞P2以外の投稿文を投稿した数
p21:キャラクタ属性P1以外のユーザが、類義動詞P2に関する投稿文を投稿した数
p22:キャラクタ属性P1以外のユーザが、類義動詞P2以外の投稿文を投稿した数
p11+p12+p21+p22=全てのユーザが、投稿文を投稿した数
MLL_IM(P1,P2)=(p11+p12) log(p11+p12)
+(p11+p21) log(p11+p21)
+(p21+p22) log(p21+p22)
+(p12+p22) log(p12+p22)-2N log N
MLL_DM(P1,P2)=p11 log p11+p12 log p12+p21 log p21+p22 log p22-N log N
但し、N=p11+p12+p21+p22
AIC_IM(P1,P2)=-2 × MLL_IM(P1,P2) + 2×2
AIC_IM(P1,P2):キャラクタ属性P1と類義動詞P2との組の従属AIC
AIC_DM(P1,P2)=-2 × MLL_DM(P1,P2) + 2×3
AIC_DM(P1,P2):キャラクタ属性P1と類義動詞P2との組の独立AIC
V(P1,P2)=AIC_IM(P1,P2) - AIC_DM(P1,P2)
ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。 Characteristic verb selection means
As shown below, using the Akaike's Information Criterion (AIC), the evaluation value V (P1, P2) of the synonymous verb P2 for the character attribute P1 is calculated, and the evaluation value V (P1, P2). The synonymous verb P2 whose evaluation value V (P1, P2) is greater than or equal to the predetermined threshold or whose evaluation value V (P1, P2) is the largest is the predetermined number.
p11: The number of posts related to the synonymous verb P2 by the user of the character attribute P1.
p12: The number of posted sentences other than the synonymous verb P2 by the user of the character attribute P1.
p21: The number of posts related to the synonymous verb P2 by users other than the character attribute P1.
p22: The number of posted sentences other than the synonymous verb P2 by users other than the character attribute P1.
p11 + p12 + p21 + p22 = Number of posts posted by all users
MLL_IM (P1, P2) = (p11 + p12) log (p11 + p12)
+ (p11 + p21) log (p11 + p21)
+ (p21 + p22) log (p21 + p22)
+ (p12 + p22) log (p12 + p22) -2N log N
MLL_DM (P1, P2) = p11 log p11 + p12 log p12 + p21 log p21 + p22 log p22-N log N
However, N = p11 + p12 + p21 + p22
AIC_IM (P1, P2) = -2 x MLL_IM (P1, P2) + 2 x 2
AIC_IM (P1, P2): Subordinate AIC of a set of character attribute P1 and synonymous verb P2
AIC_DM (P1, P2) = -2 x MLL_DM (P1, P2) + 2 x 3
AIC_DM (P1, P2): Independent AIC of a pair of character attribute P1 and synonymous verb P2
V (P1, P2) = AIC_IM (P1, P2) -AIC_DM (P1, P2)
The program according to any one of claims 1 to 3, wherein the computer functions as described above.
キャラクタ属性は、年代、性別、出身地のいずれか又はそれらの組み合わせに基づく分類属性である
ようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載のプログラム。 The posted text is a text posted on an SNS (Social Networking Service) or a blog by an unspecified number of users.
The program according to any one of claims 1 to 4, wherein the character attribute causes the computer to function as a classification attribute based on any one of age, gender, and birthplace, or a combination thereof.
対話手段によってユーザとの対話中に、対話シナリオの中で特徴類義動詞に置換された発話文がユーザに向けて発話された際に又はその後、ユーザに対して当該発話文に違和感を生じるか否かをテキスト又は音声によって問い合わせ、ユーザが違和感を生じると判定した際に、置換された特徴類義動詞を元の発話動詞に戻すべく再度置換する発話動詞修正手段と
してコンピュータを更に機能させることを特徴とする請求項1から5のいずれか1項に記載のプログラム。 A means of dialogue in which an agent interacts with a user using a dialogue scenario,
Whether the utterance sentence replaced with the characteristic synonymous verb in the dialogue scenario is uttered to the user during the dialogue with the user by the dialogue means, or after that, the utterance sentence causes discomfort to the user. When the user inquires by text or voice and determines that the user feels uncomfortable, the computer can be further functioned as an utterance verb correction means for replacing the replaced feature synonymous verb with the original utterance verb. The program according to any one of claims 1 to 5, which is characterized.
キャラクタ属性毎に、複数のユーザにおける複数の投稿文を蓄積する投稿文蓄積手段と、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された発話動詞における意義素を決定し、意義素を同一とする複数の類義動詞を対応付ける意義素決定手段と、
第2キャラクタ属性に基づくユーザの投稿文を用いて、同一の意義素における複数の類義動詞の中で出現頻度が最も偏る類義動詞を、特徴類義動詞として選択する特徴類義動詞選択手段と、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された当該発話動詞を、特徴類義動詞に置換して、第2キャラクタ属性の対話シナリオの発話文とする動詞置換手段と
を有することを特徴とする対話シナリオ作成装置。 Dialogue scenario storage means that accumulates dialogue scenarios for each character attribute,
Post-sentence storage means for accumulating multiple posts by multiple users for each character attribute,
Meaning element determination means for determining the meaning element in the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute, and associating a plurality of synonymous verbs with the same meaning element.
Characteristic synonymous verb selection means for selecting a synonymous verb whose appearance frequency is most biased among multiple synonymous verbs in the same meaning element as a characteristic synonymous verb using a user's post based on the second character attribute. When,
It is characterized by having a verb replacement means for replacing the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute with a characteristic synonymous verb to be the utterance sentence of the dialogue scenario of the second character attribute. Dialogue scenario creation device.
装置は、
キャラクタ属性毎に、対話シナリオを蓄積した対話シナリオ蓄積手段と、
キャラクタ属性毎に、複数のユーザにおける複数の投稿文を蓄積する投稿文蓄積手段と
を有し、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された発話動詞における意義素を決定し、意義素を同一とする複数の類義動詞を対応付ける第1のステップと、
第2キャラクタ属性に基づくユーザの投稿文を用いて、同一の意義素における複数の類義動詞の中で出現頻度が最も偏る類義動詞を、特徴類義動詞として選択する第2のステップと、
第1キャラクタ属性に基づく対話シナリオの発話文に記述された当該発話動詞を、特徴類義動詞に置換して、第2キャラクタ属性の対話シナリオの発話文とする第3のステップと
を実行することを特徴とする対話シナリオ作成方法。 It is a method of creating a dialogue scenario of the device.
The device is
Dialogue scenario storage means that accumulates dialogue scenarios for each character attribute,
It has a post sentence storage means for accumulating a plurality of post sentences by a plurality of users for each character attribute.
The first step of determining the meaning elements in the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute, and associating a plurality of synonymous verbs having the same meaning element,
The second step of selecting the synonymous verb whose appearance frequency is most biased among multiple synonymous verbs of the same meaning as the characteristic synonymous verb by using the user's posted sentence based on the second character attribute.
The third step of replacing the utterance verb described in the utterance sentence of the dialogue scenario based on the first character attribute with a characteristic synonymous verb and making it the utterance sentence of the dialogue scenario of the second character attribute is executed. How to create a dialogue scenario featuring.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020133426A JP7297721B2 (en) | 2020-08-05 | 2020-08-05 | Program, device, and method for creating dialogue scenario substituted with verbs according to character attributes |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020133426A JP7297721B2 (en) | 2020-08-05 | 2020-08-05 | Program, device, and method for creating dialogue scenario substituted with verbs according to character attributes |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022029869A true JP2022029869A (en) | 2022-02-18 |
JP7297721B2 JP7297721B2 (en) | 2023-06-26 |
Family
ID=80323748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020133426A Active JP7297721B2 (en) | 2020-08-05 | 2020-08-05 | Program, device, and method for creating dialogue scenario substituted with verbs according to character attributes |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7297721B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115437266A (en) * | 2022-10-10 | 2022-12-06 | 四川长虹电器股份有限公司 | Positioning method for voice-controlled Internet of things equipment |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04130577A (en) * | 1990-09-20 | 1992-05-01 | Sharp Corp | Natural language processor |
JP2010152705A (en) * | 2008-12-25 | 2010-07-08 | Dainippon Printing Co Ltd | Experience information retrieval system |
JP2020027548A (en) * | 2018-08-16 | 2020-02-20 | Kddi株式会社 | Program, device and method for creating dialog scenario corresponding to character attribute |
JP2020113156A (en) * | 2019-01-16 | 2020-07-27 | Kddi株式会社 | Device, program and method for generating dialog scenario including adjective utterance corresponding to characteristicness |
-
2020
- 2020-08-05 JP JP2020133426A patent/JP7297721B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04130577A (en) * | 1990-09-20 | 1992-05-01 | Sharp Corp | Natural language processor |
JP2010152705A (en) * | 2008-12-25 | 2010-07-08 | Dainippon Printing Co Ltd | Experience information retrieval system |
JP2020027548A (en) * | 2018-08-16 | 2020-02-20 | Kddi株式会社 | Program, device and method for creating dialog scenario corresponding to character attribute |
JP2020113156A (en) * | 2019-01-16 | 2020-07-27 | Kddi株式会社 | Device, program and method for generating dialog scenario including adjective utterance corresponding to characteristicness |
Non-Patent Citations (1)
Title |
---|
関 和広、外2名: "確率モデルを用いた日本語ゼロ代名詞の照応解析", 自然言語処理, vol. 第9巻,第3号, JPN6012066106, 10 July 2002 (2002-07-10), JP, pages 63 - 85, ISSN: 0005075002 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115437266A (en) * | 2022-10-10 | 2022-12-06 | 四川长虹电器股份有限公司 | Positioning method for voice-controlled Internet of things equipment |
Also Published As
Publication number | Publication date |
---|---|
JP7297721B2 (en) | 2023-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10977452B2 (en) | Multi-lingual virtual personal assistant | |
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
KR101634086B1 (en) | Method and computer system of analyzing communication situation based on emotion information | |
US10878817B2 (en) | Systems and methods for generating comedy | |
US11810337B2 (en) | Providing emotional care in a session | |
WO2019165331A1 (en) | Systems and methods for generating jokes | |
Griol et al. | Combining speech-based and linguistic classifiers to recognize emotion in user spoken utterances | |
JP7096172B2 (en) | Devices, programs and methods for generating dialogue scenarios, including utterances according to character. | |
JP2009099088A (en) | Sns user profile extraction device, extraction method and extraction program, and device using user profile | |
KR101677859B1 (en) | Method for generating system response using knowledgy base and apparatus for performing the method | |
JP2015219583A (en) | Topic determination device, utterance device, method, and program | |
Kim et al. | Acquisition and use of long-term memory for personalized dialog systems | |
Dethlefs et al. | Conditional random fields for responsive surface realisation using global features | |
Carvalho et al. | A critical survey on the use of fuzzy sets in speech and natural language processing | |
JPWO2018123139A1 (en) | Response device, response device control method, and control program | |
CN112632242A (en) | Intelligent conversation method and device and electronic equipment | |
JP6994289B2 (en) | Programs, devices and methods for creating dialogue scenarios according to character attributes | |
WO2016178337A1 (en) | Information processing device, information processing method, and computer program | |
Lee et al. | Impact of out-of-vocabulary words on the twitter experience of blind users | |
JP7038884B1 (en) | User assist system | |
JP7297721B2 (en) | Program, device, and method for creating dialogue scenario substituted with verbs according to character attributes | |
CN114036958A (en) | Dialogue agent and response sentence generation method | |
Sicilia et al. | ISABEL: An Inclusive and Collaborative Task-Oriented Dialogue System | |
JP2022018724A (en) | Information processing device, information processing method, and information processing program | |
Sert et al. | On the acceptability of the not so dummy auxiliary ‘do’in Dutch |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230519 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230614 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7297721 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |