JP2022025917A - Dialog device - Google Patents
Dialog device Download PDFInfo
- Publication number
- JP2022025917A JP2022025917A JP2020129102A JP2020129102A JP2022025917A JP 2022025917 A JP2022025917 A JP 2022025917A JP 2020129102 A JP2020129102 A JP 2020129102A JP 2020129102 A JP2020129102 A JP 2020129102A JP 2022025917 A JP2022025917 A JP 2022025917A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- user
- growth
- response
- response sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、対話装置に関する。 The present invention relates to a dialogue device.
近年、対話エージェントが普及してきており、一般的に対話エージェントを実現するための要素技術としてAIML(Artificial Intelligence Markup Language)があげられる。AIMLとは、XMLを応用した記述言語であり、AIMLを用いる対話エージェントは、入力された発話に対して、事前に記述されたルールで応答を返信する。また、特許文献1に記載されているように、対象者の状態に応じた的確な応答を行う技術が知られている。
In recent years, dialogue agents have become widespread, and AIML (Artificial Intelligence Markup Language) is generally mentioned as an elemental technology for realizing dialogue agents. AIML is a descriptive language to which XML is applied, and a dialogue agent using AIML returns a response to an input utterance according to a pre-written rule. Further, as described in
AIMLを用いる対話エージェントでは、事前にAIMLに記述されたルール通りに応答を返すため、誰に対しても同じ応答をしてしまう。また、パターンをいくつか用意していても、ユーザがしばらく対話エージェントと対話すると応答パターンがわかってしまう。また、特許文献1に記載の技術においても、その応答がパターン化され、同じような応答が繰り返されることが考えられる。したがって、ユーザは対話エージェントの応答が機械的と感じてしまい愛着が持てず利用継続しないことが考えられる。
Since the dialogue agent using AIML returns a response according to the rules described in AIML in advance, the same response is given to everyone. Also, even if some patterns are prepared, the response pattern will be known when the user interacts with the dialogue agent for a while. Further, also in the technique described in
そこで、上述の課題を解決するために、本発明は、ユーザとの対話に対する成長度合いに応じた応答を行うことができる対話装置を提供することを目的とする。 Therefore, in order to solve the above-mentioned problems, it is an object of the present invention to provide a dialogue device capable of responding to a dialogue with a user according to the degree of growth.
本発明の対話装置は、ユーザからの発話を受け付ける発話受付部と、前記ユーザの発話履歴に基づいて前記ユーザとの対話に対する成長度を算出する成長度算出部と、前記ユーザからの発話に対して、前記成長度に応じた応答文を取得する応答文取得部と、を備える。 The dialogue device of the present invention has an utterance receiving unit that accepts utterances from the user, a growth degree calculation unit that calculates the growth degree for the dialogue with the user based on the utterance history of the user, and a speech from the user. A response sentence acquisition unit for acquiring a response sentence according to the degree of growth is provided.
この構成によれば、成長度に応じた応答文を取得することができ、ユーザは、機械的な対話と感じることなく、愛着を持って対話装置の利用を継続することができる。 According to this configuration, it is possible to acquire a response sentence according to the degree of growth, and the user can continue to use the dialogue device with attachment without feeling that it is a mechanical dialogue.
本発明によると、ユーザは、機械的な対話と感じることなく、愛着を持って対話装置の利用を継続することができる。 According to the present invention, the user can continue to use the dialogue device with attachment without feeling that it is a mechanical dialogue.
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。 An embodiment of the present invention will be described with reference to the accompanying drawings. When possible, the same parts are designated by the same reference numerals, and duplicate description is omitted.
図1は、本開示の実施形態に係る対話装置10を含む対話システム1の機能ブロック図である。この対話装置10は、例えば、ユーザ端末20と通信可能に構成されたサーバ装置である。対話装置10は、1台の装置によって構成されても良いし、複数台の装置によって構成されても良い。ユーザ端末20は、例えば、ユーザにより操作されるコンピュータである。本開示では、一例として、ユーザとユーザ端末20とは一対一で対応しており、ユーザ端末20は、ユーザに所有されるスマートフォンである。ただし、ユーザ端末20の形態は特定の形態に限定されない。ユーザ端末20の他の例としては、タブレット端末、ウェアラブル端末、パーソナルコンピュータなどがあげられる。また、ユーザ端末20は、複数のユーザによって共有されても良い。
FIG. 1 is a functional block diagram of a
対話装置100は、ユーザ端末20からの発話に応じて応答文を提供することで対話サービスを提供する機能を有している。対話サービスは、ユーザにより入力された発話を受け付け、当該ユーザに応じた応答をユーザに提示するサービスである。図2は、上述した対話サービスにおいて、ユーザ端末20を介してユーザに提示される受付画面Pの一例を示す図である.受付画面Pは、例えばユーザ端末20のディスプレイに表示される複数のアイコンのうち対話サービスに対応するアイコンがユーザのタッチ操作等によって選択されることにより起動する。
The
その後、ユーザは、発話をユーザ端末20に入力する。例えば、ユーザは受付画面の下部に配置されたテキスト入力ウィンドウTにテキストを入力することにより、テキストデータ形式の発話を入力しても良い。
After that, the user inputs the utterance to the
或いは、ユーザはテキスト入力ウィンドウの右側に配置された音声入力アイコンVを選択して音声受付機能を起動し、当該音声受付機能を用いて音声入力を行うことにより、音声データ形式の発話を入力しても良い。 Alternatively, the user selects the voice input icon V located on the right side of the text input window to activate the voice reception function, and inputs the voice using the voice reception function to input the utterance in the voice data format. May be.
図2では、対話サービスは、ユーザからメッセージUD:「今日暑いね」という発話が入力された場合、当該発話と過去の発話の解析結果に基づいてメッセージM:「毎日暑くて嫌になっちゃう」などの応答文を返している。 In FIG. 2, when the user inputs a message UD: "It's hot today", the dialogue service has a message M: "It's hot every day and I don't like it" based on the analysis result of the utterance and the past utterances. Is returning a response statement such as.
なお、ユーザ端末20は、ユーザに対話サービスを提供する機能を有してもよい。ユーザ端末20は、対話装置100からの対話サービスを受けるための公知の機能を有しているが、ユーザ端末20がこれら対話サービスの機能を有してもよい。例えばユーザ端末20は、ユーザの発話を受け付ける機能と、発話を形態素解析等により解析する機能と、発話の解析結果に応じて適切な応答文を選択する機能と、応答文をユーザに提示する機能を有してもよい。
The
また、ユーザ端末20は、上述した全ての機能を備えていなくても良い。例えば、一部の機能(例えばユーザの発話を解析する機能)は、ユーザ端末20と通信可能に構成された当該ユーザ端末20とは異なる処理装置によって実行されても良い。この場合、例えばユーザ端末20は、ユーザの発話を処理装置に送信し、処理装置により解析された結果を処理装置から受信すれば良い。
Further, the
また、解析結果に応じて応答文を決定する機能は、必ずしもユーザ端末20上で実行されなくてもよく、ユーザ端末20と通信可能に構成されたユーザ端末20とは異なる処理装置(上記処理装置と異なってもよい)上で実行されても良い。この場合、例えばユーザ端末20は処理装置からユーザの発話に対応する応答文を取得し、当該応答文をユーザに提示すれば良い。なお、上記機能は、同一の処理装置で行われても良いし、互いに異なる装置であっても良い。また、対話装置10が、上述した処理装置の一部または全部として機能しても良い。
Further, the function of determining the response statement according to the analysis result does not necessarily have to be executed on the
本開示における対話システム1は、対話装置10および一または複数のユーザ端末20を含む。対話装置10は、発話受信部11、発話分解部12、ユーザ模倣部13、状態決定部14、第1メモリ10a、第2メモリ10b、第3メモリ10c、および第4メモリ10dから構成される。以下、各構成について説明する。
The
発話受信部11は、ユーザ端末20からテキスト情報からなる発話を受信する部分である。
The
発話分解部12は、発話受信部11が受け取った発話を形態素解析する部分である。発話分解部12は、形態素解析して得られた解析結果(形態素)が第1メモリ10aに記憶されているか判定を行う。発話分解部12は、第1メモリ10aに解析結果が記憶されていなければ第1メモリ10aに当該解析結果を記憶する。
The
また、発話分解部12は、極性辞書を有しており、この極性辞書を参照して、受け取った発話を極性判定する部分である。発話分解部12は、ユーザの発話と極性判定結果(当該発話における極性の割合)とを第2メモリ10bに記憶する。発話分解部12は、極性判定をする際、極性はポジティブ(以下、pos)、ネガティブ(以下、neg)、ニュートラル(以下、neu)の3つに分けて判定し、それぞれの極性として0から1まで間の値を算出する。
Further, the
ここで、図3および図4を用いて発話分解部12の処理について説明する。図3は、第1メモリ10aに記憶されている解析結果のデータベースを示す図である。図に示される通り、表の1レコード(1行)が1つの形態素に対応している。解析結果は、発話履歴として扱われる情報であって、図3の例では、「形態素」、「品詞」、「回数」および「time」を含んでいる。「形態素」欄は発話分解部12で形態素解析され、抽出された形態素(表現要素)である。なお、抽出する形態素は限定しない。例えば、名詞だけでも良いし、動詞だけでも良いし、形容詞だけでも良いし、複数の品詞でも良い。「品詞」欄は、「語彙」の品詞情報を表す情報である。「回数」欄は、「形態素」が今までのユーザの発話の中で何回発現したかを表す情報である。「time」はその形態素が一番最近発話された時間を表す情報である。回数とTime、成長記録は、ユーザへの情報提示に使用する。たとえば、「あなたの発話で一番多いのは電車です。」「何時頃よく話します。」「成長度は42.5です。」などを表示する。また、成長度は、数値から成長曲線を出しユーザに提示するために記録する。
Here, the processing of the
図4は、発話を形態素解析して、極性反転をする処理を示す模式図である。図に示される通り、ユーザ発話「今日の電車すごい混んでて辛かった」がユーザ端末20に入力され、対話装置10に送信される。
FIG. 4 is a schematic diagram showing a process of performing morphological analysis of utterances and performing polarity reversal. As shown in the figure, the user's utterance "Today's train was very crowded and painful" is input to the
発話分解部12は、この発話を形態素解析する(S11)。本開示においては、形態素解析エンジンとしてMecabを利用している。発話分解部12は、「今日」「電車」「すごく」「混む」「辛い」を品詞として取得する。
The
発話分解部12は、極性辞書を参照して極性判定する(S12)。極性辞書は、形態素ごとの極性を示した辞書である。本開示においてはあらかじめ用意された辞書である。発話分解部12は、形態素解析した品詞ごとに極性辞書を参照して、当該品詞の極性を判定し、一の発話における品詞ごとの極性の割合を求める。本開示においては、ポジティブ、ネガティブ、ニュートラルの3つの極性の割合を求める。
The
ユーザ模倣部13は、ユーザの発話に対してその感情を模倣した応答を返すための情報を生成する部分である。ユーザ模倣部13は、第1メモリ10aを参照することにより、総形態素数(以下、voc)を算出する。また、ユーザ模倣部13は、第2メモリ10bから各発話における極性判定の割合を参照することにより、一のユーザの総発話の極性の割合を計算する。そして、ユーザ模倣部13は、総形態素数、発話時間(time)が一番最近の形態素(以下rword)、および一のユーザの総発話における極性の割合を、状態決定部14に送信する。
The
図5および図6を用いて、ユーザ模倣部13の動作について説明する。図5は、第2メモリ10bに記憶されているデータベースの具体例を示す。図に示される通り、第2メモリ10bは、ユーザの発話と極性判定結果とを記憶するデータベースを記憶する。図5に示される表の1行が1つの発話履歴に対応している。図5の例では、発話履歴は「発話文」、「pos」、「neg」 、「neu」及び「time」を含んでいる。「発話文」はユーザにより入力されたユーザの発話の内容を示す情報である。「pos」は、当該発話を極性判定し、posとして算出された値を示す情報である。「neg」は、当該発話を極性判定し、negとして算出された値を示す情報である。「neu」は、当該発話を極性判定し、neuとして算出された値を示す情報である。「time」は「発話文」が入力された時間を示す情報である。
The operation of the
図6は、ユーザ模倣部13の動作を示す模式図である。ユーザ模倣部13は、第1メモリ10aを参照して、vocを算出する。ここでは、vocは50としている。また、ユーザ模倣部13は、第2メモリ10bを参照して、ユーザ発話の極性の割合を算出する。極性の割合は以下の数式により算出する。ここでは、xpolは、極性(ネガティブ・ポジティブ・ニュートラル)の割合を示し、nは、第2メモリ10bの発話数を示す。この数式は、ユーザ発話における極性ごとの平均値を示したものとなる。
FIG. 6 is a schematic diagram showing the operation of the
例えば、図6の例では、ユーザ発話におけるポジティブの平均値は、0.28、ネガティブの平均値は0.41、ニュートラルの平均値は0.31となる。本件明細書において、以降、各極性における平均値であるXpolを、per_pos、per_nega、 per_neuと表記する。それぞれ、Positive、Negative、Neutralの極性の平均値を示す。また、図6における第2メモリ10bの図は発話文欄とtime欄とを省略した図である。
For example, in the example of FIG. 6, the positive average value in the user utterance is 0.28, the negative average value is 0.41, and the neutral average value is 0.31. Hereinafter, in the present specification, Xpol, which is an average value for each polarity, is referred to as per_pos, per_nega, and per_neu. The average values of Positive, Negative, and Neutral polarities are shown, respectively. Further, the figure of the
状態決定部14は、ユーザ模倣部13から総形態素数、per_pos、per_neg、およびper_neuを受け取り、成長度を計算する部分である。また、状態決定部14は、極性の割合を用いた重み付きランダムによって、発話に対する応答対象である応答文の極性を決定する部分である。そして、状態決定部14は、ユーザ模倣部13から受け取ったrword(応答対象となる発話のうち直近の形態素)を用いて第3メモリ10cに記憶されている応答文郡を抽出する。この時、第3メモリ10cのトリガーワードとrwordとが複数マッチングした時はマッチングしたレコードを全て取り出す。最後に決定した成長度によって応答文群の中から応答文を1つ選択し、対話送信部に送信する。また、総形態素数、per_pos、per_neg、per_neu、成長度を第4メモリ10dに送信する。
The
図7を用いて、状態決定部14の動作について説明する。まず、図7(a)に示されるとおり、状態決定部14は、以下の式に基づいて成長度gを計算する。
The operation of the
g=(1-|a1-per_pos|-|a2-per_nega|-|a3-per_neu|)・m
この式において、a1、a2、a3は、それぞれポジティブ、ネガティブ、ニュートラルにおける理想の極性値を示す。また、a1+a2+a3≦1とし、あらかじめ定められた値とする。mは、形態素数である。
g = (1- | a 1 -per_pos | - | a 2 -per_nega | - | a 3 -per_neu |) ・ m
In this equation, a 1 , a 2 , and a 3 indicate ideal polarity values in positive, negative, and neutral, respectively. Further, a 1 + a 2 + a 3 ≦ 1 is set, and a predetermined value is used. m is a morpheme number.
すなわち、成長度は、(1-(|それぞれの極性の理想の値-それぞれの極性の実際の値|))*形態素数で計算される。この数式は、理想状態に近づき、また対話数(形態素数)が多くなるにつれて、その数値が上昇するように設定された数式である。 That is, the degree of growth is calculated by (1-(| ideal value of each polarity-actual value of each polarity |)) * morpheme. This formula is a formula set so that the numerical value increases as the ideal state is approached and the number of dialogues (morpheme number) increases.
成長度は、ユーザと対話エージェントとの親密度を表す値であることから、上記の通り、話しかければ話しかけるほど成長度が高くなるように設計されている。ただし、同じ言葉ばかり話しかけても成長度は上がらないように形態素数を用いて調整されている。また、ユーザ端末20からの発話の感情極性のバランスを算出し、極性のバランスが悪いと成長度が低くなるようにする。よって、成長度はユーザの発話から得た形態素の総数と極性とのバランスで決定される。
Since the growth rate is a value indicating the intimacy between the user and the dialogue agent, as described above, the growth rate is designed to increase as the user speaks. However, it is adjusted using morpheme so that the growth rate does not increase even if only the same words are spoken. Further, the balance of the emotional polarities of the utterances from the
一般的に、極性が偏っている状態(ネガティブすぎる、ポジティブすぎる)では正常に成長しているとは言えない。そして、理想の状態に近づいているときこそ、成長していると判断することが妥当である。 In general, it cannot be said that the plants are growing normally when the polarity is biased (too negative or too positive). And it is appropriate to judge that it is growing when it is approaching the ideal state.
本開示においては、成長度は、形態素数(語彙数)だけでは決まらず、極性のバランスを用いて決定している。形態素数が増えること自体は、成長しているといえるが、形態素数に対して、理想の極性からどの程度離れているかの値を乗算することにより、どれぐらい成長したかを示すことができる。理想の極性から離れていなければ、形態素数×1の成長度を得ることができる。 In the present disclosure, the degree of growth is not determined only by the morpheme number (the number of vocabularies), but is determined by using the balance of polarity. It can be said that the increase in the morpheme number itself is growing, but it is possible to show how much the morpheme number has grown by multiplying the morpheme number by the value of how far it is from the ideal polarity. If the polarity is not deviated from the ideal polarity, the growth rate of morpheme number × 1 can be obtained.
上記式では、ポジティブに関する数値(理想値との一致程度)から、ネガティブに関する数値およびニュートラルに関する数値を、減算している。ネガティブに関する感情は、ポジティブに関する感情より強力な感情であるため、その成長度に大きく影響するように、ポジティブに関する数値からネガティブに関する数値を減算している。なお、成長度は、この数式に限定するものではなく、上記定義にしたがった数式であればよい。 In the above formula, the numerical value related to negative and the numerical value related to neutral are subtracted from the numerical value related to positive (the degree of agreement with the ideal value). Negative emotions are stronger than positive emotions, so negative emotions are subtracted from positive emotions to significantly affect their growth. The degree of growth is not limited to this formula, and may be any formula according to the above definition.
ユーザ模倣部13は、形態素数m=50、Positive:0.28、Negative:0.41、Neutral:0.31を算出している。これら数値を上記式に入れることで、状態決定部14は、成長度g=42.5を算出する。
The
例えば、理想の値が0.33だった場合で、per_posの値が0.28で、per_negの値が0.41で、per_neuの値が0.31で、形態素数が50だったとき、
g=(1-|(0.33-0.28)|-|(0.33-0.41)|-|(0.33-0.31)|)*50=42.5
となり、成長度は42.5になる。
For example, when the ideal value is 0.33, the per_pos value is 0.28, the per_neg value is 0.41, the per_neu value is 0.31, and the morphological prime number is 50.
g = (1- | (0.33-0.28) |-| (0.33-0.41) |-| (0.33-0.31) |) * 50 = 42.5
And the growth rate is 42.5.
また、状態決定部14は、極性の割合を用いた重み付きランダム関数によって、どの極性に属する応答文を決定する。例えば、図7(b)に示されるとおり、予め指定された重み付けをすることで、ユーザ模倣部13が算出したPositive:0.28、Negative:0.41、Neutral:0.31から、Positive:0.3、Negative:0.41、Neutral:0.29を算出する。そして、状態決定部14は、それぞれの確率に基づいて応答文が属する極性を決定する。すなわち、Positiveとなる確率:30%、Negativeとなる確率:41%、Neutralとなる確率:29%であり、状態決定部14は、これら確率に従って、応答文が属する極性を決定する。図7(b)では、状態決定部14は、応答文はネガティブに決定している。
Further, the
図7(c)に示される通り、状態決定部14は、成長度と応答文の極性とrwordとに基づいて、一または複数の応答文を決定する。具体的には、状態決定部14は、rwordに基づいて、第3メモリ10cから、トリガーワード欄において、rwordに一致する応答文群を抽出し、さらに、そのうちから極性に一致する応答文群を抽出する。
As shown in FIG. 7 (c), the
図8に示される通り、第3メモリ10cは、定型応答文のデータベースを記憶する。表の1レコード(一行)が、1つの応答文に対応するデータベースである。図8の例では、このデータベースは、「トリガーワード」、「応答文」、「成長度閾値」、「PN(極性)」を対応付けている。「トリガーワード」は、応答文を選択する際の基準となる語である。「トリガーワード」で示されている語が発話の最後に含まれている場合に、その発話に対する応答文が選択される。「成長度閾値」は、応答文を選択するための基準となるパラメータであって、ユーザの成長度と成長度閾値とを比較することにより、応答文を選択する。「PN」は、応答文の極性を示す。
As shown in FIG. 8, the
図7(c)では、rwordは「辛い」、極性はNegativeに一致する3つの応答文群を抽出している。さらに、状態決定部14は、成長度(42.5)と、第3メモリ10cに記憶されている成長度閾値とに基づいて、成長度以下に成長度閾値が設定されている一の応答文を決定する。例えば、成長度42.5を用いて応答文を決める場合、1つ目の文の成長度閾値が870で、2つ目の文の成長度閾値が280で、3つ目の成長度閾値が0の場合、応答文は3つ目の応答文が選択される。ここでは、「かなしい」が選択される。
In FIG. 7 (c), three response sentence groups whose rword is "spicy" and whose polarity is Negative are extracted. Further, the
応答文送信部15は、状態決定部14により決定された応答文をユーザ端末20に送信する。また、応答文送信部15は、ユーザ端末20に、ユーザの成長記録およびユーザの使用した発話(形態素単位)の頻度を送信してもよい。成長記録として、後述する第4メモリ10dに記憶されている情報がある。また発話の頻度として、第1メモリ10aに記憶されている情報がある。その送信は、ユーザ端末20からの要求によってもでもよいし、定期的になされてもよい。
The response
応答文送信部15は、発話の頻度を送信する場合には、たとえば,「あなたの発話で一番多いのは〇〇です。」というメッセージを生成する。また、発話の履歴を利用して「何時頃よく話します。」というメッセージを生成してもよい。その場合、対話装置100は、発話ごとの履歴テーブル(図示せず)を備え、応答文送信部15は、その情報を利用する。また、応答送信部15は、「成長度は〇〇です。」のメッセージを生成してもよい。成長度は第4メモリ10dに記憶されている情報である。また,成長度は、過去の成長度の数値(成長度履歴、横軸は時間または総形態素数)から成長曲線を算出し、ユーザ端末20に送信してもよい。また、数値のみを送り、ユーザ端末20において成長曲線を形成するように処理してもよい。
When transmitting the frequency of utterances, the response
第1メモリ10aは、対話分解部から送信された形態素を記憶するデータベースを記憶する部分である。その具体例は上述した通り、図3に示される通りであり、形態素ごとに、品詞、抽出回数、直近に分析した時刻を記憶している。
The
第2メモリ10bは、ユーザの発話と極性判定結果とを記憶するデータベースを記憶する部分である。
The
第3メモリ10cは、定型応答文のデータベースを記憶する部分である。
The
第4メモリ10dは、ユーザの成長記録を記憶するデータベースである。図9に示される表の1レコードがユーザの1発話の成長記録に対応する情報である。図9の例では、「総形態素数」、「pos」、「neg」、「neu」、「成長度」、「time」を持つ。「time」は、発話をした日時を示す。この第4メモリ10dには、状態決定部14が応答文を取得するごとに、その成長記録を記憶させる。総形態素数は、応答文作成ごとに抽出された形態素数の累積である。一つの発話には、5~10個の形態素が含まれる場合が多いが、それ以上の形態素数が含まれる場合もある。
The
このように構成された対話装置10の動作について説明する。図10および図11は、対話装置10の動作を示すフローチャートである。以下、フローチャートの各ステップについて説明する。このフローチャートは1ユーザに対しての処理を記載したものである。
The operation of the
発話受信部11は、ユーザが音声もしくはテキストで入力した発話文を入力1として受信する(S101)。発話分解部12は、発話受信部11が受け取った入力1に対しMecab等の形態素解析器を用いて形態素解析を行い、発話文を形態素(言語で意味を持つ最小単位)に分解して品詞を判別する(S102)。発話分解部12は、判別された形態素が第1メモリ10aに記憶されているか判定を行う(S103)。発話分解部12は、第1メモリ10aに記憶されていなければ(S103:NO)、第1メモリ10aに形態素、品詞を記憶する(S104)。発話分解部12は、第1メモリ10aに記憶されていた場合(S103:YES)、出現した回数を1増やすよう第1メモリ10aの「回数」の値を更新する。また、発話分解部12は、入力1を受け取った時間(以下time)を第1メモリ10aに記録する。このとき、すでに形態素が登録されていた場合は、その形態素が出現した最新の時間に値を更新する。
The
発話分解部12は、日本語評価極性辞書などの極性辞書を用いて入力1の極性判定を行う(S105)。ユーザ模倣部13は、極性判定を行う時、それぞれの極性のスコアを算出する。例えば、発話分解部12は、「今日の電車すごい混んでて辛かった…」を極性判定して、pos、neg、neuのスコアをそれぞれ算出する。この時使用する極性辞書はすでに持っているものとする。発話分解部12は、入力1と、算出したpos、neg、neuのスコアと、timeとを第2メモリ10bに記録する。
The
ユーザ模倣部13は、第1メモリ10aに記憶されている形態素の総数(以下、総形態素数)をカウントする(S107)。ユーザ模倣部13は、第2メモリ10bから全発話の極性判定の結果を受け取る。受け取った極性判定の結果からユーザ発話全体の極性の割合(per_pos、per_neg、per_neu)を計算する(S108)。
The
状態決定部14は、ユーザ模倣部13から極性の割合と語彙数を受け取り、成長度を計算する(S109)。
The
状態決定部14は、第2メモリ10bから得た極性の割合によってあらかじめ指定された重みに従って確率的に応答文の極性を決定する(S110)。
The
状態決定部14は、決定した応答文の極性に対応する応答文群を第3メモリ10cから抽出する。この時、応答文群は事前に第3メモリ10cに記憶されているものとする。抽出した応答文群には応答文と成長度閾値と極性とが記録されている。状態決定部14は、計算された成長度を成長度閾値と比較し、成長度閾値を超えた場合、対応する応答文を応答文1に設定する(S111)。
The
状態決定部14は、第4メモリ10dに総形態素数、per_pos、per_neg、per_neu、成長度、timeを記録する(S112)。
The
応答文送信部15は、選択した応答文をユーザ端末20に送信する(S113)。
The response
つぎに、本開示における対話装置100の作用効果について説明する。本開示における対話装置100は、ユーザからの発話を受け付ける発話受信部11と、ユーザの発話履歴に基づいてユーザとの対話に対する成長度を算出し、ユーザからの発話に対して、成長度に応じた応答文を取得する状態決定部14と、を備える。この状態決定部14は、成長度算出部および応答文取得部として機能する。
Next, the operation and effect of the
この構成により、ユーザとの対話の成長度に応じて応答文をかえることができる。従って、ユーザは、対話装置100が成長すればするほど、それに応じた応答文を受けることができ、その対話が機械的であると感じることが低減する。
With this configuration, the response statement can be changed according to the degree of growth of the dialogue with the user. Therefore, as the
さらに、成長度算出部として機能する状態決定部14は、発話履歴における、記ユーザの発話に用いられた形態素数(表現要素数)およびユーザの発話における極性種別(ポジティブ、ネガティブ、ニュートラル)の割合に基づいて成長度を算出する。ここでの形態素数は、第1メモリ10aにおいて記憶されている形態素の個数であり、語彙数を示す。また、極性種別の割合は、第2メモリ10bにおいて記憶されている全極性種別それぞれのポジティブ、ネガティブ、ニュートラルの割合の平均値または、その平均値に所定の重み付け処理をした値である。
Further, the
すなわち、成長度は、今までユーザが対話に用いた形態素数と、その発話におけるユーザの極性種別の割合に基づく。極性種別の割合は、ユーザの発話の傾向とみることができ、ユーザの発話は、ポジティブ傾向であるか、ネガティブ傾向であるか、そのどちらでもないニュートラル傾向であるか、を示す。 That is, the degree of growth is based on the morpheme number that the user has used for dialogue and the ratio of the user's polarity type in the utterance. The proportion of the polarity type can be seen as the tendency of the user's utterance, and indicates whether the user's utterance has a positive tendency, a negative tendency, or a neutral tendency that is neither of them.
そして、応答文取得部として機能する状態決定部14は、成長の度合いと、ユーザの発話の傾向に応じた応答文を選択する。
Then, the
本開示の対話装置100の成長度は、親密度を表す値であり、ユーザが対話装置100に話しかければ話しかけるほど成長度が高くなるように設計されている。ただし、同じ言葉ばかり話しかけても成長度は上がらないように設計されている。また、ユーザ端末20からの発話の感情を示した極性種別のバランスを算出し、極性のバランスが悪いと成長度が低くなるようにする。よって、成長度はユーザの発話から得た語彙の総数と極性とのバランスで決定される。一般的なユーザ(人間)にとって、ネガティブな感情とポジティブな感情との両方を受けることができることが理想的と言われている。
The degree of growth of the
これによって、極性種別のバランスを考慮した成長度を算出することで、理想的な応答を可能にする。これは、結果的にユーザは対話装置100に対して親密度を持つことができ、その対話を継続することに貢献することになる。
This enables an ideal response by calculating the degree of growth considering the balance of the polarity types. As a result, the user can have an intimacy with the
より具体的には、対話装置100は、ユーザからの発話を品詞ごとに分解して形態素(表現要素)を取得する発話分解部12と、形態素を発話履歴として記憶する品詞履歴記憶部として機能する第1メモリ10aとを備える。そして、状態決定部14は、第1メモリ10aに記憶されている形態素数に基づいて成長度を算出する。本開示においては、形態素解析を行い、これを発話履歴として記憶することで、語彙数の記憶を行う。
More specifically, the
また、対話装置100は、発話ごとに、極性種別の割合を記憶する極性種別記憶部として機能する第2メモリ10bをさらに備える。発話分解部12は、発話における形態素ごとの極性種別の割合を取得して第2メモリ10bに記憶する。そして、状態決定部14は、形態素数に加えて、第2メモリ10bにおける極性種別の割合に基づいて成長度を算出する。
Further, the
本開示の対話装置100において、応答文取得部として機能する状態決定部14は、成長度に加えて、ユーザの発話における極性種別に応じた応答文を取得する。その際、成長度算出部として機能する状態決定部14は、ユーザの発話における極性種別の割合に基づいて、応答文の種別を決定する。ユーザの発話における極性種別に応じた応答文は、ユーザの発話の感情傾向を示し、その傾向に応じた応答文を取得することができる。
In the
本開示の対話装置100は、応答文および成長閾値を対応付けた応答文記憶部としての第3メモリ10cをさらに備える。そして、応答文取得部として機能する状態決定部14は、成長度に応じた応答文を第3メモリ10cから取得する。その際、成長度以下となる成長閾値が設定されている応答文を取得する。この処理によって、成長度に応じた応答文を選択することができる。
The
ここで、第3メモリ10cは、極性種別をさらに対応付けて記憶しておく。そして、状態決定部14は、ユーザの発話の極性種別の傾向に応じた一または複数の応答文を選択することで、応答文の絞り込みを行い、さらに、成長度に応じた応答文を選択する。
Here, the
また、本開示の対話装置100において、第3メモリ10cは、さらに、トリガーワードを対応付けて記憶する。状態決定部14は、応答対象であるユーザの発話に含まれている形態素が、第3メモリ10cのトリガーワードに一致している一または複数の応答文を取得する。これにより、ユーザの発話にたいした応答文を適切に選択することができる。
Further, in the
また、本開示の対話装置100は、ユーザの発話に含まれた形態素、その極性種別、および成長度を記憶する。
Further, the
上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。 The block diagram used in the description of the above embodiment shows a block of functional units. These functional blocks (components) are realized by any combination of at least one of hardware and software. Further, the method of realizing each functional block is not particularly limited. That is, each functional block may be realized using one physically or logically coupled device, or two or more physically or logically separated devices can be directly or indirectly (eg, for example). , Wired, wireless, etc.) and may be realized using these plurality of devices. The functional block may be realized by combining the software with the one device or the plurality of devices.
機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)や送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。 Functions include judgment, decision, judgment, calculation, calculation, processing, derivation, investigation, search, confirmation, reception, transmission, output, access, solution, selection, selection, establishment, comparison, assumption, expectation, and assumption. There are broadcasting, notifying, communicating, forwarding, configuring, reconfiguring, allocating, mapping, assigning, etc., but only these. I can't. For example, a functional block (component) that makes transmission function is called a transmitting unit or a transmitter. In each case, as described above, the realization method is not particularly limited.
例えば、本開示の一実施の形態における対話装置100は、本開示の対話方法の処理を行うコンピュータとして機能してもよい。図12は、本開示の一実施の形態に係る対話装置100のハードウェア構成の一例を示す図である。上述の対話装置100は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
For example, the
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。対話装置100のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
In the following description, the word "device" can be read as a circuit, a device, a unit, or the like. The hardware configuration of the
対話装置100における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
For each function in the
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述の発話分解部12等は、プロセッサ1001によって実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、発話分解部12、ユーザ模倣部13、状態決定部14は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
Further, the
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る対話方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
The
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
The
通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述の発話受信部11および応答文送信部15などは、通信装置1004によって実現されてもよい。発話受信部11および応答文送信部15は、物理的に、または論理的に分離された実装がなされてもよいし、同一の実装がなされてもよい。
The
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
The
また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
Further, each device such as the
また、対話装置100は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
Further, the
本開示において説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G(4th generation mobile communication system)、5G(5th generation mobile communication system)、FRA(Future Radio Access)、NR(new Radio)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi(登録商標))、IEEE 802.16(WiMAX(登録商標))、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて(例えば、LTE及びLTE-Aの少なくとも一方と5Gとの組み合わせ等)適用されてもよい。 Each aspect / embodiment described in the present disclosure includes LTE (Long Term Evolution), LTE-A (LTE-Advanced), SUPER 3G, IMT-Advanced, 4G (4th generation mobile communication system), and 5G (5th generation mobile communication). system), FRA (Future Radio Access), NR (new Radio), W-CDMA (registered trademark), GSM (registered trademark), CDMA2000, UMB (Ultra Mobile Broadband), IEEE 802.11 (Wi-Fi (registered trademark)) )), LTE 802.16 (WiMAX®), IEEE 802.20, UWB (Ultra-WideBand), Bluetooth®, and other systems that utilize and extend based on these. It may be applied to at least one of the next generation systems. Further, a plurality of systems may be applied in combination (for example, a combination of at least one of LTE and LTE-A and 5G).
本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。 The order of the processing procedures, sequences, flowcharts, etc. of each aspect / embodiment described in the present disclosure may be changed as long as there is no contradiction. For example, the methods described in the present disclosure present elements of various steps using exemplary order, and are not limited to the particular order presented.
情報等は、上位レイヤ(又は下位レイヤ)から下位レイヤ(又は上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。 Information and the like can be output from the upper layer (or lower layer) to the lower layer (or upper layer). Input / output may be performed via a plurality of network nodes.
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。 The input / output information and the like may be stored in a specific place (for example, a memory), or may be managed using a management table. Information to be input / output may be overwritten, updated, or added. The output information and the like may be deleted. The input information or the like may be transmitted to another device.
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。 The determination may be made by a value represented by 1 bit (0 or 1), by a boolean value (Boolean: true or false), or by comparing numerical values (for example, a predetermined value). It may be done by comparison with the value).
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。 Each aspect / embodiment described in the present disclosure may be used alone, in combination, or may be switched and used according to the execution. Further, the notification of predetermined information (for example, the notification of "being X") is not limited to the explicit one, but is performed implicitly (for example, the notification of the predetermined information is not performed). May be good.
以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。 Although the present disclosure has been described in detail above, it is clear to those skilled in the art that the present disclosure is not limited to the embodiments described in the present disclosure. The present disclosure may be implemented as amendments and modifications without departing from the spirit and scope of the present disclosure as determined by the description of the scope of claims. Therefore, the description of this disclosure is for purposes of illustration and does not have any limiting meaning to this disclosure.
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。 Software, whether called software, firmware, middleware, microcode, hardware description language, or other names, instructions, instruction sets, codes, code segments, program codes, programs, subprograms, software modules. , Applications, software applications, software packages, routines, subroutines, objects, executable files, execution threads, procedures, features, etc. should be broadly interpreted.
また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。 Further, software, instructions, information and the like may be transmitted and received via a transmission medium. For example, a website that uses at least one of wired technology (coaxial cable, fiber optic cable, twisted pair, Digital Subscriber Line (DSL), etc.) and wireless technology (infrared, microwave, etc.). When transmitted from a server or other remote source, at least one of these wired and wireless technologies is included within the definition of transmission medium.
本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。 The information, signals, etc. described in the present disclosure may be represented using any of a variety of different techniques. For example, data, instructions, commands, information, signals, bits, symbols, chips, etc. that may be referred to throughout the above description are voltages, currents, electromagnetic waves, magnetic fields or magnetic particles, light fields or photons, or any of these. It may be represented by a combination of.
なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。例えば、チャネル及びシンボルの少なくとも一方は信号(シグナリング)であってもよい。また、信号はメッセージであってもよい。また、コンポーネントキャリア(CC:Component Carrier)は、キャリア周波数、セル、周波数キャリアなどと呼ばれてもよい。 The terms described in the present disclosure and the terms necessary for understanding the present disclosure may be replaced with terms having the same or similar meanings. For example, at least one of a channel and a symbol may be a signal (signaling). Also, the signal may be a message. Further, the component carrier (CC: Component Carrier) may be referred to as a carrier frequency, a cell, a frequency carrier, or the like.
本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。 The terms "system" and "network" used in this disclosure are used interchangeably.
また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。 Further, the information, parameters, etc. described in the present disclosure may be expressed using absolute values, relative values from predetermined values, or using other corresponding information. It may be represented.
本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。 The terms "determining" and "determining" used in this disclosure may include a wide variety of actions. "Judgment" and "decision" are, for example, judgment, calculation, computing, processing, deriving, investigating, looking up, search, inquiry. It may include (eg, searching in a table, database or another data structure), ascertaining as "judgment" or "decision". Also, "judgment" and "decision" are receiving (for example, receiving information), transmitting (for example, transmitting information), input (input), output (output), and access. It may include (for example, accessing data in memory) to be regarded as "judgment" or "decision". In addition, "judgment" and "decision" are considered to be "judgment" and "decision" when the things such as solving, selecting, choosing, establishing, and comparing are regarded as "judgment" and "decision". Can include. That is, "judgment" and "decision" may include considering some action as "judgment" and "decision". Further, "judgment (decision)" may be read as "assuming", "expecting", "considering" and the like.
「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。 The terms "connected", "coupled", or any variation thereof, mean any direct or indirect connection or connection between two or more elements and each other. It can include the presence of one or more intermediate elements between two "connected" or "combined" elements. The connection or connection between the elements may be physical, logical, or a combination thereof. For example, "connection" may be read as "access". As used in the present disclosure, the two elements use at least one of one or more wires, cables and printed electrical connections, and as some non-limiting and non-comprehensive examples, the radio frequency domain. Can be considered to be "connected" or "coupled" to each other using electromagnetic energy having wavelengths in the microwave and light (both visible and invisible) regions.
本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。 The phrase "based on" as used in this disclosure does not mean "based on" unless otherwise stated. In other words, the statement "based on" means both "based only" and "at least based on".
本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。 Any reference to elements using designations such as "first" and "second" as used in this disclosure does not generally limit the quantity or order of those elements. These designations can be used in the present disclosure as a convenient way to distinguish between two or more elements. Therefore, references to the first and second elements do not mean that only two elements can be adopted, or that the first element must somehow precede the second element.
上記の各装置の構成における「手段」を、「部」、「回路」、「デバイス」等に置き換えてもよい。 The "means" in the configuration of each of the above devices may be replaced with a "part", a "circuit", a "device" and the like.
本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。 When "include", "including" and variations thereof are used in the present disclosure, these terms are as inclusive as the term "comprising". Is intended. Moreover, the term "or" used in the present disclosure is intended not to be an exclusive OR.
本開示において、例えば、英語でのa、 an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。 In the present disclosure, if articles are added by translation, for example a, an and the in English, the disclosure may include the plural nouns following these articles.
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。 In the present disclosure, the term "A and B are different" may mean "A and B are different from each other". The term may mean that "A and B are different from C". Terms such as "separate" and "combined" may be interpreted in the same way as "different".
10a…第1メモリ、10b…第2メモリ、10c…第3メモリ、10d…第4メモリ、11…発話受信部、12…発話分解部、13…ユーザ模倣部、14…状態決定部、15…応答文送信部。
10a ... 1st memory, 10b ... 2nd memory, 10c ... 3rd memory, 10d ... 4th memory, 11 ... utterance receiving unit, 12 ... utterance decomposition unit, 13 ... user imitation unit, 14 ... state determination unit, 15 ... Response text transmitter.
Claims (10)
前記ユーザの発話履歴に基づいて前記ユーザとの対話に対する成長度を算出する成長度算出部と、
前記ユーザからの発話に対して、前記成長度に応じた応答文を取得する応答文取得部と、
を備える対話装置。 The utterance reception section that accepts utterances from users,
A growth degree calculation unit that calculates the growth degree for a dialogue with the user based on the utterance history of the user, and a growth degree calculation unit.
A response sentence acquisition unit that acquires a response sentence according to the degree of growth in response to the utterance from the user.
A dialogue device equipped with.
前記発話履歴における、前記ユーザの発話に用いられた表現要素数および前記ユーザの発話における極性種別の割合に基づいて成長度を算出する、
請求項1に記載の対話装置。 The growth degree calculation unit is
The degree of growth is calculated based on the number of expression elements used in the utterance of the user and the ratio of the polarity type in the utterance of the user in the utterance history.
The dialogue device according to claim 1.
前記表現要素を発話履歴として記憶する品詞履歴記憶部と、
を備え、
前記成長度算出部は、
前記品詞履歴記憶部に記憶されている表現要素数に基づいて成長度を算出する、
請求項1または2に記載の対話装置。 An utterance decomposition unit that decomposes utterances from the user for each part of speech and acquires expression elements,
A part-speech history storage unit that stores the expression element as an utterance history,
Equipped with
The growth degree calculation unit is
The degree of growth is calculated based on the number of expression elements stored in the part of speech history storage unit.
The dialogue device according to claim 1 or 2.
前記発話分解部は、
前記発話における前記表現要素ごとの極性種別の割合を取得して前記極性種別記憶部に記憶し、
前記成長度算出部は、前記表現要素数に加えて、前記極性種別記憶部における前記極性種別の割合に基づいて成長度を算出する、
請求項3に記載の対話装置。 It also has a polarity type storage unit that stores the ratio of polarity types for each utterance.
The utterance decomposition part is
The ratio of the polarity type for each expression element in the utterance is acquired and stored in the polarity type storage unit.
The growth degree calculation unit calculates the growth degree based on the ratio of the polarity type in the polarity type storage unit in addition to the number of expression elements.
The dialogue device according to claim 3.
請求項1~4のいずれか一項に記載の対話装置。 In addition to the degree of growth, the response sentence acquisition unit acquires a response sentence according to the polarity type in the utterance of the user.
The dialogue device according to any one of claims 1 to 4.
前記ユーザの発話における極性種別の割合に基づいて、応答文の種別を決定する、
請求項5に記載の対話装置。 The growth degree calculation unit is
The type of response sentence is determined based on the ratio of the polarity type in the user's utterance.
The dialogue device according to claim 5.
前記応答文取得部は、
前記成長度に応じた応答文を前記応答文記憶部から取得する、
請求項1~6のいずれか一項に記載の対話装置。 A response sentence storage unit associated with a response sentence and a growth threshold is further provided.
The response sentence acquisition unit
The response sentence corresponding to the growth degree is acquired from the response sentence storage unit.
The dialogue device according to any one of claims 1 to 6.
前記応答文取得部は、前記ユーザの発話の極性種別の傾向に応じた一または複数の応答文を選択し、
さらに、成長度に応じた応答文を選択する、
請求項7に記載の対話装置。 The response sentence storage unit further associates and stores the polarity types, and stores the polar types.
The response sentence acquisition unit selects one or more response sentences according to the tendency of the polarity type of the user's utterance.
In addition, select a response statement according to the degree of growth,
The dialogue device according to claim 7.
前記応答文取得部は、応答対象である前記ユーザの発話に含まれている表現要素が、前記応答文記憶部のトリガーワードに一致している一または複数の応答文を取得する、
請求項7または8に記載の対話装置。 The response sentence storage unit further stores the trigger words in association with each other.
The response sentence acquisition unit acquires one or more response sentences in which the expression element included in the utterance of the user who is the response target matches the trigger word of the response sentence storage unit.
The dialogue device according to claim 7 or 8.
さらに備える請求項1~9のいずれか一項に記載の対話装置。
The dialogue device according to any one of claims 1 to 9, further comprising a growth degree storage unit for storing the number of expression elements included in the user's utterance, the polarity type thereof, and the growth degree.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020129102A JP2022025917A (en) | 2020-07-30 | 2020-07-30 | Dialog device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020129102A JP2022025917A (en) | 2020-07-30 | 2020-07-30 | Dialog device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022025917A true JP2022025917A (en) | 2022-02-10 |
Family
ID=80264747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020129102A Pending JP2022025917A (en) | 2020-07-30 | 2020-07-30 | Dialog device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022025917A (en) |
-
2020
- 2020-07-30 JP JP2020129102A patent/JP2022025917A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10460029B2 (en) | Reply information recommendation method and apparatus | |
US10217464B2 (en) | Vocabulary generation system | |
CN106202059B (en) | Machine translation method and machine translation device | |
US9229924B2 (en) | Word detection and domain dictionary recommendation | |
JP6802364B2 (en) | Dialogue system | |
KR101982081B1 (en) | Recommendation System for Corresponding Message | |
WO2019225154A1 (en) | Created text evaluation device | |
US20200210505A1 (en) | Electronic apparatus and controlling method thereof | |
US20220027575A1 (en) | Method of predicting emotional style of dialogue, electronic device, and storage medium | |
CN115309877B (en) | Dialogue generation method, dialogue model training method and device | |
US11663420B2 (en) | Dialogue system | |
US10282417B2 (en) | Conversational list management | |
JP2020187262A (en) | Emotion estimation device, emotion estimation system, and emotion estimation method | |
JP7114307B2 (en) | Information processing equipment | |
JP2022025917A (en) | Dialog device | |
CN114490967B (en) | Training method of dialogue model, dialogue method and device of dialogue robot and electronic equipment | |
JP2021512384A (en) | Quantum superposition and entanglement of social emotions and natural language generation | |
US11604831B2 (en) | Interactive device | |
JP7043593B2 (en) | Dialogue server | |
CN113870998A (en) | Interrogation method, device, electronic equipment and storage medium | |
JP2021082125A (en) | Dialogue device | |
WO2019098185A1 (en) | Dialog text generation system and dialog text generation program | |
US11468106B2 (en) | Conversation system | |
JPWO2019220791A1 (en) | Dialogue device | |
WO2021157254A1 (en) | Analysis device |