JP2021056668A - キャラクタに応じたテキストを発話するエージェントのプログラム、装置及び方法 - Google Patents
キャラクタに応じたテキストを発話するエージェントのプログラム、装置及び方法 Download PDFInfo
- Publication number
- JP2021056668A JP2021056668A JP2019177865A JP2019177865A JP2021056668A JP 2021056668 A JP2021056668 A JP 2021056668A JP 2019177865 A JP2019177865 A JP 2019177865A JP 2019177865 A JP2019177865 A JP 2019177865A JP 2021056668 A JP2021056668 A JP 2021056668A
- Authority
- JP
- Japan
- Prior art keywords
- comment
- reply
- user
- character
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 37
- 239000003795 chemical substances by application Substances 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000006855 networking Effects 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000002452 interceptive effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 11
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 239000002537 cosmetic Substances 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000003796 beauty Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
エージェントは、ユーザプロファイルと同様に、キャラクタに個性(年齢、性別等)を持たせる。ユーザは、例えば個性を持つキャラクタと対話することによって、強い親近感を持つことができる。
また、エージェントは、キャラクタの個性に合わせた対話シナリオを、人手で作成する必要がある(例えば非特許文献1参照)。そのために、個性を持つキャラクタのエージェントを作り込むことができる。
ユーザと対話するキャラクタ毎に、ペルソナキーワードが付与されており、
SNS(Social Networking Service)サーバから、所定コンテンツに関して投稿されたリプライ元コメントと、各リプライ元コメントに関して投稿されたリプライコメントとを収集するリプライコメント収集手段と、
ユーザ発話テキストに最も類似するリプライ元コメントを検索するリプライ元コメント検索手段と、
検索されたリプライ元コメントに対する複数のリプライコメントについて、各リプライコメントを投稿した複数のユーザアカウントを検索するユーザアカウント検索手段と、
SNSサーバから、検索された複数のユーザアカウントにおける過去の投稿コメントを収集する投稿コメント収集手段と、
複数のユーザアカウントの過去の投稿コメントの中で、ペルソナキーワードを含む割合が最も高いユーザアカウントを決定するユーザアカウント決定手段と、
決定されたユーザアカウントについて、リプライコメント収集手段によって収集されたリプライコメントを、キャラクタ発話テキストとして返答するキャラクタ返答手段と
してコンピュータを機能させることを特徴とする。
リプライ元コメント検索手段は、
ユーザ発話テキストに出現する名詞と同じ名詞を最も多く含むリプライ元コメント、
又は、
ユーザ発話テキストの文字要素に基づくベクトルに対して、コサイン類似度が最も高いベクトルを持つリプライ元コメント
を検索する
ようにコンピュータを更に機能させることも好ましい。
SNSサーバから収集した投稿コメント群を、ペルソナキーワードを含む投稿コメント群と、ペルソナキーワードを含まない投稿コメント群とに区分し、ペルソナキーワードを含む投稿コメント群に特徴的に出現する名詞を、関連キーワードとして抽出する関連キーワード抽出手段と
して更に機能させ、
ユーザアカウント決定手段は、ペルソナキーワード及び/又は関連キーワードを含む割合が最も高いユーザアカウントを決定する
ようにコンピュータを機能させることも好ましい。
関連キーワード抽出手段は、赤池情報量規準(AIC:Akaike's Information Criterion)を用いて、特定のペルソナキーワードを含む投稿コメント群P1に対する任意のキーワードを含む投稿コメント群P2の評価値V(P1,P2)を算出し、当該評価値V(P1,P2)が所定閾値以上となる、又は、当該評価値V(P1,P2)が大きいものから順に所定数となる、任意のキーワードP2を関連キーワードとして抽出する
p11:特定のペルソナキーワードを含む投稿コメント群P1の中で、任意のキーワードを含む投稿コメント群P2の数
p12:特定のペルソナキーワードを含む投稿コメント群P1の中で、任意のキーワードを含まない投稿コメント群P2の数
p21:特定のペルソナキーワードを含まない投稿コメント群P1の中で、任意のキーワードを含む投稿コメント群P2の数
p22:特定のペルソナキーワードを含まない投稿コメント群P1の中で、任意のキーワードを含まない投稿コメント群P2の数
p11+p12+p21+p22=全てのユーザが投稿した投稿コメント数
MLL_IM(P1,P2)=(p11+p12) log(p11+p12)
+(p11+p21) log(p11+p21)
+(p21+p22) log(p21+p22)
+(p12+p22) log(p12+p22)−2N log N
MLL_DM(P1,P2)=p11 log p11+p12 log p12+p21 log p21+p22 log p22−N log N
但し、N=p11+p12+p21+p22
AIC_IM(P1,P2)=-2 × MLL_IM(P1,P2) + 2×2
AIC_IM(P1,P2):特定のペルソナキーワードを含む投稿コメント群と、任意のキーワードを含む投稿コメント群との組の従属AIC
AIC_DM(P1,P2)=-2 × MLL_DM(P1,P2) + 2×3
AIC_DM(P1,P2):特定のペルソナキーワードを含む投稿コメント群と、任意のキーワードを含む投稿コメント群との組の独立AIC
V(P1,P2)=AIC_IM(P1,P2) − AIC_DM(P1,P2)
としてコンピュータを機能させることも好ましい。
キャラクタに応じた所定コンテンツを選定するために、コンテンツデータベースから、キャラクタキーワード及び/又は関連キーワードを含む割合が最も高いコンテンツを決定するコンテンツ決定手段と
してコンピュータを更に機能させることも好ましい。
複数のキャラクタと、キャラクタ毎のペルソナキーワードとが予め設定されており、
SNSサーバから、対話対象となるユーザのユーザアカウントから過去に投稿された投稿コメント群の中に、各キャラクタのペルソナキーワード及び/又は関連キーワードが含まれている割合が最も多いキャラクタを選択するキャラクタ選択手段と
してコンピュータを更に機能させることも好ましい。
複数のキャラクタと、キャラクタ毎のペルソナキーワードとが予め設定されており、
対話前に、ユーザに対して、複数のキャラクタの中で、いずれかのキャラクタを選択させるキャラクタ選択手段と
してコンピュータを更に機能させることも好ましい。
コンテンツは、現時刻から所定期間前までに報道されたニュース記事であり、
コンテンツ決定手段によって決定された当該ニュース記事のタイトルを、最初に、キャラクタ発話テキストとして出力する
ようにコンピュータを更に機能させることも好ましい。
ユーザとキャラクタとが対話フォームを介して対話する対話フォームインタフェース手段として更に機能させ、
対話フォームインタフェース手段は、
ユーザに対して、所定コンテンツに関するテキストを、キャラクタ発話テキストとして表示し、
ユーザに対して、入力フォームを表示して、ユーザ発話テキストを入力させ、
ユーザに対して、キャラクタ返答手段におけるリプライコメントを、キャラクタ発話テキストとして表示する
ようにコンピュータを機能させることも好ましい。
ユーザから発話された音声を音声認識処理によって変換したテキストを、ユーザ発話テキストとして入力し、
キャラクタ返答手段におけるリプライコメントから音声変換処理によって変換した音声を、キャラクタ発話テキストとして出力する
ようにコンピュータを機能させることも好ましい。
ユーザと対話するキャラクタ毎に、ペルソナキーワードが付与されており、
SNSサーバから、所定コンテンツに関して投稿されたリプライ元コメントと、各リプライ元コメントに関して投稿されたリプライコメントとを収集するリプライコメント収集手段と、
ユーザ発話テキストに最も類似するリプライ元コメントを検索するリプライ元コメント検索手段と、
検索されたリプライ元コメントに対する複数のリプライコメントについて、各リプライコメントを投稿した複数のユーザアカウントを検索するユーザアカウント検索手段と、
SNSサーバから、検索された複数のユーザアカウントにおける過去の投稿コメントを収集する投稿コメント収集手段と、
複数のユーザアカウントの過去の投稿コメントの中で、ペルソナキーワードを含む割合が最も高いユーザアカウントを決定するユーザアカウント決定手段と、
決定されたユーザアカウントについて、リプライコメント収集手段によって収集されたリプライコメントを、キャラクタ発話テキストとして返答するキャラクタ返答手段と
を有することを特徴とする。
装置は、
ユーザと対話するキャラクタ毎に、ペルソナキーワードが付与されており、
SNSサーバから、所定コンテンツに関して投稿されたリプライ元コメントと、各リプライ元コメントに関して投稿されたリプライコメントとを収集する第1のステップと、
ユーザ発話テキストに最も類似するリプライ元コメントを検索する第2のステップと、
検索されたリプライ元コメントに対する複数のリプライコメントについて、各リプライコメントを投稿した複数のユーザアカウントを検索する第3のステップと、
SNSサーバから、検索された複数のユーザアカウントにおける過去の投稿コメントを収集する第4のステップと、
複数のユーザアカウントの過去の投稿コメントの中で、ペルソナキーワードを含む割合が最も高いユーザアカウントを決定する第5のステップと、
決定されたユーザアカウントについて、リプライコメント収集手段によって収集されたリプライコメントを、キャラクタ発話テキストとして返答する第6のステップと
を実行することを特徴とする。
また、端末2は、例えば、AIスピーカ(例えばAlexa(登録商標))であって、ユーザに対するマイク及びスピーカを有するものであってもよい。端末2は、キャラクタ発話テキストを音声としてユーザへ発話することができる。また、音声認識によって、ユーザは自声の発話によってユーザ発話テキストを入力することができる。
キャラクタA:「”バドミントンワールドツアーが開催!”というニュースがあるよ」
ユーザ :「体育大を卒業した選手が出場するみたいだね」
キャラクタA:「ラケットワークとフットワークが凄く上手いと思うよ」
ここでは、最初にキャラクタが、コンテンツとしてニュース記事をユーザに提示し、それに対して、ユーザとキャラクタAと間で対話が進行されている。
対話装置1は、端末2からユーザ発話テキストを入力し、キャラクタに応じたキャラクタ発話テキストを返答する。これによって、対話装置1によって制御されるキャラクタは、ユーザとできる限り自然な対話を進行させる。
対話フォームインタフェース部10は、ユーザとキャラクタとの間で対話フォームを介して対話させる。
対話フォームインタフェース部10は、ユーザに対して、キャラクタの吹き出しとしてキャラクタ発話テキストを表示する。ユーザがその返答をテキストで入力する場合、ユーザに対して入力フォームを表示して、ユーザ発話テキストを入力させる。
また、対話フォームインタフェース部10は、キャラクタ発話テキストを、音声変換処理によって変換した音声として出力するものであってもよい。また、ユーザがその返答を音声で入力する場合、端末2のディスプレイにマイク入力ボタンを表示する。ユーザから発話された音声を音声認識処理によって変換したテキストを、ユーザ発話テキストとして取得する。
キャラクタ選択部11は、エージェントとして対話を開始する前に、ユーザと対話するキャラクタを選択する。キャラクタ選択部11は、複数のキャラクタの中から、ユーザと対話するキャラクタを決定する。
キャラクタA:「バドミントン好き若年女性」
ペルソナキーワード「バドミントン」「化粧」
キャラクタB:「政治経済に詳しいサラリーマン」
ペルソナキーワード「政治」「経済」
・・・・・
「ペルソナキーワード」とは、そのキャラクタを特徴付けるキーワードを意味する。
また、キャラクタ毎に、そのキャラクタの姿を描写した画像(キャラクタアイコン)も登録されている。
図3は、キャラクタのユーザ選択を表すキャラクタ選択部の説明図である。
図3によれば、ユーザ@aaaは、タップによってキャラクタA「バドミントン好きの若年女性」を選択している。
図4は、ペルソナキーワードに基づくキャラクタの自動選択を表すキャラクタ選択部の説明図である。
「バドミントン」->32回
「化粧」->46回
「政治」->0回
「経済」->2回
そして、キャラクタ毎に、ペルソナキーワードの頻度平均をキャラクタスコアとし、キャラクタスコアが最も高いキャラクタを選択する。
キャラクタA「バドミントン好き若年女性」
平均スコア39(=(32+46)/2)
キャラクタB「政治経済に詳しいサラリーマン男性」
平均スコア1(=(0+2)/2)
この場合、平均スコアが最も高いキャラクタAが、対話相手として選択される。
<キャラクタのユーザ選択>
複数のキャラクタの個性又は名前を音声によって読み上げ、ユーザがいずれかを発話によって選択することもできる。
エージェント「A、バドミントン好き若年女性、
B、政治経済に詳しいサラリーマン男性、どちらにしますか?」
ユーザ 「A」
ユーザに所望するキャラクタの個性を発話させて、そのユーザ発話テキスト内の単語と、各キャラクタの個性やペルソナキーワードとの類似度を計算し、類似度が高い方のキャラクタを選択することができる。類似度は、例えば文字要素をベクトル化してコサイン類似度によって算出することもできる。
エージェント「対話したいキャラクタの個性をお答えください」
ユーザ 「スポーツ好きな女性と話したいな」
キャラクタA:「バドミントン好き若年女性」
キャラクタB:「政治経済に詳しいサラリーマン」
(エージェントは、「女性」によって、キャラクタAを自動選択)
エージェント 「キャラクタA、バドミントン好き若年女性、が選択されました」
尚、類似度の算出方法については、後述するリプライ元コメント検索部15の中で説明する。
関連キーワード抽出部12は、SNSサーバ4から収集した投稿コメント群を、「ペルソナキーワードを含む投稿コメント群」と、「ペルソナキーワードを含まない投稿コメント群」とに区分し、ペルソナキーワードを含む投稿コメント群に特徴的に出現する名詞を、「関連キーワード」として抽出する。
ここで、SNSサーバ4から収集する投稿コメント群は、不特定多数のユーザ群から投稿されたものであって、特定のユーザに限るものではない。
p11:特定のペルソナキーワードを含む投稿コメント群P1の中で、任意のキーワードを含む投稿コメント群P2の数
p12:特定のペルソナキーワードを含む投稿コメント群P1の中で、任意のキーワードを含まない投稿コメント群P2の数
p21:特定のペルソナキーワードを含まない投稿コメント群P1の中で、任意のキーワードを含む投稿コメント群P2の数
p22:特定のペルソナキーワードを含まない投稿コメント群P1の中で、任意のキーワードを含まない投稿コメント群P2の数
p11+p12+p21+p22=全てのユーザが投稿した投稿コメント数
MLL_IM(P1,P2)=(p11+p12) log(p11+p12)
+(p11+p21) log(p11+p21)
+(p21+p22) log(p21+p22)
+(p12+p22) log(p12+p22)−2N log N
MLL_DM(P1,P2)=p11 log p11+p12 log p12+p21 log p21+p22 log p22−N log N
但し、N=p11+p12+p21+p22
AIC_IM(P1,P2)=-2 × MLL_IM(P1,P2) + 2×2
AIC_IM(P1,P2):特定のペルソナキーワードを含む投稿コメント群と、任意のキーワードを含む投稿コメント群との組の従属AIC
AIC_DM(P1,P2)=-2 × MLL_DM(P1,P2) + 2×3
AIC_DM(P1,P2):特定のペルソナキーワードを含む投稿コメント群と、任意のキーワードを含む投稿コメント群との組の独立AIC
V(P1,P2)=AIC_IM(P1,P2) − AIC_DM(P1,P2)
キャラクタA:「バドミントン」を含む投稿コメント群
「バドミントン」を含まない投稿コメント群
「化粧」を含む投稿コメント群
「化粧」を含まない投稿コメント群
次に、投稿コメント群に含まれる名詞が高頻度且つ偏って出現する割合として、赤池情報量規準を用いて、各名詞の評価値(度合い)を算出する。そして、その評価値が高い順に、例えば上位3つのキーワードを、そのペルソナキーワードに対する関連キーワードとして対応付ける。
図5によれば、例えばペルソナキーワード「バドミントン」が含まれる投稿コメントには、関連キーワード「シングルス」「ダブルス」「スマッシュ」が、高頻度且つ偏って出現すると認識される。
また、例えばペルソナキーワード「化粧品」が含まれる投稿コメントには、関連キーワード「コスメ」「美容」「口紅」が、高頻度且つ偏って出現すると認識される。
コンテンツ決定部13は、キャラクタに応じた所定コンテンツを選定するために、コンテンツデータベースから、キャラクタキーワード及び/又は関連キーワードを含む割合が最も高いコンテンツを決定する。
ここで、コンテンツは、例えば現時刻から所定期間前(例えば1週間前)までに報道されたニュース記事であってもよい。コンテンツデータベースは、インターネット上のWebサイトから収集されるものであってもよいし、対話装置1が自ら蓄積したものであってもよい。
コンテンツとなるニュース記事としては、例えばYahoo(登録商標)ニュースのようなものがある。
例えば、ペルソナキーワードが「バドミントン」であれば、「バドミントン」とは直接は関係のない以下のようなニュース記事が選択されることを回避することができる。
ニュース記事「”高校のバドミントン部顧問が、授業中に生徒と大喧嘩”
このようなニュース記事は、「バドミントン」「シングルス」「ダブルス」「スマッシュ」も含む割合が高いコンテンツを選択することによって、検索されなくなる。
-------------------------------------------------------------------------------
[タイトル]バドミントン世界大会が開催!
[本文]
5月2日に東京でバドミントン世界大会のオープニングセレモニーが開催される。5月3日は男子シングルスと男子ダブルスの試合を控えており、付近は大混雑になると予想される。男子シングルスでは、期待の新人Tが試合に出場する。
-------------------------------------------------------------------------------
「バドミントン」の関連キーワードが、以下のように検出されるとする。
「シングルス」:AICの度合い=153.6、出現回数2回
「ダブルス」 :AICの度合い=115.2、出現回数1回
「スマッシュ」:AICの度合い=86.3、出現回数0回
このニュース記事のscoreは、以下のように算出される。
score=2×153.6+1×115.2+0×86.3=422.4
このように、ペルソナキーワード毎に、「バドミントン」を含むニュース記事と、「化粧」を含むニュース記事とそれぞれのscoreを算出する。ここでは、最もscoreが高いニュース記事11が決定される。
キャラクタ発話テキスト:
「”バドミントン世界大会が開催!”というニュースがあるよ」
このように、キャラクタが最初に、そのペルソナキーワード及び関連キーワードに基づく話題を、ユーザ@aaaへ発話する。そして、これに対するユーザからの発話を待つ。
リプライコメント収集部14は、SNSサーバ4から、所定コンテンツに関して投稿されたリプライ元コメントと、各リプライ元コメントに関して投稿されたリプライコメントとのセットを収集する。
「リプライ元コメント」とは、ニュース記事のようなコンテンツに対する、不特定多数のユーザのコメントを意味する。
「リプライコメント」とは、リプライ元コメントに対する、不特定多数のユーザのコメントを意味する。
例えば、コンテンツとなるニュース記事となるYahooニュースの場合、ニュース記事と共に、不特定多数のユーザから投稿されたリプライ元コメント及びリプライコメントとのセットも公開されている。
ニュース記事11に対して、ユーザAは、リプライ元コメントとして「女子はいつから始まるのかな?」と投稿しており、そのリプライ元コメントに対して、ユーザBは、リプライコメントとして「来月かららしいよ」と投稿し、ユーザCも、リプライコメントとして「来月だよ。会場行くんだ!」と投稿している。
同様に、ニュース記事11に対して、ユーザDは、リプライ元コメントとして「体育大を卒業した選手が出場するのか〜」と投稿しており、それに対するリプライコメントが、ユーザE及びFから投稿されている。また、ユーザGは、リプライ元コメントとして「久しぶりにバドミントンやろうかね」と投稿しており、それに対するリプライコメントが、ユーザH、I及びJから投稿されている。
リプライ元コメント検索部15は、ユーザ発話テキストに最も類似するリプライ元コメントを検索する。リプライ元コメント検索部15は、例えば以下のいずれかによって、最も類似するリプライ元コメントを検索する。
(1)ユーザ発話テキストに出現する名詞と同じ名詞を最も多く含むリプライ元コメント、
(2)ユーザ発話テキストの文字要素に基づくベクトルに対して、コサイン類似度が最も高いベクトルを持つリプライ元コメント
キャラクタ発話テキスト:
「”バドミントン世界大会が開催!”というニュースがあるよ」
ユーザ発話テキスト:
「体育大を卒業した選手が出場するみたいだね」
この場合、ユーザ発話テキスト「体育大を卒業した選手が出場するみたいだね」に最も類似するリプライ元コメントを検索する。
そして、ニュース記事11に対する複数のリプライ元コメントの中から、以下のリプライ元コメントが検索される。
リプライ元コメント(ユーザD):
「体育大卒業した選手が出場するのか〜」
前述したキャラクタ選択部11のユーザの自動選択や、リプライ元コメント検索部15のリプライ元コメントの検索における、キーワードの類似度算出方法について説明する。類似度は、例えば、キーワード(テキストに含まれる文字要素)をベクトルに変換し、2つのベクトル間の距離を「コサイン類似度」として算出するものであってもよい。
「Bag-of-Words」とは、テキストに含まれる各単語の出現頻度のみを表現したベクトルをいう。ここでは、単語の出現順は無視される。この特徴ベクトルは、単語を軸とし、出現頻度を値として、その空間の1点にそのテキストを位置付けたものである。
そして、ユーザ発話テキストaの特徴ベクトルVaと、リプライ元コメントbの特徴ベクトルVbとの間で、コサイン類似度S(a,b)を算出する。
S(a,b)=cosθ=(Va・Vb)/(|Va||Vb|)
コサイン類似度S(a,b)は、0〜1の値となり、類似性が高いほど1に近づく。
「Word2vec」とは、単語の意味や文法を捉えるために単語をベクトル表現化して次元を圧縮する技術をいう。
勿論、Bag Of WordsやWord2vecに限ることなく、各単語の品詞又は意味を解析した特徴ベクトルに変換することができればよい。
ユーザアカウント検索部16は、検索されたリプライ元コメントに対する複数のリプライコメントについて、各リプライコメントを投稿した複数のユーザアカウントを検索する。
リプライ元コメント(ユーザD):
「体育大卒業した選手が出場するのか〜」
リプライコメント(ユーザE):
「体育大出身なのは期待できるよね」
リプライコメント(ユーザF):
「ラケットワークとフットワークが凄く上手いと思うよ」
即ち、ユーザDが投稿したリプライ元コメントと、ユーザFが投稿したリプライ元コメントとは、ユーザ発話テキスト「体育大を卒業した選手が出場するみたいだね」に対して、キャラクタが発話しそうなものとなる。
ユーザアカウント検索部16は、検索結果としてユーザE及びFを、投稿コメント収集部17へ出力する。
投稿コメント収集部17は、SNSサーバ4から、検索された複数のユーザアカウントにおける過去の投稿コメントを収集する。
収集される過去の投稿コメントとしては、各ユーザアカウントについて、特定のSNSサーバ4に対する過去の全ての投稿コメントであってもよいし、例えばYahooニュースに対する過去の全ての投稿コメントであってもよい。特に、Yahooニュースの場合、SNSサーバ4と同様に、各ユーザアカウントにおける過去に投稿された全てのコメントを取得することができる。
ユーザE:「今日の夕ご飯ハンバーグだった。」
「運動不足だなー、、、」
「今日映画でも観に行くか〜」
・・・・・
ユーザF:「今日試合頑張ろう」
「今日はバドミントンのシングルスの試合だから水分補給をしっかりしよう」
「コンビニいってお菓子を買おう」
・・・・・
ユーザアカウント決定部18は、複数のユーザアカウントの過去の投稿コメントの中で、ペルソナキーワード及び/又は関連キーワードを含む割合が最も高いユーザアカウントを決定する。
例えば、ユーザEの過去の投稿コメント群について、「バドミントン」を含む投稿コメント群と、「バドミントン」を含まない投稿コメント群とに分類し、AICの度合いを算出する。また、関連キーワード「シングルス」「ダブルス」「スマッシュ」についても、AICの度合いを算出する。
同様に、ユーザFの過去の投稿コメント群についても、「バドミントン」「シングルス」「ダブルス」「スマッシュ」について、AICの度合いを算出する。
最終的に、全てのキーワードのAICの度合いの加算値が最も高いユーザアカウントが決定される。図10によれば、ユーザFが決定される。
キャラクタ返答部19は、決定されたユーザアカウントについて、リプライコメント収集部14によって収集されたリプライコメントを、キャラクタ発話テキストとして返答する。
リプライコメント(ユーザF):
「ラケットワークとフットワークが凄く上手いと思うよ」
最終的に、キャラクタAとユーザ@aaaとの間で、前述した図1のような対話が成立する。
10 対話フォームインタフェース部
11 キャラクタ選択部
12 関連キーワード抽出部
13 コンテンツ決定部
14 リプライコメント収集部
15 リプライ元コメント検索部
16 ユーザアカウント検索部
17 投稿コメント収集部
18 ユーザアカウント決定部
19 キャラクタ返答部
2 端末
3 コンテンツサーバ
4 SNSサーバ
Claims (12)
- 所定コンテンツに関して、ユーザ発話テキストを入力し、キャラクタ発話テキストを返答するエージェントとしてコンピュータを機能させるプログラムであって、
ユーザと対話するキャラクタ毎に、ペルソナキーワードが付与されており、
SNS(Social Networking Service)サーバから、所定コンテンツに関して投稿されたリプライ元コメントと、各リプライ元コメントに関して投稿されたリプライコメントとを収集するリプライコメント収集手段と、
ユーザ発話テキストに最も類似するリプライ元コメントを検索するリプライ元コメント検索手段と、
検索されたリプライ元コメントに対する複数のリプライコメントについて、各リプライコメントを投稿した複数のユーザアカウントを検索するユーザアカウント検索手段と、
SNSサーバから、検索された複数のユーザアカウントにおける過去の投稿コメントを収集する投稿コメント収集手段と、
複数のユーザアカウントの過去の投稿コメントの中で、ペルソナキーワードを含む割合が最も高いユーザアカウントを決定するユーザアカウント決定手段と、
決定されたユーザアカウントについて、リプライコメント収集手段によって収集されたリプライコメントを、キャラクタ発話テキストとして返答するキャラクタ返答手段と
してコンピュータを機能させることを特徴とするプログラム。 - リプライ元コメント検索手段は、
ユーザ発話テキストに出現する名詞と同じ名詞を最も多く含むリプライ元コメント、
又は、
ユーザ発話テキストの文字要素に基づくベクトルに対して、コサイン類似度が最も高いベクトルを持つリプライ元コメント
を検索する
ようにコンピュータを更に機能させることを特徴とする請求項1に記載のプログラム。 - SNSサーバから収集した投稿コメント群を、ペルソナキーワードを含む投稿コメント群と、ペルソナキーワードを含まない投稿コメント群とに区分し、ペルソナキーワードを含む投稿コメント群に特徴的に出現する名詞を、関連キーワードとして抽出する関連キーワード抽出手段と
して更に機能させ、
ユーザアカウント決定手段は、ペルソナキーワード及び/又は関連キーワードを含む割合が最も高いユーザアカウントを決定する
ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。 - 関連キーワード抽出手段は、赤池情報量規準(AIC:Akaike's Information Criterion)を用いて、特定のペルソナキーワードを含む投稿コメント群P1に対する任意のキーワードを含む投稿コメント群P2の評価値V(P1,P2)を算出し、当該評価値V(P1,P2)が所定閾値以上となる、又は、当該評価値V(P1,P2)が大きいものから順に所定数となる、任意のキーワードP2を関連キーワードとして抽出する
p11:特定のペルソナキーワードを含む投稿コメント群P1の中で、任意のキーワードを含む投稿コメント群P2の数
p12:特定のペルソナキーワードを含む投稿コメント群P1の中で、任意のキーワードを含まない投稿コメント群P2の数
p21:特定のペルソナキーワードを含まない投稿コメント群P1の中で、任意のキーワードを含む投稿コメント群P2の数
p22:特定のペルソナキーワードを含まない投稿コメント群P1の中で、任意のキーワードを含まない投稿コメント群P2の数
p11+p12+p21+p22=全てのユーザが投稿した投稿コメント数
MLL_IM(P1,P2)=(p11+p12) log(p11+p12)
+(p11+p21) log(p11+p21)
+(p21+p22) log(p21+p22)
+(p12+p22) log(p12+p22)−2N log N
MLL_DM(P1,P2)=p11 log p11+p12 log p12+p21 log p21+p22 log p22−N log N
但し、N=p11+p12+p21+p22
AIC_IM(P1,P2)=-2 × MLL_IM(P1,P2) + 2×2
AIC_IM(P1,P2):特定のペルソナキーワードを含む投稿コメント群と、任意のキーワードを含む投稿コメント群との組の従属AIC
AIC_DM(P1,P2)=-2 × MLL_DM(P1,P2) + 2×3
AIC_DM(P1,P2):特定のペルソナキーワードを含む投稿コメント群と、任意のキーワードを含む投稿コメント群との組の独立AIC
V(P1,P2)=AIC_IM(P1,P2) − AIC_DM(P1,P2)
としてコンピュータを機能させることを特徴とする請求項3に記載のプログラム。 - キャラクタに応じた所定コンテンツを選定するために、コンテンツデータベースから、キャラクタキーワード及び/又は関連キーワードを含む割合が最も高いコンテンツを決定するコンテンツ決定手段と
してコンピュータを更に機能させることを特徴とする請求項3又は4に記載のプログラム。 - 複数のキャラクタと、キャラクタ毎のペルソナキーワードとが予め設定されており、
SNSサーバから、対話対象となるユーザのユーザアカウントから過去に投稿された投稿コメント群の中に、各キャラクタのペルソナキーワード及び/又は関連キーワードが含まれている割合が最も多いキャラクタを選択するキャラクタ選択手段と
してコンピュータを更に機能させることを特徴とする請求項3から5のいずれか1項に記載のプログラム。 - 複数のキャラクタと、キャラクタ毎のペルソナキーワードとが予め設定されており、
対話前に、ユーザに対して、複数のキャラクタの中で、いずれかのキャラクタを選択させるキャラクタ選択手段と
してコンピュータを更に機能させることを特徴とする請求項1から5のいずれか1項に記載のプログラム。 - コンテンツは、現時刻から所定期間前までに報道されたニュース記事であり、
コンテンツ決定手段によって決定された当該ニュース記事のタイトルを、最初に、キャラクタ発話テキストとして出力する
ようにコンピュータを更に機能させることを特徴とする請求項1から7のいずれか1項に記載のプログラム。 - ユーザとキャラクタとが対話フォームを介して対話する対話フォームインタフェース手段として更に機能させ、
対話フォームインタフェース手段は、
ユーザに対して、所定コンテンツに関するテキストを、キャラクタ発話テキストとして表示し、
ユーザに対して、入力フォームを表示して、ユーザ発話テキストを入力させ、
ユーザに対して、キャラクタ返答手段におけるリプライコメントを、キャラクタ発話テキストとして表示する
ようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載のプログラム。 - ユーザから発話された音声を音声認識処理によって変換したテキストを、ユーザ発話テキストとして入力し、
キャラクタ返答手段におけるリプライコメントから音声変換処理によって変換した音声を、キャラクタ発話テキストとして出力する
ようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載のプログラム。 - 所定コンテンツに関して、ユーザ発話テキストを入力し、キャラクタ発話テキストを返答するエージェント対話装置であって、
ユーザと対話するキャラクタ毎に、ペルソナキーワードが付与されており、
SNSサーバから、所定コンテンツに関して投稿されたリプライ元コメントと、各リプライ元コメントに関して投稿されたリプライコメントとを収集するリプライコメント収集手段と、
ユーザ発話テキストに最も類似するリプライ元コメントを検索するリプライ元コメント検索手段と、
検索されたリプライ元コメントに対する複数のリプライコメントについて、各リプライコメントを投稿した複数のユーザアカウントを検索するユーザアカウント検索手段と、
SNSサーバから、検索された複数のユーザアカウントにおける過去の投稿コメントを収集する投稿コメント収集手段と、
複数のユーザアカウントの過去の投稿コメントの中で、ペルソナキーワードを含む割合が最も高いユーザアカウントを決定するユーザアカウント決定手段と、
決定されたユーザアカウントについて、リプライコメント収集手段によって収集されたリプライコメントを、キャラクタ発話テキストとして返答するキャラクタ返答手段と
を有することを特徴とするエージェント対話装置。 - 所定コンテンツに関して、ユーザ発話テキストを入力し、キャラクタ発話テキストを返答する装置のエージェント対話方法であって、
装置は、
ユーザと対話するキャラクタ毎に、ペルソナキーワードが付与されており、
SNSサーバから、所定コンテンツに関して投稿されたリプライ元コメントと、各リプライ元コメントに関して投稿されたリプライコメントとを収集する第1のステップと、
ユーザ発話テキストに最も類似するリプライ元コメントを検索する第2のステップと、
検索されたリプライ元コメントに対する複数のリプライコメントについて、各リプライコメントを投稿した複数のユーザアカウントを検索する第3のステップと、
SNSサーバから、検索された複数のユーザアカウントにおける過去の投稿コメントを収集する第4のステップと、
複数のユーザアカウントの過去の投稿コメントの中で、ペルソナキーワードを含む割合が最も高いユーザアカウントを決定する第5のステップと、
決定されたユーザアカウントについて、リプライコメント収集手段によって収集されたリプライコメントを、キャラクタ発話テキストとして返答する第6のステップと
を実行することを特徴とするエージェント対話方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019177865A JP7105749B2 (ja) | 2019-09-27 | 2019-09-27 | キャラクタに応じたテキストを発話するエージェントのプログラム、装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019177865A JP7105749B2 (ja) | 2019-09-27 | 2019-09-27 | キャラクタに応じたテキストを発話するエージェントのプログラム、装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021056668A true JP2021056668A (ja) | 2021-04-08 |
JP7105749B2 JP7105749B2 (ja) | 2022-07-25 |
Family
ID=75270781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019177865A Active JP7105749B2 (ja) | 2019-09-27 | 2019-09-27 | キャラクタに応じたテキストを発話するエージェントのプログラム、装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7105749B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022180282A (ja) * | 2021-05-24 | 2022-12-06 | ネイバー コーポレーション | ペルソナチャットボット制御方法及びシステム |
WO2022259522A1 (ja) * | 2021-06-11 | 2022-12-15 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2023025793A (ja) * | 2021-08-11 | 2023-02-24 | アフラック生命保険株式会社 | 人材育成支援システム、連携支援システム、方法及びコンピュータプログラム |
WO2023146040A1 (ko) * | 2022-01-28 | 2023-08-03 | 마인드로직 주식회사 | 인공지능 캐릭터의 발화량에 따른 수익화 방법 및 시스템 |
CN118037397A (zh) * | 2024-02-29 | 2024-05-14 | 北京鑫创数字科技股份有限公司 | 一种肉类产品数字化整合营销服务平台 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014206773A (ja) * | 2013-04-10 | 2014-10-30 | Kddi株式会社 | コミュニケーションサービス提供装置、コミュニケーションサービス提供方法、およびプログラム |
JP2017207947A (ja) * | 2016-05-19 | 2017-11-24 | 株式会社 ディー・エヌ・エー | 対象物の類似度判定のためのプログラム、システム、及び方法 |
JP2019139282A (ja) * | 2018-02-06 | 2019-08-22 | Kddi株式会社 | コンテンツに関する対話を実施可能な対話制御装置、プログラム及び方法 |
-
2019
- 2019-09-27 JP JP2019177865A patent/JP7105749B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014206773A (ja) * | 2013-04-10 | 2014-10-30 | Kddi株式会社 | コミュニケーションサービス提供装置、コミュニケーションサービス提供方法、およびプログラム |
JP2017207947A (ja) * | 2016-05-19 | 2017-11-24 | 株式会社 ディー・エヌ・エー | 対象物の類似度判定のためのプログラム、システム、及び方法 |
JP2019139282A (ja) * | 2018-02-06 | 2019-08-22 | Kddi株式会社 | コンテンツに関する対話を実施可能な対話制御装置、プログラム及び方法 |
Non-Patent Citations (2)
Title |
---|
田原 俊一: "ニュース関連ツイートの感情極性に基づく共感対話システムの提案と評価", 第10回データ工学と情報マネジメントに関するフォーラム (第16回日本データベース学会年次大会) [, JPN6022025232, 6 March 2018 (2018-03-06), ISSN: 0004801637 * |
田原 俊一: "対話シナリオにおけるキャラクタ性を強調した名詞への自動置換手法の提案と評価", 第11回データ工学と情報マネジメントに関するフォーラム (第17回日本データベース学会年次大会) [, JPN6022025231, 6 March 2019 (2019-03-06), ISSN: 0004801636 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022180282A (ja) * | 2021-05-24 | 2022-12-06 | ネイバー コーポレーション | ペルソナチャットボット制御方法及びシステム |
JP7329585B2 (ja) | 2021-05-24 | 2023-08-18 | ネイバー コーポレーション | ペルソナチャットボット制御方法及びシステム |
WO2022259522A1 (ja) * | 2021-06-11 | 2022-12-15 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2023025793A (ja) * | 2021-08-11 | 2023-02-24 | アフラック生命保険株式会社 | 人材育成支援システム、連携支援システム、方法及びコンピュータプログラム |
JP7462595B2 (ja) | 2021-08-11 | 2024-04-05 | アフラック生命保険株式会社 | 人材育成支援システム、連携支援システム、方法及びコンピュータプログラム |
WO2023146040A1 (ko) * | 2022-01-28 | 2023-08-03 | 마인드로직 주식회사 | 인공지능 캐릭터의 발화량에 따른 수익화 방법 및 시스템 |
CN118037397A (zh) * | 2024-02-29 | 2024-05-14 | 北京鑫创数字科技股份有限公司 | 一种肉类产品数字化整合营销服务平台 |
Also Published As
Publication number | Publication date |
---|---|
JP7105749B2 (ja) | 2022-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7105749B2 (ja) | キャラクタに応じたテキストを発話するエージェントのプログラム、装置及び方法 | |
US11704745B2 (en) | Multimodal dialog state tracking and action prediction for assistant systems | |
KR101634086B1 (ko) | 감정 분석을 통한 스티커 추천 방법 및 시스템 | |
CN110209897B (zh) | 智能对话方法、装置、存储介质及设备 | |
KR101712180B1 (ko) | 메시지를 송수신하기 위한 컴퓨터로 읽을 수 있는 기록매체에 저장된 프로그램, 방법 및 장치 | |
US20180314689A1 (en) | Multi-lingual virtual personal assistant | |
KR101583181B1 (ko) | 응답 스티커 추천방법 및 컴퓨터 프로그램 | |
CN110476169B (zh) | 在会话中提供情感关怀 | |
US9230547B2 (en) | Metadata extraction of non-transcribed video and audio streams | |
CN107832286A (zh) | 智能交互方法、设备及存储介质 | |
CN107609101A (zh) | 智能交互方法、设备及存储介质 | |
WO2017100334A1 (en) | Vpa with integrated object recognition and facial expression recognition | |
CN110602516A (zh) | 基于视频直播的信息交互方法、装置及电子设备 | |
KR20160089152A (ko) | 화행 분석을 통한 스티커 추천 방법 및 시스템 | |
US20230128422A1 (en) | Voice Command Integration into Augmented Reality Systems and Virtual Reality Systems | |
JP6994289B2 (ja) | キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法 | |
JP2018156272A (ja) | 対話システム、対話装置及びそのためのコンピュータプログラム | |
CN110442867A (zh) | 图像处理方法、装置、终端及计算机存储介质 | |
CN114138960A (zh) | 用户意图识别方法、装置、设备及介质 | |
CN110781327B (zh) | 图像搜索方法、装置、终端设备及存储介质 | |
TW202013145A (zh) | 互動回應方法及其相關電腦系統 | |
CN108305629B (zh) | 一种场景学习内容获取方法、装置、学习设备及存储介质 | |
JP6821542B2 (ja) | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 | |
WO2016063403A1 (ja) | データ分析システム、データ分析方法、およびデータ分析プログラム | |
CN113111664B (zh) | 文本的生成方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210716 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220708 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220712 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7105749 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |