JP5864273B2 - ユーザ間親密度推定装置、方法及びプログラム - Google Patents

ユーザ間親密度推定装置、方法及びプログラム Download PDF

Info

Publication number
JP5864273B2
JP5864273B2 JP2012001364A JP2012001364A JP5864273B2 JP 5864273 B2 JP5864273 B2 JP 5864273B2 JP 2012001364 A JP2012001364 A JP 2012001364A JP 2012001364 A JP2012001364 A JP 2012001364A JP 5864273 B2 JP5864273 B2 JP 5864273B2
Authority
JP
Japan
Prior art keywords
window
state
user
time series
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012001364A
Other languages
English (en)
Other versions
JP2013142911A (ja
Inventor
朋也 武吉
朋也 武吉
服部 元
元 服部
小野 智弘
智弘 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2012001364A priority Critical patent/JP5864273B2/ja
Publication of JP2013142911A publication Critical patent/JP2013142911A/ja
Application granted granted Critical
Publication of JP5864273B2 publication Critical patent/JP5864273B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ソーシャルメディアやオンライン掲示板等、オンラインで不特定多数のユーザが電子的にメッセージの交換を行える環境において、やり取りの状態(健全や荒れ)の時系列推移と継続性を基に2ユーザ間の親密度(仲の良さ)を推定する、ユーザ間親密度推定装置、方法及びプログラムに関するものである。
オンラインでやりとりされる各種のメッセージのテキストを解析して、社会的な関係や状態等を推定する技術として、特許文献1、非特許文献1及び非特許文献2に記載された技術がある。
非特許文献1では、助詞・助動詞が果たす役割を予め分類した対応表を基に、発話テキストにおける発話役割(話者の態度)を分類した後、2ユーザ間における発話役割の種類数から仲の良さを、特定の発話役割の出現から上下関係を推定する。例えば、様々な発話役割(態度)を取れる2ユーザ間の仲は良いと推定する。
特許文献1又は非特許文献2では、テキストでやり取りされるオンラインディスカッションから表層的特徴(文字数や単語数、動詞数や動詞の命令形出現回数等)を基に、ディスカッションの健全度を定量化する。ディスカッションが正常に進行している場合は健全度を高く、言い争いが発生している場合は健全度を低く推定する。
特願2010-151084号「ディスカッション健全度算出装置、ディスカッション健全度算出方法およびコンピュータプログラム」
西原陽子、砂山渡、谷内田正彦、"発話テキストから人間の仲の良さと上下関係の推定"、電子情報通信学会論文誌、Vol.J91-D, No.1, pp.78-88 武吉朋也、帆足啓一郎、松本一則、小野智弘、"表層的特徴に基づくオンラインディスカッションの健全度定量化手法"、WebDB Forum2010
非特許文献1においては、発話役割の種類数および発話テキストに含まれる発和文の数を基に2ユーザ間の仲の良さを定量化している。しかしながら、仲の良さすなわち親密度をより現実に即して把握し定量化することを考えた場合、下記の課題が存在する。
(a) やり取りの「丁寧な(固い)状態」/「言い争い状態」を捉えていない
(b) 親密度の方向性を考慮していない(2ユーザ間で一つの親密度を決める)
(c) 状態の時系列変化を捉えていない
(a)については、2ユーザ間の親密度を推定する際、2ユーザ間のやり取りが「丁寧な(固い)状態」であるのか、「言い争い状態」であるのか、が重要な要素と考えられるが、これは助詞・助動詞のみによって決定されるものではない。例えば、親密度が高い2ユーザ間であれば、時には命令形動詞を含める言い争いに見えるやり取りを行うと考える。
(b)については、2ユーザ間の親密度について、方向性が存在すると考える。つまり、ユーザAとユーザB間の親密度は、ユーザBに対するユーザAの親密度とユーザAに対するユーザBの親密度は異なると考える。
(c)については、2ユーザ間の親密度を推定する際、2ユーザ間の状態の時系列変化が重要であると考える。例えば、時には言い争いに見えるやり取りをしても(あるいはする方が)仲が良いと考える。
また、特許文献1又は非特許文献2においては、ディスカッションの状態を健全度という尺度で定量化するが、2ユーザ間の親密度の推定は行っていない。
以上のような点に鑑みて、本発明は2ユーザ間の親密度を適切に捉えて推定することのできるユーザ間親密度推定装置、方法及びプログラムを提供することを目的とする。
上記目的を達成するため、本発明は、2ユーザ間での発言が時系列上において交互にやりとりされて構成されたテキストより、当該2ユーザ間の親密度を推定するユーザ間親密度推定装置であって、前記テキストを順次構成するユーザ毎の発言を所定基準で選択して包含しながら時系列上を推移する窓を設定する窓設定部と、前記窓の時系列上の各々に包含される発言を構成するテキストを解析することで、当該各窓に包含される発言の状態を推定する状態推定部と、前記各窓につき推定された状態より得られる、当該状態の時系列に基づいて前記2ユーザ間の親密度を推定する親密度推定部とを備えることを第1の特徴とする。
また本発明は、前記窓設定部にて、ユーザ毎の発言を所定数選択しながら又は所定期間毎に選択しながら窓を設定し、各窓に包含される発言の数として奇数を採用することで、前記各窓を前記2ユーザのうちのいずれかのユーザの発言で開始され且つ終了するように設定し、前記親密度推定部が、前記各窓のうち、前記2ユーザのうちの一方のユーザ発言で開始され当該一方のユーザの発言で終了する窓につき前記推定された状態の時系列に基づいて、当該一方のユーザの他方のユーザに対する方向性の考慮された親密度を推定する方向性考慮部を含むことを第2の特徴とする。
さらに本発明は、前記各窓に包含される発言が丁寧又は言い争いのいずれ側の状態にあるかの度合いとして前記状態を推定し、前記窓の時系列上の各々に包含される発言を構成するテキストをその表層的特徴に基づいて解析することで、当該各窓に包含される発言の健全度を算出する健全度算出部を前記状態推定部に含み、当該健全度を前記度合いとして採用することを第3の特徴とする。
また本発明は、上記目的を達成するため、2ユーザ間での発言が時系列上において交互にやりとりされて構成されたテキストより、当該2ユーザ間の親密度を推定するユーザ間親密度推定方法であって、前記テキストを順次構成するユーザ毎の発言を所定数包含しながら時系列上を推移する窓を設定する窓設定手順と、前記窓の時系列上の各々に包含される発言を構成するテキストを解析することで、当該各窓に包含される発言が丁寧又は言い争いのいずれ側の状態にあるかの度合いを推定する状態推定手順と、前記各窓につき推定された状態より得られる、当該状態の時系列に基づいて前記2ユーザ間の親密度を推定する親密度推定手順とを備えることを第4の特徴とする。
さらに本発明は、上記目的を達成するため、前記各手順をコンピュータに実行させて、当該コンピュータをユーザ間親密度推定装置として機能させるユーザ間親密度推定プログラムであることを第5の特徴とする。
前記第1、第4又は第5の特徴によれば、2ユーザ間の発言を包含した時系列上の窓を設定して、当該窓に包含される発言の状態に関する時系列によってユーザ間の親密度を推定するので、発言の状態と、その時系列変化と、を捉えた適切な親密度を推定することができる。
前記第2の特徴によればさらに、交互に交わされる発言を奇数回数で包含することで、必ず2ユーザのうちのいずれかのユーザの発言が多く包含され、そのユーザの他方のユーザに対する主体的な態度が表れるようになる窓を設けることができる。そして、一方のユーザの発言が多く包含された窓の時系列から親密度を推定することで、当該一方のユーザの他方のユーザに対する方向性が考慮され、さらに適切に捉えられた親密度を推定することができる。
前記第3の特徴によればさらに、発言の状態として窓に包含される発言テキストの表層的特徴を解析して得られる健全度から得られる丁寧又は言い争いの度合いを採用することで、発言の状態を高精度に捉えることができ、従って親密度を高精度に推定できるようになる。
一実施形態に係るユーザ間親密度推定装置の機能ブロック図である。 一実施形態に係るユーザ間親密度推定のフローチャートである。 窓設定部が設定する窓を説明するための図である。 親密度推定の一実施形態で、三段階評価を行う場合のフローチャートである。 親密度推定の一実施形態で、数値評価を行う場合のフローチャートである。 図5の実施形態における数値化された親密度を説明するための図である。
図1は、本発明の実施形態に係るユーザ間親密度推定装置の機能ブロック図である。ユーザ間親密度推定装置1は、対象発言抽出部3、窓設定部4、状態推定部5及び親密度推定部6を備え、全発言履歴DB(データベース)2より発言のデータを読み込んで、所定の2ユーザ間の親密度を推定結果として出力する。状態推定部5は健全度算出部50を含み、親密度推定部6は方向性考慮部60を含む。なお、全発言履歴DB2を含めてユーザ間親密度推定装置1を構成してもよい。当該各部の概要は以下の通りである。
全発言履歴DB2は、本発明が親密度を推定する対象とする環境(ソーシャルメディアやオンライン掲示板)において、少なくとも下記3つの情報により1つのエントリ(発言)を構成したテキストを蓄積している。
(1) 発言ユーザ識別子:発言を行ったユーザを環境内で個別に識別可能なIDまたはユーザ名
(2) 発言日時:その発言が投稿された年月日、および時刻
(3) 発言内容:その発言が含むテキスト内容
対象発言抽出部3は、親密度を推定する対象として管理人等によって指定された2ユーザ間のやり取りのみを、全発言履歴DB2より抽出する。当該抽出に際しては、データベースにおけるユーザID等の所定形式に則った手法で抽出がなされる。
窓設定部4は、対象発言抽出部3が抽出したやり取りについて、管理人等の指定した所定数又は所定期間など所定基準で選択されたの発言を含む「窓」を、当該やり取りの時系列上を推移させながら設定する。
状態推定部5は、窓設定部4が設定した時系列上の窓の各々につき、含まれる発言のやり取りの状態が丁寧又は言い争いのいずれの状態に近いか数値化して推定する。また必要に応じて当該数値を閾値αによる判定で2値化して、やり取りの状態が丁寧の状態か言い争いの状態かいずれであるかを推定する。健全度算出部50は、特許文献1又は非特許文献2に開示の健全度によって当該数値化を行う。
親密度推定部6は、時系列上の各窓につき推定された状態から得られる、当該状態の時系列に基づいて2ユーザ間の親密度を推定し、推定結果として出力する。方向性考慮部60は、当該状態の時系列の中から2ユーザの各々の親密度に対応する時系列を抽出することで、ユーザ間の方向性が考慮された親密度を推定する。
図2は、本発明の実施形態に係るユーザ間親密度推定の各手順を示すフローチャートである。図2を参照して、フローと共に上記各部の詳細を説明する。
手順P1では、対象発言抽出部3が全発言履歴DB2より、管理者等が指定した2ユーザ(以降、ユーザA及びユーザBとして説明する)間のやり取りを抽出する。当該データベースに保存されたデータがユーザA及びB間のメールのやり取り等であれば、当該ユーザA及びBを指定して検索することでその他特に加工を施すことなく、ユーザA及びB間の一連の発言のやり取りをそのまま抽出することができる。
一方、オンライン掲示板等で3ユーザ以上の発言が含まれている場合には、以下(ア)及び/又は(イ)の手法によって抽出することができる。
(ア)同じ話題(オンライン掲示板でのスレッドに相当)内でユーザA及びユーザBの発言が連続する箇所を抽出する。
(イ)発言内に、一方から他方への返信を示すテキスト、例えば「>Bさん」や「>>Bさん」がある発言を抽出する。
なお、オンライン掲示板等にて話題毎に別れて発言テキストが存在する場合には、各話題でのユーザA-B間のやりとりを抽出してもよいし、当該話題毎に抽出してから話題毎に順次並べて1つに集約したものを最終抽出結果としてもよい。話題毎の並べ方には話題の最終更新日時順などを利用してよい。
手順P1ではこうして、2ユーザA及びBの間で時系列に沿って交互にやりとりされる発言が、以下のように抽出される。
A1, B1, A2, B2, A3, B3, ... ,An, Bn
すなわち、まず最初にユーザAがユーザBに対して発言A1を行い、これにユーザBが応答して発言B1を行い、これにユーザAが応答して発言A2を行い、…、ユーザAが発言Anを行い、応答してユーザBが発言Bnを行うといった、総発言数が2nとなる交互の発言が得られる。
当該例においては最初の発言及び最後の発言はそれぞれ、ユーザA及びユーザBとなっており総発言数が偶数である。しかし、最初及び最後の発言がいずれのユーザとなるか、また総発言数が偶数か奇数かは、抽出された発言内容次第である。
当該各発言は各ユーザの発言内容テキストであり、その文字数や構成文の数等は発言内容次第であって任意である。また各発言には発言日時が紐付けられている。なお、他方のユーザが応答するまでの間にもう一方のユーザが別時刻で複数発言している場合は、当該複数の発言をまとめて1つの発言とみなし、上記のような2ユーザ間の交互の発言とする。こうして本発明においては、一方のユーザが2回以上連続で発言する場合を形式上除外するものとする。
なお、上記のような交互に交わされる発言の形式となっているテキストデータを管理者等がマニュアルで用意して、次に説明する窓設定部4に入力するようにすれば、手順P1及び対象発言抽出部3は省略してもよい。この際、時系列上の所定の一時期のみ、例えば直近の1週間のみの発言を入力するようにしてもよい。
手順P2では、手順P1で抽出された2ユーザ間での発言のやり取りの時系列上に、窓設定部4が順次推移する窓を設定する。各窓は管理者等の指定した所定回数の、一連の連続する発言を含む。図3は窓の例を(1)及び(2)として説明する図であり、ここでは前述の説明と同様に、最初のユーザAの発言A1、これに応答するユーザBの発言B1、これに応答するユーザAの発言A2、…が時系列順に示されている。
(1)は窓のサイズ(窓に含まれる発言数)を1と設定した場合の窓の時系列W1,W2,W3, ...を示している。すなわち、1番目の窓W1は1つの発言A1からなり、2番目の窓W2は1つの発言B1からなり、3番目の窓W3は1つの発言A1からなり、…といったように、順次時系列上を推移している。
(2)は窓のサイズを3と設定した場合の窓の時系列w1,w2,w3, ...を示している。すなわち、1番目の窓w1は3つの連続する発言A1、B1及びA2からなり、2番目の窓w2は3つの連続する発言B1、A2及びB2からなり、3番目の窓w3は3つの連続する発言A2、B2及びA3からなり、…といったように、順次時系列上を推移している。
その他にも所定サイズで連続する発言を含んだ窓を設定することができる。(2)に示すように、隣接する窓同士で重複する発言の箇所が存在してもよい(例えば窓w1とw2の重複箇所がB1及びA2)し、重複しないように推移する際のステップ幅(発言数)を設定してもよい。各窓には含まれる発言のうちの日時の所定番目(例えば一番古い発言又は新しい発言)の日時を紐付けて、窓同士が時系列として構成されるようにすればよい。
なおまた、時系列上の順序が適切に定まれば、窓のサイズは固定されていなくともよい。例えば、サイズを基準とする代わりに第1週目の発言、第2週目の発言、…といったように所定期間を基準として窓を定めてもよい。この場合も各期間に重複があってもよい。
手順P3では状態推定部5が、当該設定された各窓内の発言のテキストを解析して、当該窓内でのやり取りの状態を数値として推定する。当該数値は、やり取りの状態が丁寧又は言い争いのいずれの側にあるかの度合いを表現するものである。ここで、数値が大きいほど丁寧の色合いが強く、小さいほど言い争いの色合いが強いように、正負の方向を定める。状態推定部5はまた、当該数値が所定の閾値αより大きいかそれ以下であるかによって、やり取りの状態が丁寧な状態又は言い争いの状態のいずれであるかを推定してもよい。なお当該いずれの状態であるかの推定は、状態を表す数値(度合い)の閾値αによる「2値化」に相当する。
状態の数値としての定量化には、健全度算出部50が算出する健全度の値を利用してもよい。健全度算出部50には、特許文献1又は非特許文献2に開示のディスカッション健全度算出装置を利用することができ、ディスカッションの代わりに窓内の発言テキストをその表層的特徴に基づいて解析することで、健全度が求められる。表層的特徴は規模、やり取り、発言者の態度及び発言の複雑さの各観点に関して定義される各種の指標によって捉えられ、予め表層的特徴と健全度との対応づけを多変量解析で学習しておいたモデルを利用して健全度が算出される。当該詳細は上記文献に詳しい。
なお、上記文献においては数百種類に渡る指標を用意することで算出精度を向上させているが、本発明において健全度算出部50として利用する場合には、(幾分か精度が落ちることとなったとしても、)各種の指標のうちの一部分のみを採用するようにしてもよい。特に、窓のサイズを1に設定した場合はやり取りに関連する指標が利用できないので、利用可能な残りの指標を利用する。学習手法も利用可能な任意のものを利用してよい。なおまた、状態推定部5では健全度算出部50の算出する健全度に限らず、同様の数値化を行うことのできる任意のテキスト解析手法を利用して状態を推定できる。
手順P4では、窓の時系列の各々にて状態が推定されて得られた状態の時系列に基づいて、親密度推定部6がユーザ間の親密度を推定する。この際、状態の時系列の変動に基づいて親密度を推定し、推定方式として特に、変動が大きいほど親密度を高く推定するような傾向を有する方式を採用する。
当該推定の際に、方向性考慮部60は状態が推定された窓の時系列のうち、所定の一部分のみから推定を行うことで、2ユーザA及びB間での方向性が考慮された親密度を推定する。具体的には、図3の(1)の窓であれば下段側に表記してあるユーザAの発言を含む窓の時系列W1,W3,W5, ...よりユーザAのユーザBに対する親密度を推定し、また逆に、上段側に表記してあるユーザBの発言を含む窓の時系列W2,W4,W6, ...よりユーザBのユーザAに対する親密度を推定する。
方向性考慮部60は一般には、ユーザAのユーザBに対する親密度を推定する際には、ユーザAの発言がユーザBの発言よりも発言回数が多く含まれる窓を利用し、逆にユーザBのユーザAに対する親密度を推定する際には、ユーザBの発言がユーザAの発言よりも発言回数が多く含まれる窓を利用する。このような窓を設定することで、多くの回数の発言が含まれる方のユーザが主体となって発言を主導する側にある親密度、すなわち方向性の考慮された親密度が推定可能となる。
このため、方向性考慮部60を利用する場合には窓設定部4は窓のサイズを奇数に設定し、全ての窓が一方のユーザの発言で開始され且つ当該一方のユーザの発言で終了するようにして、各窓に含まれる各ユーザの発言数が異なるようにする。すなわち、本発明では発言は交互に与えられるので、窓サイズを奇数2n+1 (n=0,1,2,...)とすることで必ず一方のユーザの発言がn+1個(当該窓は当該一方のユーザの発言で開始且つ終了する)、他方のユーザの発言がn個となり、方向性の考慮が可能となる。
例えば図3の(2)の窓はサイズが奇数の3であるので方向性考慮部60の利用が可能であり、下段側に表記してあるユーザAの発言2つとユーザBの発言1つからなる窓の時系列w1,w3,w5,...よりユーザAのユーザBに対する親密度が推定され、上段側に表記してあるユーザAの発言1つとユーザBの発言2つからなる窓の時系列w2,w4,w6,...よりユーザBのユーザAに対する親密度が推定される。
なお、窓がサイズではなく第1週目の発言、第2週目の発言、…といったように所定期間を基準として定められている場合で、発言数が奇数ではない期間が存在する場合には、当該期間の開始・終了箇所の発言を1つ以上(ただし可能な限り少なく)適宜、隣の区間に所属させる又は逆に隣の区間から移設させて調整することで、発言数が奇数になるようにすることができる。
なお、方向性考慮部60では管理者等の指定に従って、ユーザAのユーザBに対する親密度と、ユーザBのユーザAに対する親密度との両者を推定するようにしてもよいし、いずれか一方のみを推定するようにしてもよい。
図4及び図5は親密度推定部6による親密度の推定の各実施形態を示すフローチャートである。なお、方向性考慮部60を利用する場合は利用する窓が上記のような一部に制限されるだけで、親密度の推定自体は当該各フローチャートと共通である。図4及び図5では前提として、前述の図2における手順P3で状態推定部5が閾値αによって丁寧又は言い争いのいずれかの状態であるかを推定しているものとする。
図4の実施形態では、親密度推定部6は親密度を「高」、「中」及び「低」の三段階で評価する。手順P11では、状態変化数が所定の閾値βよりも多いかの判定がなされ、多い場合は手順P12へ、多くない場合には手順P13へと進む。状態変化数とは隣接する窓間で状態の変化、すなわち「丁寧から言い争いへの変化」又は「言い争いから丁寧への変化」が発生した数である。
なお、当該閾値判定は状態変化数の絶対値ではなく、対象としている状態の時系列の長さに対応した規格化を施した値に対して行ってもよい。すなわち状態の時系列の長さがnであれば、状態変化数は最大でもn−1であるので、そのn−1の中での所定割合γ(0≦γ≦1、例えばγ=0.5)より多いかの判定としてもよい。βを当該所定の割合γに基づいて時系列の長さ毎に定めてもよい。なお時系列の長さが固定されていれば、絶対値としての閾値βを用いればよい。
手順P11にてβよりも多いと判定された場合、当該判定は状態変化が頻繁に発生していることを意味するので、手順P12にて親密度が「高」と推定され、フローは終了する。本発明においては、丁寧及び言い争いの状態を頻繁に行き来できるのは例えばフランクに何でも語り合える仲などに相当しうるので、親密度を「高」と推定する。
手順P11にてβ以下と判定された場合、当該判定は状態変化がそれほど頻発していないことを意味しており、手順P13へ進む。なおその後、最終的に親密度は「中」又は「低」と判定されることとなる。本発明では状態変化がそれほど頻発しないのは上記「高」の判定の場合と異なり、あまり気兼ねなく発言できる仲ではないと考えられるので、親密度を「中」又は「低」の判定を下すようにする。
手順P13では、状態の時系列において「丁寧」の状態の数が「言い争い」の状態の数以上であるかが判定される。判定が真(「丁寧状態数≧言い争い状態数」の関係が成立)であれば、あまり気兼ねなく発言はできないが状態としては概ね「丁寧」であるということなので、手順P14に進んで親密度が「中」と推定されてフローは終了する。逆に判定が偽(「丁寧状態数<言い争い状態数」)であれば、「言い争い」が主要な状態を占めているので、手順P15に進んで親密度が「低」と推定されてフローは終了する。
図5の実施形態は、図4の実施形態を踏まえて親密度推定部6は親密度を「高」、「中」及び「低」の三段階で大まかに評価した上で、さらに当該各段階内において付随スコアを付与することで、親密度を数値として求める。図6は図5の実施形態における数値としての親密度を説明する図である。すなわち、「低」と「中」とを区切る所定の閾値T1と、「中」と「高」とを区切る所定の閾値T2とを予め与えておく。ここで、図示するように、0<T1<T2の関係がある。
ここで、数値xとして求まる親密度は、三段階評価が(1)に示す「高」の場合は「高」に対応する区間{x|x>T2}に属し、(2)に示す「中」の場合は「中」に対応する区間{x|T1<x≦T2}に属し、(3)に示す「低」の場合は「低」に対応する区間{x|0≦x≦T1}に属する。
当該各区間内にてさらに親密度の順序づけを可能にするための数値が付随スコアであり、(1)に示す「高」の場合は付随スコアH(H>0)によって親密度x=T2+Hとなり、(2)に示す「中」の場合は付随スコアM(0<M≦T2−T1)によって親密度x=T1+Mとなり、(3)に示す「低」の場合は付随スコアL(0≦L≦T1)によって親密度x=Lとなる。
当該数値としての親密度は、具体的には図5のフローにより次のように求められる。図5の手順P21及びP23はそれぞれ図4の手順P11及びP13と同一であり、親密度の「高」、「中」及び「低」の三段階推定は図4の場合と同一である。そして図5では「高」と推定された場合、手順P22にて付随スコアHが算出され、「中」と推定された場合、手順P24にて付随スコアMが算出され、「低」と推定された場合、手順P25にて付随スコアLが算出され、それぞれにおける数値としての親密度が算出される。
手順P22(図6の(1)に対応する「親密度算出1」)では、「高」における付随スコアHが、状態の時系列(閾値αの判定を利用しない、数値としての時系列)の変動量の大きさに基づいて算出され、当該Hに上述のT2を加算して親密度が得られる。状態の時系列をS1,S2,S3,...,Sn-1とし、S1等の各値を状態値と呼ぶこととする。付随スコアHは変動量の大きさを表現するものとして例えば以下の(式1)のように、隣接する窓間での状態値の変動の絶対値の時系列全体での平均値として求めることができる。ここでは、窓の時系列がn個で、隣接する窓間はn−1個であり、当該n−1個で平均を求めることとなる。
H=AVERAGE(ABS(S2−S1),ABS(S3−S2),・・・,ABS(Sn−1−Sn−2))…(式1)
手順P24(図6の(2)に対応する「親密度算出2」)では、「中」における付随スコアMが、状態値Sの最大値Smax=max{S1,S2,S3,...,Sn-1}に基づいて算出され、当該Mに上述のT1を加算して親密度が得られる。例えば、健全度算出部50を用いる場合、状態値Sには上限値Slimが存在するので、Mを以下の(式2)でSmaxに比例するようにして求めてもよい。
M=Smax*(T2−T1)/Slim …(式2)
付随スコアMはその他にも、0<M≦T2−T1の範囲内に収まり且つ最大値Smaxが大きくなる程大きな値を取るような任意の手法によって算出することができる。
手順S25(図6の(3)に対応する「親密度算出3」)では、「低」における付随スコアLが、状態値Sの最小値Smin=min{S1,S2,S3,...,Sn-1}に基づいて算出され、当該Lを上述の通り親密度の値となす。例えば、上述の状態値の上限値Slimによって、Lを以下の(式3)によってSminに比例するようにして求めてもよい。
L=Smin*T1/Slim …(式3)
付随スコアLはその他にも、0≦L≦T1の範囲内に収まり且つ最小値Sminが小さくなる程小さな値を取るような任意の手法によって算出することができる。
図5の実施形態では以上のように、「状態の時系列」として、閾値αにより2値化して丁寧又は言い争いのいずれの状態であるかの時系列としたものと、当該2値化する前の数値(度合い)としての状態値の時系列S1,S2,S3,...,Sn-1との、両方を用いることで親密度を算出する。
なお、図6では「高」、「中」及び「低」に対応する親密度の各範囲は閾値T1及びT2によって互いに隣接しているが、各範囲は隣接せず離れていてもよい。また親密度は0以上の値としているが、0以外の所定値以上としてもよい。
以上を前提として、本発明の変形的な実施形態について補足説明する。一実施形態では、状態推定部5では2値化せずに数値のままの状態値を採用し、親密度推定部6では三段階推定は行わず、且つ図5の手順P22で説明した付随スコアH自体を親密度として採用してもよい。この場合、状態の時系列(状態値の時系列)のみに基づいて数値としての親密度を求めることとなる。
また本発明は、コンピュータを図1のユーザ間親密度推定装置1として機能させるプログラムとして実施してもよい。この場合、当該コンピュータは当該プログラムを読み込んで、図2の各手順を実行する。当該実行の際、親密度の算出対象としていずれの2ユーザを指定するか等の、「管理者が指定」等として説明した部分については、コンピュータに備わるキーボード又はマウス等より管理者のマニュアル入力を受け取って、当該指定された所定の対象について各手順が実行される。
以上のように、本発明によれば、親密度(仲の良さ)を十分に捉えて算出することができるようになる。なお本発明が有用な分野として例えば、以下を挙げることができる。
チーム形成支援:親密度が高いメンバを提示、あるいは集めることで、あるプロジェクトを遂行するチームの形成を支援可能となる。
情報制御:ソーシャルメディア上で受信する情報を制御する際、本発明の親密度を利用し、相手に応じたフィルタリングを施せば、親密度の高い友人の更新情報を簡単に受信可能となる。(ソーシャルメディア利用時のInformation Overflowの解決)
1…ユーザ間親密度推定装置、2…全発言履歴データベース、3…対象発言抽出部、4…窓設定部、5…状態推定部、6…親密度推定部、50…健全度算出部、60…方向性考慮部

Claims (8)

  1. 2ユーザ間での発言が時系列上において交互にやりとりされて構成されたテキストより、当該2ユーザ間の親密度を推定するユーザ間親密度推定装置であって、
    前記テキストを順次構成するユーザ毎の発言を所定基準で選択して包含しながら時系列上を推移する窓を設定する窓設定部と、
    前記窓の時系列上の各々に包含される発言を構成するテキストを解析することで、当該各窓に包含される発言の状態を推定する状態推定部と、
    前記各窓につき推定された状態より得られる、当該状態の時系列に基づいて前記2ユーザ間の親密度を推定する親密度推定部とを備え、
    前記窓設定部は、ユーザ毎の発言を所定数選択しながら又は所定期間毎に選択しながら窓を設定し、且つ、各窓に包含される発言の数として奇数を採用することで、前記各窓を前記2ユーザのうちのいずれかのユーザの発言で開始され且つ終了するように設定し、
    前記親密度推定部が、
    前記各窓のうち、前記2ユーザのうちの一方のユーザ発言で開始され当該一方のユーザの発言で終了する窓につき前記推定された状態の時系列に基づいて、当該一方のユーザの他方のユーザに対する方向性の考慮された親密度を推定する方向性考慮部を含むことを特徴とするユーザ間親密度推定装置。
  2. 前記状態推定部は、前記各窓に包含される発言が丁寧又は言い争いのいずれ側の状態にあるかの度合いとして前記状態を推定することを特徴とする請求項1に記載のユーザ間親密度推定装置。
  3. 前記状態推定部は、前記度合いが第一の閾値条件を満たすか否かによって前記各窓に包含される発言が丁寧又は言い争いのいずれの状態にあるかを推定し、
    前記親密度推定部が、前記状態の時系列における丁寧の状態と言い争いの状態との間の変化発生数に基づいて親密度を推定することを特徴とする請求項に記載のユーザ間親密度推定装置。
  4. 前記親密度推定部が親密度を「高」、「中」及び「低」の三段階によって推定し、
    前記変化発生数が第二の閾値を超える場合に、親密度を「高」と推定し、
    前記第二の閾値を超えない場合で且つ、前記状態の時系列における丁寧の状態の数が言い争いの状態の数以上である場合に、親密度を「中」と推定し、
    前記第二の閾値を超えない場合で且つ、前記状態の時系列における丁寧の状態の数が言い争いの状態の数未満である場合に、親密度を「低」と推定することを特徴とする請求項に記載のユーザ間親密度推定装置。
  5. 前記親密度推定部が親密度を前記「高」、「中」及び「低」の三段階と、当該各段階内における付随スコアとによって推定し、
    前記「高」と推定した場合さらに、前記状態の度合いの時系列の変動量の大きさに基づく付随スコアを付与することで親密度を推定し、
    前記「中」と推定した場合さらに、前記状態の度合いの時系列における最大値の大きさに基づく付随スコアを付与することで親密度を推定し、
    前記「低」と推定した場合さらに、前記状態の度合いの時系列における最小値の大きさに基づく付随スコアを付与することで親密度を推定することを特徴とする請求項に記載のユーザ間親密度推定装置。
  6. 前記状態推定部は、前記窓の時系列上の各々に包含される発言を構成するテキストをその表層的特徴に基づいて解析することで、当該各窓に包含される発言の健全度を算出する健全度算出部を含み、当該健全度を前記度合いとして採用することを特徴とする請求項2ないし5のいずれかに記載のユーザ間親密度推定装置。
  7. 2ユーザ間での発言が時系列上において交互にやりとりされて構成されたテキストより、当該2ユーザ間の親密度を推定するユーザ間親密度推定方法であって、
    前記テキストを順次構成するユーザ毎の発言を所定基準で選択して包含しながら時系列上を推移する窓を設定する窓設定手順と、
    前記窓の時系列上の各々に包含される発言を構成するテキストを解析することで、当該各窓に包含される発言の状態を推定する状態推定手順と、
    前記各窓につき推定された状態より得られる、当該状態の時系列に基づいて前記2ユーザ間の親密度を推定する親密度推定手順とを備え
    前記窓設定手順では、ユーザ毎の発言を所定数選択しながら又は所定期間毎に選択しながら窓を設定し、且つ、各窓に包含される発言の数として奇数を採用することで、前記各窓を前記2ユーザのうちのいずれかのユーザの発言で開始され且つ終了するように設定し、
    前記親密度推定手順が、
    前記各窓のうち、前記2ユーザのうちの一方のユーザ発言で開始され当該一方のユーザの発言で終了する窓につき前記推定された状態の時系列に基づいて、当該一方のユーザの他方のユーザに対する方向性の考慮された親密度を推定する方向性考慮手順を含むことを特徴とするユーザ間親密度推定方法。
  8. 請求項に記載の各手順をコンピュータに実行させて、当該コンピュータをユーザ間親密度推定装置として機能させることを特徴とするユーザ間親密度推定プログラム。
JP2012001364A 2012-01-06 2012-01-06 ユーザ間親密度推定装置、方法及びプログラム Active JP5864273B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012001364A JP5864273B2 (ja) 2012-01-06 2012-01-06 ユーザ間親密度推定装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012001364A JP5864273B2 (ja) 2012-01-06 2012-01-06 ユーザ間親密度推定装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013142911A JP2013142911A (ja) 2013-07-22
JP5864273B2 true JP5864273B2 (ja) 2016-02-17

Family

ID=49039473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012001364A Active JP5864273B2 (ja) 2012-01-06 2012-01-06 ユーザ間親密度推定装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5864273B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6468258B2 (ja) 2016-08-01 2019-02-13 トヨタ自動車株式会社 音声対話装置および音声対話方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4354313B2 (ja) * 2004-01-21 2009-10-28 株式会社野村総合研究所 ユーザ間親密度測定システム及びユーザ間親密度測定プログラム
JP4970330B2 (ja) * 2008-03-31 2012-07-04 株式会社野村総合研究所 会話支援装置及び方法
JP5685014B2 (ja) * 2010-07-01 2015-03-18 Kddi株式会社 ディスカッション健全度算出装置

Also Published As

Publication number Publication date
JP2013142911A (ja) 2013-07-22

Similar Documents

Publication Publication Date Title
US9002843B2 (en) System and method for extraction of off-topic part from conversation
JP2022130635A (ja) 会議支援システム、会議支援装置、会議支援方法及びプログラム
US20120179465A1 (en) Real time generation of audio content summaries
JP5468474B2 (ja) トークスクリプト利用状況算出システムおよびトークスクリプト利用状況算出プログラム
JP2017215931A (ja) 会議支援システム、会議支援装置、会議支援方法及びプログラム
CN110069776B (zh) 客户满意度评估方法及装置、计算机可读存储介质
CN106202031B (zh) 一种基于群聊数据对群成员进行关联的系统及方法
CN113641807B (zh) 对话推荐模型的训练方法、装置、设备和存储介质
JP2011066794A (ja) 会議管理装置及び会議管理方法
CN107679031B (zh) 基于堆叠降噪自编码机的广告博文识别方法
CA3134548A1 (en) Unsupervised adaptation of sentiment lexicon
JP5947237B2 (ja) 感情推定装置、感情推定方法、および、プログラム
JP5698105B2 (ja) 対話モデル構築装置、方法、及びプログラム
JP2017215943A (ja) 情報共有支援システム、情報共有支援装置、情報共有支援方法及びプログラム
CN113053388B (zh) 语音交互方法、装置、设备和存储介质
CN113055751B (zh) 数据处理方法、装置、电子设备和存储介质
JP5084297B2 (ja) 会話解析装置および会話解析プログラム
WO2020199590A1 (zh) 情绪检测分析方法及相关装置
TW201044330A (en) Teaching material auto expanding method and learning material expanding system using the same, and machine readable medium thereof
JP5864273B2 (ja) ユーザ間親密度推定装置、方法及びプログラム
CN114141235A (zh) 语音语料库生成方法、装置、计算机设备和存储介质
JP5468881B2 (ja) 対話システム、対話方法、対話プログラム
CN110750620B (zh) 一种群体决策能力评估方法及装置
CN112329437A (zh) 一种智能客服语音质检评分方法、设备及存储介质
US20190065965A1 (en) System and method of providing news analysis using artifical intelligence

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151224

R150 Certificate of patent or registration of utility model

Ref document number: 5864273

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150