JP2019153013A - ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法 - Google Patents

ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法 Download PDF

Info

Publication number
JP2019153013A
JP2019153013A JP2018037000A JP2018037000A JP2019153013A JP 2019153013 A JP2019153013 A JP 2019153013A JP 2018037000 A JP2018037000 A JP 2018037000A JP 2018037000 A JP2018037000 A JP 2018037000A JP 2019153013 A JP2019153013 A JP 2019153013A
Authority
JP
Japan
Prior art keywords
content
matrix
feature amount
user
difficulty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018037000A
Other languages
English (en)
Other versions
JP6663944B2 (ja
Inventor
一則 松本
Kazunori Matsumoto
一則 松本
啓一郎 帆足
Keiichiro Hoashi
啓一郎 帆足
池田 和史
Kazufumi Ikeda
和史 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2018037000A priority Critical patent/JP6663944B2/ja
Priority to PCT/JP2019/006261 priority patent/WO2019167742A1/ja
Publication of JP2019153013A publication Critical patent/JP2019153013A/ja
Application granted granted Critical
Publication of JP6663944B2 publication Critical patent/JP6663944B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザに対するコンテンツの共感影響力を推定するプログラム等を提供する。【解決手段】学習機能として、コンテンツcl毎に、各ユーザsnの共感度tlnを対応付けた共感度行列Tlnから、項目反応理論IRTに基づく識別度αl及び難易度βlを算出し、コンテンツcl毎に、所定の各コンテンツ特徴要素vjの特徴量fljを対応付けたコンテンツ特徴量行列Fljと、識別度αl及び難易度βlとを対応付けた教師データとして機械学習エンジンに学習させ、運用機能として、推定対象コンテンツcEについて、所定の各コンテンツ特徴要素vjの特徴量fjを対応付けたコンテンツ特徴量行列FEを算出し、機械学習エンジンは、特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する。【選択図】図2

Description

本発明は、ユーザに対するコンテンツの共感影響力を推定する技術に関する。
近年、人と対話する対話システムが、スマートフォンアプリケーションやロボットにも搭載されてきている。
古くはELIZAやSHRDLUのように、ユーザ発話に対して一問一答形式で返答する技術がある(例えば非特許文献1参照)。この技術によれば、事前に蓄積された質問例の集合の中から、パターンマッチによってユーザ発話に近い質問例を検出する。
これに対し、現在の対話システムは、「タスク指向対話機能」及び「雑談対話機能」に大別でき、これらの機能を組み合わせて構成されている。
また、対人関係の確立と維持を目的として、「社会的対話」に注目した対話システムの技術もある(例えば非特許文献2参照)。
更に、社会的対話に共感性を適用した対話システムによって、ユーザの親近感を高めようとする技術もある(例えば非特許文献3参照)。
更に、ユーザの興味分野の情報レコメンド機能を、対話システムに適用した技術もある(例えば非特許文献4参照)。
奥村学、他、「対話システム」、コロナ社、2017年、ISBN:978-4-339-02757-0 T. W. Bickmore and R. W. Picard, "Establishing and maintaining long-term human-computer relationships", ACM Tran. on Computer-Human Interaction ‘TOCHI), 12(2):293-327, 2005.、[online]、[平成30年2月12日検索]、インターネット<URL:http://www.ccs.neu.edu/home/bickmore/publications/toCHI.pdf> 東中竜一郎, 堂坂浩二, 磯崎秀樹, "対話システムにおける共感と自己開示の効果", 言語処理学会第15回年次大会,446-449, 2009.、[online]、[平成30年2月12日検索]、インターネット<URL:http://www.kecl.ntt.co.jp/icl/lirg/members/rh/pdf/NLP2009.pdf> 五十島志織,富永和人,亀田弘之,"対話からの興味をもとに情報を推薦するボットの作成", 第11 回情報科学技術フォーラム, F-024, 2012.、[online]、[平成30年2月12日検索]、インターネット<URL:https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=151579&item_no=1&attribute_id=1&file_no=1> 戸田弘二,"心理測定尺度集II 人間と社会のつながりをとらえる<対人関係・価値観> 3共感性・他者意識", 吉田富二雄編,堀洋道監修,サイエンス社,pp. 118-137 鈴木有美, 木野和代, "多次元共感性尺度(MES)の作成 −自己志向・他者志向の弁別に焦点をあてて−", 教育心理学研究, 56, 487-497, 2008.、[online]、[平成30年2月12日検索]、インターネット<URL:https://ci.nii.ac.jp/naid/110007028208> 項目応答理論、[online]、[平成30年2月12日検索]、インターネット<URL:https://ja.wikipedia.org/wiki/%E9%A0%85%E7%9B%AE%E5%BF%9C%E7%AD%94%E7%90%86%E8%AB%96>
前述した従来技術によれば、対話システムにおけるユーザの親近感を高めようとしているが、心理学の知見に基づいた社会的対話については何ら検討されていない。
心理学の分野によれば、他者の気持ちを認知し、他者と同じ情動を持つ体験する性質として、「共感性(Empathy)」がある(例えば非特許文献5参照)。但し、共感性は、単一の観点のみから判断することできない。具体的には、共感性は、「他者の心理状態を正確に認知する能力(認知度)」と「他者の心理状態に対する代理的な反応の強さ(情動度)」との多元的な観点から判断する必要がある(例えば非特許文献6参照)。
例えば、ある記事を閲覧したユーザは、その記事の登場人物(擬人化された物も含む)や著作者の思考及び感情を理解し、何らかの感情を抱く。これは、ユーザに対して、そのコンテンツが持つ共感影響力に基づく。ユーザが持つ共感性は、その話題(内容)に限られず、その表現方法によっても変わる。例えば同じ話題であっても、表現方法によっては、ユーザの共感性に対する影響力は違ってくる。
そこで、本発明は、ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及びプログラムを提供することを目的とする。
本発明によれば、ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
学習機能として、
コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶手段と、
コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶手段と、
コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する項目反応理論算出手段と、
コンテンツcl毎に、コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する機械学習エンジンと
として機能させ、
運用機能として、
推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出するコンテンツ特徴量行列算出手段と
して機能させると共に、
機械学習エンジンは、推定対象コンテンツcEの特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する
ようにコンピュータを機能させる。
本発明のプログラムにおける他の実施形態によれば、
共感度は、
コンテンツの登場人物又は著作者の感情を理解する認知度tRと、
コンテンツの登場人物又は著作者と同じ感情を生じる情動度tE
からなり、
項目反応理論算出手段は、2母数ロジスティックモデルとして算出する
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
コンテンツが、テキストである場合、
コンテンツ特徴要素は、複数のコンテンツのテキストを、述語項構造解析に基づいて、述語項構造の分布からLDA(Latent Dirichlet Allocation)によって分類した複数個のトピックグループであり、
特徴量は、各コンテンツのテキストについて、分類された各トピックグループに属するトピック比率(確からしさ)である
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
コンテンツは、不特定多数の第三者からWebサーバに投稿されたものであり、
共感影響力Mは、ユーザがWebサーバの当該コンテンツを閲覧した際に受ける感情に基づくものである
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
機械学習エンジンは、線形回帰、サポートベクターマシン(Support Vector Machine)、又は、深層学習の回帰学習に基づくものである
ようにコンピュータを機能させることも好ましい。
本発明によれば、ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置であって、
学習機能として、
コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶手段と、
コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶手段と、
コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する項目反応理論算出手段と、
コンテンツcl毎に、コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する機械学習エンジンと
を有し、
運用機能として、
推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出するコンテンツ特徴量行列算出手段を有し、
機械学習エンジンは、推定対象コンテンツcEの特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する
ことを特徴とする。
本発明によれば、ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置の推定方法であって、
装置は、
学習機能として、
コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶部と、
コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶部と、
コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する第11のステップと、
機械学習エンジンを用いて、コンテンツcl毎に、コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する第12のステップと
を実行し、
運用機能として、
推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出する第21のステップと、
機械学習エンジンが、推定対象コンテンツcEの特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する第22のステップと
を実行することを特徴とする。
本発明のプログラム、装置及び方法によれば、ユーザに対するコンテンツの共感影響力を推定することができる。
本発明におけるシステム構成図である。 本発明における推定装置の機能構成図である。 共感度行列を表す説明図である。 トピックグループをコンテンツ特徴要素としたコンテンツ特徴量行列を表す説明図である。 コンテンツに対してユーザが持つ認知度及び情動度を表す説明図である。 共感度として認知度及び情動度を適用した説明図である。 共感度行列として認知度及び情動度を適用した説明図である。 コンテンツ毎の項目反応カテゴリ特性曲線を表す説明図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明におけるシステム構成図である。
インターネットに接続されるWebサーバ2は、様々なコンテンツを公開する。Webサーバ2は、例えば、ニュースサイトや、ブログ(Web log)サイト、ミニブログサイト(例えばtwitter(登録商標)、SNS(Social Networking Service)サイト(例えばfacebook(登録商標)やLINE(登録商標))、掲示板サイトのようなものであってもよい。コンテンツは、不特定多数の第三者からWebサーバに投稿されたものであってもよい。
端末3は、アクセスネットワーク及びインターネットを介して、Webサーバ2へアクセスし、それらコンテンツをユーザに閲覧させる。
本発明における推定装置1は、ユーザに対するコンテンツの共感影響力を推定する。即ち、心理学的な共感性の高いコンテンツを発見することができる。
図2は、本発明における推定装置の機能構成図である。
本発明における推定装置1は、ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する。
図2によれば、推定装置1は、<学習機能>及び<運用機能>に大別され、両機能に共通して、機械学習エンジン12を有する。
推定装置1は、学習機能として、コンテンツ蓄積部101と、共感度行列記憶部102と、コンテンツ特徴量行列記憶部103と、項目反応理論算出部11とを有する。
また、運用機能として、コンテンツ特徴量行列算出部13を有する。
これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、装置の推定方法として理解できる。
<学習機能>
学習機能は、教師データとしてのコンテンツcl(c1〜cL)毎に、複数のユーザsn(s1〜sN)の項目反応理論結果(識別度an及び難易度bn)と、コンテンツ特徴量とに基づいて、機械学習エンジン12内に学習モデルを構築する。
[コンテンツ蓄積部101]
コンテンツ蓄積部101は、教師データとして、複数のコンテンツ(c1〜cL)を蓄積したものである。コンテンツとしては、例えばテキスト(記事やブログなど)、画像、映像など、ユーザに閲覧される形式のものであればよい。
[共感度行列記憶部102]
共感度行列記憶部102は、コンテンツcl毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する。
図3は、共感度行列を表す説明図である。
図3によれば、教師データとしてのコンテンツcl毎に、例えばアンケートによって主観評価としての共感度の回答を得ている。例えば、被験者(s1〜sN)それぞれに、各コンテンツ(c1〜cL)を明示し、その共感度について例えば3段階(w=3)の回答を得る。これによって作成された共感度行列Tln(t11〜t1N,〜,tL1〜tLN)が記憶されている。
[コンテンツ特徴量行列記憶部103]
コンテンツ特徴量行列記憶部103は、コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Flj(L行J列)を記憶する。
コンテンツがテキストである場合、コンテンツ特徴要素は、一般的に、「名詞・形容詞・動詞」のような要約に役立つ単語であってもよい。これによって、テキストの論旨や趣旨を反映しようとすることができる。勿論、特徴要素に更に、助動詞、形容詞、感嘆詞などを含めたものであってもよい。
また、共感性を考慮した場合、コンテンツ特徴量は、登場人物や著作者の意図を表す表現である「様相(modality)・時制(aspect)・肯定/否定極性(polarity)」のような付加情報を、コンテンツ特徴量することが好ましい。
具体的には、コンテンツ特徴量を、動詞(原形X)と、その動詞に後続する助動詞や終助詞等から抽出した様相等の付加情報を動詞に付加したX'とにする。
例えば「誰も動けなかった」から、「動く」と「動く+可能+過去+否定」といった2つの単語(素性)が出現する。これは、ベクトル形式でありながら、汎用性の高い「動く」の語が特徴量に反映される一方で、情報が付加された動詞によって話題内容をより詳細に表現することができる。
更に、コンテンツ特徴要素は、複数のコンテンツclのテキストを、述語項構造解析に基づいて、述語項構造の分布からLDA(Latent Dirichlet Allocation)によって分類した複数個のトピックグループであることも好ましい。
特に、述語項構造に、助動詞や形容詞、感嘆詞を含ませることによって、テキストから情緒的な成分を取り出すことができ、共感度の推定精度が改善する。
LDAは、単語文章行列を次元圧縮する技術(LSI(latent Semantic Indexin))に対して、単語の特徴ベクトルに揺らぎに基づく確率的な枠組みを導入したものである。その圧縮した次元の集合をトピックという。
また、「述語項構造」とは、文章中の述語に対して「項」となる名詞句等を当てたものである。述語項構造を用いることによって、文章の意味の骨格を把握することができる。述語項構造解析として、例えばフリーソフトであるSyncha等の述語項構造解析器を用いることができる。述語項構造は、「述語」に対する「目的語」とその格とから構成される。
特徴量は、各コンテンツのテキストについて、分類された各トピックグループに属するトピック比率(確からしさ)である。
各コンテンツは、LDAによっていずれか1つのトピックグループに分類される。
図4は、トピックグループをコンテンツ特徴要素としたコンテンツ特徴量行列を表す説明図である。
図4によれば、例えば「携帯を探す」の述語項構造は、述語「探す」に対して目的語「携帯」及び格「ヲ」からなる。また、例えば「サービスに申し込む」の述語項構造は、述語「申し込む」に対して目的語「サービス」及び格「ニ」からなる。
(S41)教師データとなるコンテンツのテキストから、述語項構造毎の出現頻度(出現回数)をLDA処理へ入力する。そして、テキスト毎に、各述語項構造の出現頻度を計数する。
(S42)次に、本件でのLDA処理では、トピック毎の述語項構造分布や、テキスト毎のトピック比率を取得する。このトピック比率によって、テキストが属するトピックグループに分類する。そして、トピックグループ毎に、全てのテキストに含まれる各述語項構造の出現頻度を計数する。
(S43)次に、テキスト毎に、各トピックグループに属する述語項構造を計数する。そして、テキストを計数値の高いトピックグループに分類する。
[項目反応理論算出部11]
項目反応理論算出部11は、コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する。
項目反応理論とは、評価項目群へのユーザの応答に基づいて、識別度α・難易度β(及びユーザ能力θ)を測定するための試験理論をいう(例えば非特許文献7参照)。これは、評価項目に対するユーザの離散的な回答から、確率論的に、識別度・難易度(及びユーザ能力)を算出する。ユーザに対する試験項目のストックを保守し、複数の試験の難易度を同等とみなすコンピュータ適応型テスト(Computerized Adaptive Testing)に適する。
識別度al :コンテンツlがユーザの能力を識別する力を表す実数値
難易度bl :コンテンツlの難しさを表す実数値
(ユーザ能力θl:コンテンツlに対するユーザnの能力の大きさを表す実数値)
基本的に、ユーザ能力と識別度及び難易度との差を、ロジスティック曲線に当てはめて、回答の確率を求める。例えばコンテンツclがユーザsnにとって共感度が高い場合、その確率は限りなく1に近づき、逆に共感度が低い場合、その確率は限りなく0に近づく。
2母数ロジスティックモデルの場合、以下のように確率が算出される。
p(θ)=1/(1+e−Da(θ−b))
[学習機能の機械学習エンジン12]
学習機能の機械学習エンジン12は、コンテンツcl毎に、コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する。
機械学習エンジン12は、線形回帰、サポートベクターマシン(Support Vector Machine)、又は、深層学習の回帰学習に基づくものであってもよい。
<運用機能>
運用機能は、未知の推定対象コンテンツcEを入力し、共感影響力Mを出力する。
[コンテンツ特徴量行列算出部13]
コンテンツ特徴量行列算出部13は、推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出する。
ここで、コンテンツ特徴量行列算出部13は、前述したコンテンツ特徴量行列記憶部103と全く同じ方法で、コンテンツ特徴量行列FEを算出する。
[運用機能の機械学習エンジン12]
運用機能の機械学習エンジン12は、推定対象コンテンツ(未知)cEの特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する。
図5は、コンテンツに対してユーザが持つ認知度及び情動度を表す説明図である。
心理学の知見によれば、共感度は、「認知度」と「情動度」とによって表される。
「共感度」:他者の感情を理解し、他者と同じ感情を持つ人の性質
「認知度」:他者の感情(心理状態)を理解する度合い
「情動度」:他者と同じ感情(代理的な反応の強さ)を持つ度合い
ここでの「他者」とは、コンテンツの登場人物又は著作者を意味することとなる。
図5によれば、多数のユーザ(被験者)に同一の記事を閲覧してもらい、各ユーザが「興味を引く話題か?」「心に響く話題か?」を質問して得られた、主観評価としての回答結果である。
興味を引く話題か?:引かない=認知度が低い
:引く =認知度が高い
心に響く話題か? :響かない=情動度が低い
:響く =情動度が高い
図5の表によれば、同一の記事に対して、「興味を引く」と感じる一方で「心に響かない」と感じるユーザがおり、また、「興味を引かない」と感じる一方で「心に響く」と感じるユーザもいる。
図6は、共感度として認知度及び情動度を適用した説明図である。
図7は、共感度行列として認知度及び情動度を適用した説明図である。
図6によれば、共感度行列記憶部102は、図2と比較して、共感度行列Tとして、認知度T1と情動度T2とが別々に記憶されている。
図7によれば、被験者群 (s1〜sN)のN人にそれぞれに、各コンテンツ(c1〜cL)を明示し、その認知度及び情動度について例えば3段階(w=3)の回答を得る。これによって、評価項目数=2の共感度行列T1 ln(t1 11〜t1 1N,〜,t1 L1〜t1 LN)及びT2 ln(t2 11〜t2 1N,〜,t2 L1〜t2 LN)が、項目反応理論算出部11へ入力される。
これに対し、項目反応理論算出部11は、2母数ロジスティックモデルとして、以下のように、識別度α及び情動度βを算出する。
認知度の識別度:α1 1〜α1 L
認知度の難易度:β1 1〜β1 L
情動度の識別度:α2 1〜α2 L
情動度の難易度:β2 1〜β2 L
尚、一部のユーザが、ランダムに回答することができる場合、項目反応理論算出部11は、3母数ロジスティックモデルとして算出するものであってもよい。
機械学習エンジン12は、コンテンツcl毎に、特徴量行列Flと、認知度に対する識別度α1 1及び難易度β1 1と、情動度に対する識別度α1 2及び難易度β1 2とを対応付けた教師データによって学習する。そして、以下のように学習モデルを構築する。
認知度の識別度α1 1に対する学習モデル:Ma1
認知度の難易度β1 1に対する学習モデル:Mb1
情動度の識別度α1 2に対する学習モデル:Ma2
情動度の難易度β1 2に対する学習モデル:Mb2
そして、機械学習エンジン12は、推定対象コンテンツcEの特徴量行列FEを入力すると、識別度に対する認知度α1 E及び難易度β1 Eと、情動度に対する認知度α2 E及び難易度β2 Eとを、影響力Mとして出力する。
図8は、コンテンツ毎の項目反応カテゴリ特性曲線を表す説明図である。
項目反応カテゴリ特性曲線(IRCCC(Item Response Category Characteristic Curve))は、以下のように作成される。
横軸:能力値 (左側:共感度が低い、右側:共感度が高い)
(左側:識別度が低い、右側:識別度が高い)
(左側:情動度が低い、右側:情動度が高い)
縦軸:確率p
曲線:各選択肢(「共感しない」「わからない」「共感する」)
(「興味を引かない」「わからない」「興味を引く」)
(「心に響かない」「わからない」「心に響かない」)
図8の項目反応カテゴリ特性曲線は、100件のコンテンツ(c1〜c100)について、300名のユーザ(s1〜s300)に対する認知度及び情動度の共感度行列T1及びT2と、8次元のコンテンツ特徴量行列Fとから得られたものである。
難易度bは、ユーザ能力θと同じスケール上にあり、識別度aは、項目反応カテゴリ特性曲線の傾きを決定する。曲線の傾きが大きいほど、難易度bとユーザ能力θとの差が大きいほど、回答がくっきり分かれることを表す。
図8によれば、4件のコンテンツ(ID36,ID72,ID82,ID94)について、認知度及び情動度の共感度行列それぞれの項目反応カテゴリ特性曲線が表されている。ID82及びID94は、ID72と比較して、認知度が高いことがわかる。また、ID82は、ID94及びID72と比較して、情動度が高いことがわかる。
これによって、ID82は、認知度が高く且つ情動度も高いことがわかる。また、ID94及びID72は、情動度が低いことがわかる。
以上、詳細に説明したように、本発明のプログラム、推定装置及び方法によれば、ユーザに対するコンテンツの共感影響力を推定することができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 推定装置
101 コンテンツ蓄積部
102 共感度行列記憶部
103 コンテンツ特徴量行列記憶部
11 項目反応理論算出部
12 機械学習エンジン
13 コンテンツ特徴量行列算出部
2 Webサーバ
3 端末

Claims (7)

  1. ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
    学習機能として、
    コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶手段と、
    前記コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶手段と、
    前記コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する項目反応理論算出手段と、
    前記コンテンツcl毎に、前記コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する機械学習エンジンと
    として機能させ、
    運用機能として、
    推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出するコンテンツ特徴量行列算出手段と
    して機能させると共に、
    前記機械学習エンジンは、前記推定対象コンテンツcEの前記特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する
    ようにコンピュータを機能させることを特徴とするプログラム。
  2. 前記共感度は、
    前記コンテンツの登場人物又は著作者の感情を理解する認知度tRと、
    前記コンテンツの登場人物又は著作者と同じ感情を生じる情動度tE
    からなり、
    前記項目反応理論算出手段は、2母数ロジスティックモデルとして算出する
    ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
  3. 前記コンテンツが、テキストである場合、
    前記コンテンツ特徴要素は、複数のコンテンツのテキストを、述語項構造解析に基づいて、述語項構造の分布からLDA(Latent Dirichlet Allocation)によって分類した複数個のトピックグループであり、
    前記特徴量は、各コンテンツのテキストについて、分類された各トピックグループに属するトピック比率(確からしさ)である
    ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。
  4. 前記コンテンツは、不特定多数の第三者からWebサーバに投稿されたものであり、
    前記共感影響力Mは、ユーザがWebサーバの当該コンテンツを閲覧した際に受ける感情に基づくものである
    ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。
  5. 前記機械学習エンジンは、線形回帰、サポートベクターマシン(Support Vector Machine)、又は、深層学習の回帰学習に基づくものである
    ようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載のプログラム。
  6. ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置であって、
    学習機能として、
    コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶手段と、
    前記コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶手段と、
    前記コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する項目反応理論算出手段と、
    前記コンテンツcl毎に、前記コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する機械学習エンジンと
    を有し、
    運用機能として、
    推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出するコンテンツ特徴量行列算出手段を有し、
    前記機械学習エンジンは、前記推定対象コンテンツcEの前記特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する
    ことを特徴とする装置。
  7. ユーザに対する推定対象コンテンツcEの共感影響力Mを推定する装置の推定方法であって、
    前記装置は、
    学習機能として、
    コンテンツcl(c1〜cL)毎に、各ユーザ(s1〜sN)の共感度(t11〜t1N,〜,tL1〜tLN)を対応付けた共感度行列Tlnを記憶する共感度行列記憶部と、
    前記コンテンツcl毎に、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(f11〜f1J,〜,fL1〜fLJ)を対応付けたコンテンツ特徴量行列Fljを記憶するコンテンツ特徴量行列記憶部と、
    前記コンテンツcl毎に、ユーザの共感度行列Tlnを入力し、項目反応理論IRT(Item Response Theory)に基づく識別度αl及び難易度βlを算出する第11のステップと、
    機械学習エンジンを用いて、前記コンテンツcl毎に、前記コンテンツ特徴量行列Fljと識別度αl及び難易度βlとを対応付けた教師データとして学習する第12のステップと
    を実行し、
    運用機能として、
    推定対象コンテンツcEについて、所定の各コンテンツ特徴要素(v1〜vJ)の特徴量(fE1〜fEJ)を対応付けたコンテンツ特徴量行列FEを算出する第21のステップと、
    前記機械学習エンジンが、前記推定対象コンテンツcEの前記特徴量行列FEを入力し、識別度αE及び難易度βEを、共感影響力Mとして出力する第22のステップと
    を実行することを特徴とする装置の推定方法。
JP2018037000A 2018-03-01 2018-03-01 ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法 Active JP6663944B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018037000A JP6663944B2 (ja) 2018-03-01 2018-03-01 ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法
PCT/JP2019/006261 WO2019167742A1 (ja) 2018-03-01 2019-02-20 ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018037000A JP6663944B2 (ja) 2018-03-01 2018-03-01 ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法

Publications (2)

Publication Number Publication Date
JP2019153013A true JP2019153013A (ja) 2019-09-12
JP6663944B2 JP6663944B2 (ja) 2020-03-13

Family

ID=67806151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018037000A Active JP6663944B2 (ja) 2018-03-01 2018-03-01 ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法

Country Status (2)

Country Link
JP (1) JP6663944B2 (ja)
WO (1) WO2019167742A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023209962A1 (ja) * 2022-04-28 2023-11-02 日本電信電話株式会社 訓練装置、推定装置、訓練方法、推定方法、訓練プログラム及び推定プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210182663A1 (en) * 2019-12-17 2021-06-17 Sony Interactive Entertainment LLC Methods and systems for defining emotional machines

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080083248A (ko) * 2008-08-25 2008-09-17 이종운 좋다/싫다 평가만으로 아이템을 추천 받는 인터넷 시스템 -사용자들 평가에 통계적 유사성을 기반으로
US20140156582A1 (en) * 2012-11-30 2014-06-05 Jayson Holliewood Cornelius Item Response Methods as Applied to a Dynamic Content Distribution System and Methods

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023209962A1 (ja) * 2022-04-28 2023-11-02 日本電信電話株式会社 訓練装置、推定装置、訓練方法、推定方法、訓練プログラム及び推定プログラム

Also Published As

Publication number Publication date
WO2019167742A1 (ja) 2019-09-06
JP6663944B2 (ja) 2020-03-13

Similar Documents

Publication Publication Date Title
Abbasi et al. Text Analytics to Support Sense-Making in Social Media
Chung et al. Dissecting emotion and user influence in social media communities: An interaction modeling approach
Kwon et al. Rumor detection over varying time windows
Trinh et al. Lexicon-based sentiment analysis of Facebook comments in Vietnamese language
KR20120108095A (ko) 소셜 데이터 분석 시스템
CN108845986A (zh) 一种情感分析方法、设备及系统、计算机可读存储介质
Tago et al. Analyzing influence of emotional tweets on user relationships using naive bayes and dependency parsing
Zou et al. Exploring the early adoption of open AI among laypeople and technical professionals: An analysis of Twitter conversations on# ChatGPT and# GPT3
JP6663944B2 (ja) ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法
Anwar et al. Social relationship analysis using state-of-the-art embeddings
Hossein et al. Predicting motion picture box office performance using temporal tweet patterns
Brook O’Donnell et al. Linking neuroimaging with functional linguistic analysis to understand processes of successful communication
Mondal et al. Fake news detection exploiting TF-IDF vectorization with ensemble learning models
Mozafari et al. Content similarity analysis of written comments under posts in social media
Ugheoke et al. Detecting the gender of a tweet sender
JP6663945B2 (ja) コンテンツに対するユーザの共感能力を推定するプログラム、装置及び方法
KR20090126862A (ko) 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체
Naik et al. Community based emotional behaviour using Ekman’s emotional scale
Lima et al. Investigating the polarity of user postings in a social system
Xiao et al. How does the thread level of a comment affect its perceived persuasiveness? A Reddit study
Rocha et al. Connecting opinions to opinion-leaders: A case study on Brazilian political protests
Russo et al. Inside Trending Topic Algorithm: How Do Human Interactions Drive Public Opinion in an Artificial Environment
Su et al. Depressive emotion recognition based on behavioral data
Shayegan et al. A lexicon weighted sentiment analysis approach on Twitter
Rafae et al. Publications and Messages Exchanged in a Chat Room Analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200217

R150 Certificate of patent or registration of utility model

Ref document number: 6663944

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150