以下に、本願に係る情報処理装置、情報処理方法、および情報処理プログラムを実施するための形態(以下、「実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
まず、図1を用いて、実施形態に係る情報処理装置が実行する情報処理について説明する。図1は、実施形態に係る情報処理を示す図である。なお、図1では、実施形態に係る情報処理装置1を含む情報処理システムSの動作例を示している。図1に示すように、実施形態に係る情報処理システムSは、情報処理装置1と、提供者端末100と、複数のユーザ端末50とを含む。提供者端末100は、コンテンツの提供者の端末装置であり、情報処理システムSにおいて複数含まれる。
図1を用いた説明では、便宜上、複数のユーザ端末50を、ユーザ端末50aとユーザ端末50bとに分けて説明する。図1に示す例では、ユーザ端末50aおよびユーザ端末50bの各々は1台のみ示されているが、情報処理システムSには、ユーザ端末50aおよびユーザ端末50bの各々が複数含まれる。ユーザ端末50は、ユーザ端末50aおよびユーザ端末50bのいずれにもなり得る。
図1に示すように、実施形態に係る情報処理システムSでは、コンテンツの提供者が扱う提供者端末100が、コンテンツを情報処理装置1へ提供する(ステップS1)。つづいて、情報処理装置1は、ユーザ端末50aに対してコンテンツを配信する(ステップS2)。図1では、コンテンツの一例として、ニュースを配信している例を示しているが、ニュースに限らず、投稿記事等のテキストや画像等が含まれるコンテンツであれば任意のものであってよい。
つづいて、ユーザ端末50aは、配信されたコンテンツを画面表示するとともに、ユーザから画面に表示されたコンテンツの一部について強調表示の指定を受け付ける(ステップS3)。図1では、コンテンツに含まれるテキストの一部、詳細には、「リモートワーク・・・可能性があります。」が指定された例を示している。なお、ユーザは、テキスト以外にも、コンテンツに含まれる画像(静止画や動画)を強調表示の対象として指定することも可能である。
また、図1では、文単位での指定が行われた例を示しているが、文字単位、単語単位、または文節単位等での指定が行われてもよく、1つのコンテンツにおいて複数の箇所に指定が行われてもよい。ユーザ端末50aは、コンテンツの一部について強調表示の指定を受け付けた場合、受け付けた強調表示の指定を示す指定情報を情報処理装置1に送信する。情報処理装置1は、ユーザ端末50aからの指定情報に基づいて、コンテンツの一部について強調表示の指定を受け付ける。
つづいて、情報処理装置1は、指定されたコンテンツの一部を強調表示する(ステップS4)。図1では、指定されたコンテンツの一部を、下線を付することで強調表示を行う例を示しているが、テキストの文字を太く表示したり、ハイライト表示したり、枠で囲ったりすることができる。また、情報処理装置1は、例えば、画面に表示されたカーソル(マウス等で移動可能)がコンテンツの一部に移動した際や、ユーザがコンテンツの一部を選択した際には、強調表示をさらに強める(下線かつ太字等)ようにすることができる。
つづいて、情報処理装置1は、ユーザ端末50bからコンテンツの閲覧要求を受け付けた場合、一部が強調表示されたコンテンツをユーザ端末50bへ配信する(ステップS5)。一部が強調表示されたコンテンツは、強調表示の指定を行ったユーザと属性情報(ユーザの属性を示す情報)が類似する他のユーザのみへ配信されてもよい。また一部が、強調表示されたコンテンツは、かかるコンテンツに興味がある(行動情報等から興味があると推定された)他のユーザのみへ配信されてもよい。なお、ステップS4の処理は、ステップS5の処理の中で行われてもよい。また、以下において、一部が強調表示されたコンテンツを強調表示されたコンテンツと記載する場合がある。
つづいて、情報処理装置1は、ユーザ端末50bを介して強調表示されたコンテンツの一部に対するユーザの反応を受け付ける(ステップS6)。例えば、情報処理装置1は、ユーザの反応として、コンテンツの一部に賛同(評価)する反応(例えば、「いいね」)や、コンテンツの一部に対するコメント等を受け付ける。例えば、情報処理装置1は、強調表示されたコンテンツの一部の近傍に、評価する反応を行うための評価ボタン(賛同および反対のボタン)や、コメントを入力するためのボタンを表示することでユーザの反応を受け付ける。また、情報処理装置1は、入力されたコメントに対する評価(賛同および反対)を受け付けるための評価ボタンを表示してもよい。
また、情報処理装置1は、強調表示されたコンテンツとともに、強調表示の指定を行ったユーザに関する情報(属性情報や、強調表示の指定を行ったユーザ数等)を併せて表示してもよい。
つづいて、情報処理装置1は、強調部分の情報とタイトルの情報とを含むコンテンツ関連情報を取得する(ステップS7)。強調部分は、ユーザの指定によって強調表示された部分であり、コンテンツにおいて、ユーザの指定によって強調表示された部分が複数ある場合、コンテンツ情報関連には、複数の強調部分の情報が含まれる。また、タイトルの情報には、例えば、タイトルを示す文字列の情報が含まれており、以下において、タイトルの情報を単にタイトルと記載する場合がある。
つづいて、情報処理装置1は、ステップS6で取得されたコンテンツ関連情報に基づいて、コンテンツの強調部分の要点とタイトルとの乖離性を推定する(ステップS8)。情報処理装置1は、コンテンツの強調部分の情報に基づいて、強調部分の要点を特定する。そして、情報処理装置1は、特定した要点とタイトルとの乖離性を推定する。
情報処理装置1は、例えば、テキストを入力し、入力したテキストを要約して入力したテキストの要点を出力する要約モデルを有している。情報処理装置1は、強調部分のテキストを要約モデルに入力することで、要約モデルから強調部分のテキストの要約を得ることができる。要約モデルは、抽出型モデルまたは抽象型モデルである。かかる要約モデルとして、例えば、Seq2Seq(sequence-to-sequence)等の公知の学習モデル(例えば、特開2021-149606号公報参照)を用いることができるが、かかる例に限定されない。
また、情報処理装置1は、例えば、コンテンツの強調部分のテキストに含まれる単語または語句のTF-IDF(Term Frequency-Inverse Document Frequency)値を計算し、かかるTF-IDF値に基づいて、強調部分の要点を特定することもできる。例えば、情報処理装置1は、TF-IDF値が高い順に予め設定された数の単語または語句を強調部分の要点を示す単語または語句として特定することができる。また、情報処理装置1は、TF-IDF値が閾値以上の単語または語句を強調部分の要点を示す単語または語句として特定することができる。
情報処理装置1は、コンテンツにおける強調部分のうち特定ユーザが強調表示した部分を優先して用いて要点を特定することができる。特定ユーザは、例えば、コンテンツで示される分野の専門家であるが、かかる例に限定されない。例えば、特定ユーザは、コンテンツの提供者が指定したユーザであってもよい。
例えば、情報処理装置1は、コンテンツにおける強調部分のうち特定ユーザが強調表示した部分のみを用いて要点を特定したり、特定ユーザが強調表示した部分の重みを他のユーザが強調表示した部分の重みよりも大きくして要点を特定したりすることができる。
また、情報処理装置1は、コンテンツにおける強調部分のうち強調表示の指定をしたユーザの数が多い部分を優先して用いて要点を特定することができる。例えば、情報処理装置1は、強調表示の指定をしたユーザの数が多い部分(例えば、ユーザの数が閾値以上の部分)のみを用いて要点を特定したり、強調表示の指定をしたユーザの数が多いほど重みを大きくして要点を特定したりすることができる。
また、情報処理装置1は、ユーザによって複数の部分に対する強調表示の指定がある場合、指定の順番に応じた重み付けを行ってもよい。例えば、情報処理装置1は、ユーザによる強調表示の指定の順番が遅い部分ほど重みを大きくしたりまたは小さくしたりすることができる。
また、情報処理装置1は、コンテンツに対する強調表示の指定頻度に応じた重み付けを行ってもよい。例えば、情報処理装置1は、強調表示の指定の頻度が高いユーザによって強調表示の指定がされた部分を強調表示の指定の頻度が高いユーザによって強調表示の指定がされた部分よりも重み付けを大きくしたりまたは小さくしたりすることができる。
また、情報処理装置1は、強調表示の指定を行ったユーザの属性毎の強調部分の情報に基づいて、ユーザの属性毎の要点を特定することができる。例えば、情報処理装置1は、男性が強調表示した部分の情報に基づいて、男性が強調表示を行った部分の要点を特定し、女性が強調表示した部分の情報に基づいて、女性が強調表示を行った部分の要点を特定することができる。
ユーザの属性毎の要点は、例えば、1つの属性項目で示される属性の要点、または複数の属性項目で示される属性の要点である。属性項目は、例えば、性別、年齢、職業、居住地等のデモグラフィック属性を示す項目、興味関心や思想の傾向等のサイコグラフィック属性を示す項目等である。
情報処理装置1は、例えば、思想の傾向が第1傾向のユーザによって強調表示の指定がされた部分を用いた要点と、思想の傾向が第2傾向のユーザによって強調表示された部分を用いた要点とを特定することができる。
つづいて、情報処理装置1は、特定した強調部分の要点とコンテンツのタイトルとの乖離性を推定する。情報処理装置1は、例えば、自然言語処理技術を用いて、要点とタイトルとの乖離性を推定する。
例えば、情報処理装置1は、強調部分の要点およびタイトルの各々に含まれる単語または語句を、W2V(Word2Vec)等のように意味が類似する単語を類似するベクトルへと変換する変換モデルを用いて、強調部分の要点およびタイトルの各々に含まれる単語または語句をベクトル化する。
そして、情報処理装置1は、例えば、タイトルに含まれる単語または語句のベクトルと、強調部分の要点に含まれる単語または語句のベクトルとの比較結果に基づいて、要点とタイトルとの乖離性を推定する。例えば、情報処理装置1は、タイトルに含まれる単語または語句のベクトルと強調部分の要点に含まれる単語または語句のベクトルとを入力とし、要点とタイトルとの類似度を出力する推定モデルを用いて、要点とタイトルとの乖離性を推定することができる。
また、情報処理装置1は、例えば、タイトルに含まれる単語または語句のベクトルの各々に対する強調部分の要点に含まれる単語または語句のベクトルの差の合計が小さいほど、要点とタイトルとの乖離性が小さいと推定する。
例えば、タイトルに含まれる単語または語句のベクトルを第1ベクトルとし、強調部分の要点に含まれる単語または語句のベクトルを第2ベクトルとする。そして、第1ベクトルが複数あり、第2ベクトルが複数あるとする。
この場合、情報処理装置1は、第1ベクトルに最も距離が近い第2ベクトルと第1ベクトルとの距離差を第1ベクトル毎に算出し、第1ベクトル毎の距離差に基づいて、要点とタイトルとの乖離性を推定する。例えば、情報処理装置1は、第1ベクトル毎の距離差の合計に係数を乗算して得られる値を要点とタイトルとの乖離度として算出し、かかる乖離度を乖離性として推定する。
なお、要点とタイトルとの乖離性の推定方法は、上述した方法に限定されず、種々の推定方法を用いることができる。例えば、タイトルに含まれる単語または語句のうち要点に含まれる単語または語句の割合が少ないほど、要点とタイトルとの乖離性が小さいと推定することもできる。
つづいて、情報処理装置1は、ステップS8で推定した強調部分の要点とコンテンツのタイトルとの乖離性を示す情報である乖離性情報を提供者端末100に送信することで、乖離性情報をコンテンツの提供者に提供する(ステップS9)。
情報処理装置1は、ステップS8で推定した乖離性の高さが予め定められた高さ以上である場合に、ステップS9の処理を行うことができる。なお、乖離性情報の提供先は、コンテンツの管理者に限定されず、例えば、ユーザ端末50のユーザであってもよく、コンテンツに関連付けられる広告の提供者や広告元の会社等であってもよい。
また、情報処理装置1は、ステップS8で推定した乖離性の高さが予め定められた高さ以上である場合、タイトルの修正をコンテンツの提供者に対して提案することもできる。情報処理装置1は、例えば、ステップS8で特定された要点の内容を示してタイトルの修正の提案を行うことができる。
なお、情報処理装置1は、例えば、評価ボタンを押下したユーザ数の情報を提供することもできる。また、情報処理装置1は、入力されたコメントのリストや、コメントの要約、コメントの分析結果(コメントの傾向等)等を提供することもできる。また、情報処理装置1は、反応したユーザに関する情報(属性情報等)を提供することもできる。
また、情報処理装置1は、賛同する評価ボタンを押下したユーザ数に応じたランキングを提供することもできる。かかるランキングは、例えば、コンテンツへのアクセス情報(例えば、URL)とともにタイムライン上に表示してもよい。
また、情報処理装置1は、入力されたコメントに対する評価が高い(賛同が閾値以上)コメントを強調表示して提供することもできる。また、情報処理装置1は、入力されたコメントを他のサービス(例えば、SNS等)に提供することもできる。
このように、情報処理装置1は、コンテンツのうちユーザの指定によって強調表示された部分の情報とコンテンツのタイトルの情報とを含むコンテンツ関連情報に基づいて、強調表示された部分の要点とタイトルとの乖離性を推定する。したがって、実施形態に係る情報処理装置1によれば、ユーザによって強調表示の指定がされた部分を用いてコンテンツの解析を行うことができる。
次に、図2を用いて、実施形態に係る情報処理システムSの構成例について説明する。図2は、実施形態に係る情報処理システムSの構成例を示す図である。図2に示すように、実施形態に係る情報処理システムSは、情報処理装置1と、複数のユーザ端末50とがネットワークNに対して有線または無線により接続される。ネットワークNは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)等のネットワークである。
情報処理装置1は、情報処理方法を実行するサーバ装置である。情報処理装置1は、ユーザに配信したコンテンツの一部について強調表示の指定を受け付ける。また、情報処理装置1は、指定されたコンテンツの一部を強調表示するとともに、強調表示されたコンテンツの一部に対するユーザの反応を受け付ける。また、情報処理装置1は、受け付けたユーザの反応に基づいた情報提供を行う。また、情報処理装置1は、要点とタイトルとの乖離性を推定する。
なお、コンテンツは、情報処理装置1によって配信されてもよく、外部の配信サーバによって配信されてもよい。
また、情報処理装置1は、各ユーザのユーザ端末50と連携し、各ユーザのユーザ端末50に対して、各種アプリケーション(以下、アプリ)等に対するAPI(Application Programming Interface)サービス等と、各種データを提供する情報処理装置であり、サーバ装置やクラウドシステム等により実現される。
また、情報処理装置1は、各ユーザのユーザ端末50に対して、オンラインで何らかのWebサービスを提供する情報処理装置であってもよい。例えば、情報処理装置1は、Webサービスとして、インターネット接続、検索サービス、SNS(Social Networking Service)、電子商取引(EC:Electronic Commerce)、電子決済、オンラインゲーム、オンラインバンキング、オンライントレーディング、宿泊・チケット予約、動画・音楽配信、ニュース、地図、ルート検索、経路案内、路線情報、運行情報、天気予報等のサービスを提供してもよい。実際には、情報処理装置1は、上記のようなWebサービスを提供する各種サーバと連携し、Webサービスを仲介してもよいし、Webサービスの処理を担当してもよい。
ユーザ端末50は、ユーザが所持する端末装置である。ユーザ端末50は、スマートフォン、デスクトップ型PC、ノート型PC(Personal Computer)、タブレット型PC等の任意のタイプの端末装置を用いることができる。ユーザ端末50は、情報処理装置1へ各種情報を送信したり、情報処理装置1から提供される情報を受信したりする。
次に、図3を参照して、情報処理装置1の構成例について説明する。
図3は、実施形態に係る情報処理装置1の構成例を示す図である。図3に示されるように、情報処理装置1は、通信部2と、制御部3と、記憶部4とを有する。制御部3は、配信部31と、受付部32と、表示制御部33と、取得部34と、推定部35と、提案部36と、提供部37とを備える。記憶部4は、ユーザ情報41と、強調表示情報42と、コンテンツ情報43とを記憶する。
通信部2は、例えば、NIC(Network Interface Card)等によって実現される。通信部2は、有線または無線によりネットワーク網と接続される。
制御部3は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報処理装置1内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAM等を作業領域として実行されることにより実現される。また、制御部3は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、GPGPU(General Purpose Graphic Processing Unit)等の集積回路により実現されてもよい。
記憶部4は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
ユーザ情報41は、ユーザに関する情報である。図4は、実施形態に係る情報処理装置1の記憶部4に記憶されるユーザ情報41の一例を示す図である。図4に示すように、ユーザ情報41は、「ユーザID」、「属性情報」、「行動履歴情報」、「強調部分情報」等の項目を含む。
「ユーザID」は、ユーザを識別する識別情報である。「属性情報」は、ユーザの属性に関する情報であり、サイコグラフィック属性の情報や、デモグラフィック属性の情報等を含む。デモグラフィック属性は、例えば、性別、年齢、居住地、および職業等であり、サイコグラフィック属性は、旅行、服、車、宗教等の興味関心対象、生活スタイル、思想や思想の傾向等である。
「行動履歴情報」は、ユーザの行動に関する履歴情報であり、例えば、オンラインサービスでのユーザの行動、オフラインでのユーザの行動等の履歴情報である。「強調部分情報」は、ユーザによって強調表示の対象として指定されたコンテンツの部分(箇所)である強調部分を示す情報である。「強調部分情報」は、例えば、テキスト、静止画、動画等である。
強調表示情報42は、強調表示されたコンテンツに関する情報である。図5は、実施形態に係る情報処理装置1の記憶部4に記憶される強調表示情報42の一例を示す図である。図5に示すように、強調表示情報42は、「指定ID」、「コンテンツID」、「強調部分情報」、「反応情報」等の項目を含む。
「指定ID」は、強調表示の対象として指定されたコンテンツの一部を識別する識別情報である。「コンテンツID」は、強調表示の対象として指定されたコンテンツを識別する識別情報である。「強調部分情報」は、強調表示の対象として指定されたコンテンツの部分(箇所)である強調部分を示す情報である。「反応情報」は、強調表示されたコンテンツの一部に対するユーザの反応を示す情報である。
コンテンツ情報43は、コンテンツの情報である。図6は、実施形態に係る情報処理装置1の記憶部4に記憶されるコンテンツ情報43の一例を示す図である。図6に示すように、強調表示情報42は、「コンテンツID」、「コンテンツ」等の項目を含む。「コンテンツID」は、コンテンツを識別する識別情報である。
「コンテンツ」は、コンテンツの情報であり、例えば、コンテンツのレイアウト情報、コンテンツを構成するテキストの情報、コンテンツを構成する画像の情報等を含む。コンテンツを構成するテキストの情報には、例えば、コンテンツのタイトルを示すテキストの情報、コンテンツの詳細を示すテキストの情報等が含まれる。
次に、情報処理装置1の制御部3の各機能(配信部31、受付部32、表示制御部33、取得部34、推定部35、提案部36、および提供部37)について説明する。
配信部31は、コンテンツをユーザ端末50へ配信する。例えば、配信部31は、後述する表示制御部33によって一部が強調表示されたコンテンツを配信する。強調表示されたコンテンツの配信先は、例えば、強調表示の指定を行ったユーザと属性情報が類似する他のユーザである。また、強調表示されたコンテンツの配信先は、強調表示したコンテンツに興味がある他のユーザである。
図7は、実施形態に係る情報処理装置1の配信部31によって提供されるコンテンツの一例を示す図である。図7に示すコンテンツ60は、ニュースコンテンツであり、画像61と、テキスト62とが含まれる。また、テキスト62の一部は下線によって強調表示されている。図7に示す例では、強調表示されている箇所として強調部分63a,63bが示されている。
強調部分63aは、テキスト62の一部「リモートワーク・・・可能性があります。」が強調表されている部分であり、強調部分63bは、テキスト62の一部「企業の中には・・・・います。」が強調表されている部分である。
これにより、ユーザは、他のユーザが強調表示した部分である強調部分63a,63bを容易に把握することができる。他のユーザが強調表示は、他のユーザが重要であると認識した部分であることから、情報処理装置1は、良質なコンテンツをユーザに提供することができる。以下において、強調部分63a,63bの各々を個別に区別せずに示す場合、強調部分63と記載する場合がある。
受付部32は、配信部31によって配信されたコンテンツ60の一部について強調表示の指定を受け付ける。例えば、受付部32は、コンテンツ60に含まれるテキストや、画像(静止画や動画)を強調表示の指定として受け付ける。
なお、強調表示の指定は、文単位、文字単位、単語単位、文節単位等の任意の範囲での指定が可能である。また、1つのコンテンツ60において複数の箇所に強調表示の指定が行われてもよい。
また、受付部32は、文意が通らない範囲での指定を受け付けた場合には、ユーザに対して誤入力の有無を確認したり、文意が通るように指定範囲を補正したりしてもよい。
受付部32は、表示制御部33によって強調表示されたコンテンツ60の一部に対するユーザの反応を受け付ける。例えば、受付部32は、ユーザの反応として、コンテンツ60の一部に賛同(評価)する反応(例えば、「いいね」)や、コンテンツ60の一部に対するコメント等を受け付ける。
また、受付部32は、強調部分63の選択を受け付ける。例えば、受付部32は、ユーザ端末50からの選択情報をネットワークNおよび通信部2を介して受信した場合、受信した選択情報に基づいて、強調部分63の選択を受け付ける。
例えば、受付部32は、強調表示されたコンテンツ60の一部の近傍に、評価する反応を行うための評価ボタン(賛同および反対のボタン)や、コメントを入力するためのボタンを表示することでユーザの反応を受け付ける。これらのボタンは、例えば、強調表示されたコンテンツ60の一部をユーザが選択した場合や、かかるコンテンツ60の一部にカーソルを移動させた場合に表示することとしてもよい。また、受付部32は、入力されたコメントに対する評価(賛同および反対)を受け付けるための評価ボタンを表示してもよい。
表示制御部33は、受付部32によって指定されたコンテンツ60の一部を強調表示する。例えば、表示制御部33は、指定されたコンテンツ60の一部をハイライト表示したり、テキストの文字を太く表示したり、下線を付したり、枠で囲ったりしてもよい。また、表示制御部33は、例えば、画面に表示されたカーソル(マウス等で移動可能)がコンテンツ60の一部に移動した際や、ユーザがコンテンツ60の一部を選択した際には、強調表示をさらに強める(ハイライト表示かつ太字等)ようにしてもよい。
また、表示制御部33は、コンテンツ60において受付部32によって強調表示の指定が受け付けられた箇所のすべてを強調表示するが、かかる例に限定されない。例えば、表示制御部33は、受付部32によって強調表示の指定を受け付けられたコンテンツ60の一部のうち、かかるコンテンツ60を閲覧する閲覧ユーザと類似するユーザによって強調表示の指定が行われたコンテンツ60の一部を強調表示することもできる。
例えば、表示制御部33は、受付部32によって強調表示の指定が受け付けられた部分のうち閲覧ユーザの属性情報と類似する属性情報を有するユーザによって強調表示の指定が行われたコンテンツ60の一部を強調表示することもできる。これにより、閲覧ユーザが興味を持つ確度が高い箇所に強調表示を行うことができる。
また、表示制御部33は、強調表示の指定を行ったユーザとの類似性に限らず、強調表示に対して評価やコメント等の反応を行った他のユーザとの類似性により強調表示を行ってもよい。つまり、表示制御部33は、受付部32によって強調表示の指定が受け付けられた部分のうち閲覧ユーザと類似する他のユーザの反応を受け付けたコンテンツ60の一部を強調表示する。これにより、閲覧ユーザが興味を持つ確度が高い箇所に強調表示を行うことができる。
また、表示制御部33は、受付部32によって強調表示の指定が受け付けられた部分に対して反応を行った他のユーザが複数である場合には、かかる複数の他のユーザの傾向と閲覧ユーザとが類似する場合に、コンテンツ60の一部を強調表示することもできる。これにより、閲覧ユーザが興味を持つ確度が高い箇所に強調表示を行うことができる。
また、表示制御部33は、受付部32によって強調表示の指定が受け付けられた部分のうち閲覧ユーザが過去に指定した強調表示の部分と類似する部分を過去に強調表示したユーザが指定したコンテンツ60の一部を強調表示することもできる。これにより、閲覧ユーザが興味を持つ確度が高い箇所に強調表示を行うことができる。
また、表示制御部33は、閲覧ユーザが過去に反応を行った強調表示に対して、類似する反応を行ったユーザが指定したコンテンツ60の一部を強調表示することもできる。これにより、閲覧ユーザが興味を持つ確度が高い箇所に強調表示を行うことができる。
取得部34は、強調部分63の情報とタイトルの情報とを含むコンテンツ関連情報をコンテンツ60毎に記憶部4から取得する。コンテンツ関連情報に含まれる強調部分63の情報は、強調表示情報42に含まれる情報であり、コンテンツ関連情報に含まれるタイトルの情報は、コンテンツ情報43に含まれる情報である。
強調部分63は、ユーザの指定によって強調表示された部分であり、コンテンツ60において、ユーザの指定によって強調表示された部分が複数ある場合、コンテンツ関連情報には、複数の強調部分63の情報が含まれる。
また、取得部34は、推定部35によって属性毎の乖離性を推定する場合、強調表示の指定を行ったユーザの属性毎に、強調部分63の情報を取得する。
推定部35は、取得部34によって取得されたコンテンツ関連情報に基づいて、コンテンツ60の強調部分63の要点とタイトルとの乖離性を推定する。推定部35は、コンテンツ60の強調部分63の情報に基づいて、強調部分63の要点を特定する特定部38と、特定部38によって特定された要点とタイトルとの乖離性を推定する推定処理部39とを備える。
特定部38は、例えば、テキストを入力し、入力したテキストを要約して入力したテキストの要点を出力する要約モデルを有している。特定部38は、強調部分63のテキストを要約モデルに入力することで、要約モデルから強調部分63のテキストの要約を得ることができる。要約モデルは、抽出型モデルまたは抽象型モデルである。かかる要約モデルとして、例えば、Seq2Seq等の公知の学習モデルを用いることができるが、かかる例に限定されない。
また、特定部38は、例えば、コンテンツ60の強調部分63のテキストに含まれる単語または語句のTF-IDF値を計算し、かかるTF-IDF値に基づいて、強調部分63の要点を特定することもできる。例えば、特定部38は、TF-IDF値が高い順に予め設定された数の単語または語句を強調部分63の要点を示す単語または語句として特定することができる。また、特定部38は、TF-IDF値が閾値以上の単語または語句を強調部分63の要点を示す単語または語句として特定することができる。
特定部38は、コンテンツ60における強調部分63のうち特定ユーザが強調表示した部分を優先して用いて要点を特定する。特定ユーザは、例えば、コンテンツ60で示される分野の専門家であるが、かかる例に限定されない。例えば、特定ユーザは、コンテンツ60の提供者が指定したユーザであってもよい。
例えば、特定部38は、コンテンツ60における強調部分63のうち特定ユーザが強調表示した部分のみを用いて要点を特定したり、特定ユーザが強調表示した部分の重みを他のユーザが強調表示した部分の重みよりも大きくして要点を特定したりすることができる。
また、特定部38は、コンテンツ60における強調部分63のうち強調表示の指定をしたユーザの数が多い部分を優先して用いて要点を特定することができる。例えば、特定部38は、強調表示の指定をしたユーザの数が多い部分(例えば、ユーザの数が閾値以上の部分)のみを用いて要点を特定したり、強調表示の指定をしたユーザの数が多いほど重みを大きくして要点を特定したりすることができる。
また、特定部38は、ユーザによって複数の部分に対する強調表示の指定がある場合、指定の順番に応じた重み付けを行ってもよい。例えば、特定部38は、ユーザによる強調表示の指定の順番が遅い部分ほど重みを大きくしたりまたは小さくしたりすることができる。
また、特定部38は、コンテンツ60に対する強調表示の指定頻度に応じた重み付けを行ってもよい。例えば、特定部38は、強調表示の指定の頻度が高いユーザによって強調表示された部分を強調表示の指定の頻度が高いユーザによって強調表示の指定がされた部分よりも重み付けを大きくしたりまたは小さくしたりすることができる。
また、特定部38は、強調表示の指定を行ったユーザの属性毎の強調部分63の情報に基づいて、ユーザの属性毎の要点を特定することができる。例えば、特定部38は、男性が強調表示した部分の情報に基づいて、男性が強調表示を行った部分の要点を特定し、女性が強調表示した部分の情報に基づいて、女性が強調表示を行った部分の要点を特定することができる。
ユーザの属性毎の要点は、例えば、1つの属性項目で示される属性の要点、または複数の属性項目で示される属性の要点である。属性項目は、例えば、性別、年齢、職業、居住地等のデモグラフィック属性を示す項目、興味関心や思想の傾向等のサイコグラフィック属性を示す項目等である。
また、特定部38は、例えば、思想の傾向が第1傾向のユーザによって強調表示の指定がされた部分を用いた要点と、思想の傾向が第2傾向のユーザによって強調表示の指定がされた部分を用いた要点とを推定することができる。
推定部35の推定処理部39は、特定した強調部分63の要点とコンテンツ60のタイトルとの乖離性を推定する。推定処理部39は、例えば、自然言語処理技術を用いて、要点とタイトルとの乖離性を推定する。
例えば、推定処理部39は、強調部分63の要点およびタイトルの各々に含まれる単語または語句を、W2V等のように意味が類似する単語を類似するベクトルへと変換する変換モデルを用いて、強調部分63の要点およびタイトルの各々に含まれる単語または語句をベクトル化する。
そして、推定処理部39は、例えば、タイトルに含まれる単語または語句のベクトルと、強調部分63の要点に含まれる単語または語句のベクトルとの比較結果に基づいて、要点とタイトルとの乖離性を推定する。例えば、推定処理部39は、タイトルに含まれる単語または語句のベクトルと強調部分63の要点に含まれる単語または語句のベクトルとを入力とし、要点とタイトルとの類似度を出力する推定モデルを用いて、要点とタイトルとの乖離性を推定することができる。
また、推定処理部39は、例えば、タイトルに含まれる単語または語句のベクトルの各々に対する強調部分63の要点に含まれる単語または語句のベクトルの差の合計が小さいほど、要点とタイトルとの乖離性が小さいと推定する。
例えば、タイトルに含まれる単語または語句のベクトルを第1ベクトルとし、強調部分63の要点に含まれる単語または語句のベクトルを第2ベクトルとする。そして、第1ベクトルが複数あり、第2ベクトルが複数あるとする。
この場合、推定処理部39は、第1ベクトルに最も距離が近い第2ベクトルと第1ベクトルとの距離差を第1ベクトル毎に算出し、第1ベクトル毎の距離差に基づいて、要点とタイトルとの乖離性を推定する。例えば、推定処理部39は、第1ベクトル毎の距離差の合計に係数を乗算して得られる値を要点とタイトルとの乖離度として算出し、かかる乖離度を乖離性として推定する。
なお、要点とタイトルとの乖離性の推定方法は、上述した方法に限定されず、種々の推定方法を用いることができる。例えば、タイトルに含まれる単語または語句のうち要点に含まれる単語または語句の割合が少ないほど、要点とタイトルとの乖離性が小さいと推定することもできる。
また、提案部36は、推定部35によって推定された乖離性の高さが予め定められた高さ以上である場合、タイトルの修正をコンテンツ60の提供者に対して提案する。提案部36は、例えば、推定部35によって特定された要点の内容を示してタイトルの修正の提案を行う。
また、提案部36は、例えば、推定部35によってユーザの属性毎の乖離性が推定された場合、ユーザの属性毎の乖離性のいずれかの乖離性の高さが予め定められた高さ以上である場合、タイトルの修正をコンテンツ60の提供者に対して提案することができる。
また、提案部36は、例えば、推定部35によってユーザの属性毎の乖離性が推定された場合、ユーザの属性毎の乖離性の高さがすべて予め定められた高さ以上である場合、タイトルの修正をコンテンツ60の提供者に対して提案することもできる。
提供部37は、推定部35によって推定された強調部分63の要点とコンテンツ60のタイトルとの乖離性を示す情報である乖離性情報を提供する。提供部37は、例えば、推定部35によって推定された乖離性の高さが予め定められた高さ以上である場合に、乖離性情報を提供する。
また、提供部37は、推定部35によってユーザの属性毎の乖離性が推定された場合、ユーザの属性毎の乖離性を示す情報を乖離性情報として提供する。提供部37は、例えば、ユーザの属性毎の乖離性のうち推定部35によって推定された高さが予め定められた高さ以上である乖離性を示す情報を乖離性情報として提供することができる。
また、提供部37は、受付部32が受け付けたユーザの反応に基づいた情報提供を行う。例えば、提供部37は、評価ボタンを押下したユーザ数の情報を提供する。これにより、強調表示されたコンテンツ60の一部に対する他のユーザの賛同数または反対数を容易に把握することができる。
また、提供部37は、入力されたコメントのリストや、コメントの要約、コメントの分析結果(コメントの傾向等)等を提供してもよい。このようなコメントに関する情報を提供することで、強調表示されたコンテンツ60の一部に対する他のユーザの意見を容易に把握することができる。
また、提供部37は、反応したユーザに関する情報(属性情報等)を提供してもよい。これにより、どのような属性のユーザが反応したかを容易に把握することができる。
また、提供部37は、配信部31の機能を含んでいてもよい。この場合、提供部37は、表示制御部33によって一部が強調表示されたコンテンツ60を配信する。
また、提供部37は、強調表示されたコンテンツ60とともに、強調表示の指定を行ったユーザに関する情報(属性情報や、強調表示の指定を行ったユーザ数等)を併せて提供してもよい。これにより、強調表示されたコンテンツ60を配信されたユーザが強調表示の指定を行ったユーザに関する情報を容易に把握することができる。
なお、提供部37は、上記した各種情報を、例えば、強調表示されたコンテンツ60の一部をユーザが選択した場合や、かかるコンテンツ60の一部にカーソルを移動させた場合に表示(提供)する。
また、提供部37は、賛同する評価ボタンを押下したユーザ数に応じたランキングを提供してもよい。かかるランキングは、例えば、コンテンツ60へのリンク情報(例えば、URL)とともにニュース等のサービスにおけるタイムライン上に表示してもよい。これにより、他のユーザの賛同数または反対数が多い(または少ない)コンテンツ60を容易に把握することができる。
また、提供部37は、入力されたコメントに対する評価が高い(賛同が閾値以上)コメントを強調表示して提供してもよい。これにより、強調表示されたコンテンツ60の一部に対する他のユーザの主な意見を容易に把握することができる。
また、提供部37は、入力されたコメントを他のサービス(例えば、SNS等)に提供してもよい。これにより、強調表示されたコンテンツ60の一部に対するコメントを他のサービスにおいて共有することができる。
次に、図8を用いて、実施形態に係る情報処理装置1が実行する情報処理の処理手順について説明する。図8は、実施形態に係る情報処理装置1が実行する情報処理の処理手順を示すフローチャートである。
図8に示すように、制御部3は、コンテンツ60をユーザ端末50へ配信する(ステップS101)。つづいて、制御部3は、配信されたコンテンツ60の一部について強調表示の指定を受け付ける(ステップS102)。
つづいて、制御部3は、閲覧ユーザと類似するユーザにより強調表示の指定が行われたコンテンツ60の一部を強調表示し(ステップS103)、強調表示されたコンテンツ60の一部に対するユーザの反応を受け付ける(ステップS104)。そして、制御部3は、受け付けたユーザの反応に基づいた情報提供を行う(ステップS105)。
つづいて、制御部3は、強調部分63の情報とタイトルの情報とを含むコンテンツ関連情報を記憶部4から取得し(ステップS106)、取得したコンテンツ関連情報に基づいて、強調部分63の要点とタイトルとの乖離性を推定する(ステップS107)。そして、制御部3は、ステップS107で推定した乖離性を示す情報を提供し(ステップS108)、図8に示す処理を終了する。
〔その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図3に示した記憶部4の一部または全部は、各装置によって保持されるのではなく、ストレージサーバ等に保持されてもよい。この場合、各装置は、ストレージサーバにアクセスすることで、各種情報を取得する。
〔ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置1は、例えば図9に示すような構成のコンピュータ1000によって実現される。図9は、実施形態に係る情報処理装置1のハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000が情報処理装置1として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部3の機能を実現する。
〔効果〕
上述してきたように、実施形態に係る情報処理装置1は、取得部34と、推定部35とを備える。取得部34は、コンテンツ60のうちユーザの指定によって強調表示された部分の情報と、コンテンツ60のタイトルとを含むコンテンツ関連情報を取得する。推定部35は、取得部34によって取得されたコンテンツ関連情報に基づいて、強調表示された部分の要点とタイトルとの乖離性を推定する。これにより、情報処理装置1は、ユーザによって強調表示の指定がされた部分を用いてコンテンツ60の解析を行うことができる。
また、推定部35は、強調表示された部分の情報に基づいて、要点を特定する特定部38と、特定部38によって特定された要点に基づいて、乖離性を推定する推定処理部39とを備える。これにより、情報処理装置1は、ユーザによって強調表示の指定がされた部分を用いてコンテンツ60の解析を行うことができる。
また、特定部38は、強調表示された部分のうち特定ユーザが強調表示した部分を優先して用いて要点を特定する。これにより、情報処理装置1は、特定ユーザによって強調表示の指定がされた部分を用いてコンテンツ60の解析を行うことができる。
また、特定部38は、強調表示された部分のうち強調表示の指定をしたユーザの数が多い部分を優先して用いて要点を特定する。これにより、情報処理装置1は、多くのユーザによって強調表示の指定がされた部分を用いてコンテンツ60の解析を行うことができる。
また、特定部38は、強調表示された部分を要約して要点を特定する。これにより、情報処理装置1は、ユーザによって強調表示の指定がされた部分を用いてコンテンツ60の解析を精度よく行うことができる。
また、特定部38は、強調表示された部分の情報を入力とし、強調表示された部分を要約して要点を出力する学習モデルを用いて、要点を特定する。これにより、情報処理装置1は、ユーザによって強調表示の指定がされた部分を用いてコンテンツ60の解析を精度よく行うことができる。
また、情報処理装置1は、推定部35によって推定された乖離性の高さが予め定められた高さ以上である場合、タイトルの修正をコンテンツ60の提供者に対して提案する提案部36を備える。これにより、情報処理装置1は、ユーザによって強調表示の指定がされた部分を用いたコンテンツ60の解析結果に応じた提案を行うことができる。
また、情報処理装置1は、推定部35によって推定された乖離性の高さが予め定められた高さ以上である場合、乖離性に関する情報をコンテンツ60の提供者に対して提供する提供部37を備える。これにより、情報処理装置1は、ユーザによって強調表示の指定がされた部分を用いたコンテンツ60の解析結果を提供することができる。
また、取得部34は、強調表示の指定を行ったユーザの属性毎に、強調表示された部分の情報を取得し、推定部35は、属性毎の強調表示された部分の情報に基づいて、属性毎の乖離性を推定する。これにより、情報処理装置1は、ユーザによって強調表示の指定がされた部分を用いたコンテンツ60のより詳細の解析結果を提供することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」等に読み替えることができる。例えば、制御部3は、制御手段や制御回路に読み替えることができる。