JP2011053991A - 情報推薦装置及び方法及びプログラム - Google Patents

情報推薦装置及び方法及びプログラム Download PDF

Info

Publication number
JP2011053991A
JP2011053991A JP2009203169A JP2009203169A JP2011053991A JP 2011053991 A JP2011053991 A JP 2011053991A JP 2009203169 A JP2009203169 A JP 2009203169A JP 2009203169 A JP2009203169 A JP 2009203169A JP 2011053991 A JP2011053991 A JP 2011053991A
Authority
JP
Japan
Prior art keywords
message
recommendation
user
word
new message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009203169A
Other languages
English (en)
Other versions
JP5244745B2 (ja
Inventor
Yu Koya
優 甲谷
Toshiko Shiobara
寿子 塩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009203169A priority Critical patent/JP5244745B2/ja
Publication of JP2011053991A publication Critical patent/JP2011053991A/ja
Application granted granted Critical
Publication of JP5244745B2 publication Critical patent/JP5244745B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 インターネットを介したコミュニケーション・情報共有の場において、返信する可能性の高い新規メッセージを高精度に推薦する。
【解決手段】 本発明は、新規メッセージを取得し、指定されたユーザが返信した投稿記事の各構造から単語を抽出し、投稿記事の構造における各単語の統計量を算出し、投稿記事の構造に基づく推薦度に対する重みパラメータを設定し、投稿記事の構造における各単語の統計量と重みパラメータとを用いて、各新規メッセージの当該構造におけるユーザ毎の推薦度を算出し、該推薦度と当該構造における推薦度に対する重みパラメータの積の全構造の和を推薦スコアとして求め、格納する。ユーザIDが与えられると、推薦スコアを読み出し、当該ユーザに対する上位N件の推薦スコアの新規メッセージをメッセージ記憶手段から推薦メッセージとして選択する。
【選択図】 図1

Description

本発明は、情報推薦装置及び方法及びプログラムに係り、特に、ネットワーク上で提供されるユーザ間のコミュニケーションにおける、情報推薦装置及び方法及びプログラムに関する。
情報推薦の手法はいくつも提案されている。例えば、ユーザに評価をつけさせ、過去の評価履歴でユーザが評価している情報に含まれるテキストに着目する。そのテキストがユーザの興味を反映していると考え、そのテキストと同じような単語が出現している情報を推薦する手法が提案されている(例えば、非特許文献1参照)。
Mooney R. J. et al., "Content-Based Book Recommending Using Learning for Text Categorization", Proceedings of the 5th ACM Conference on Digital Libraries, ACM Press New York, 2000.
インターネットを介したコミュニケーション、例えば、メーリングリストや掲示板、チャット、ブログ、QAサイト、ソーシャルネットワーキングサービスなどにおいては、あるユーザがスレッドを作成し(スレッド内のメッセージ以後「新規メッセージ」と呼ぶ)、別のユーザが返信(以後「返信メッセージ」と呼ぶ)することにより情報交換が成り立っている。
しかしながら、返信メッセージがついておらず、情報交換の場として成立していないことが多い。そこで、1新規メッセージあたりの返信メッセージ数を増やすために、ユーザに興味のありそうな新規メッセージを推薦し返信を促す。
前述の非特許文献1に記載の手法では、ユーザの返信した新規メッセージのテキストを用いて、ユーザに新規メッセージを推薦するが、その際に新規メッセージの構造は一切考慮されていない。従って、高精度な新規メッセージの推薦を実現することができないという問題が生じる。
本発明は、上記の点に鑑みなされたもので、インターネットを介したコミュニケーション・情報共有の場において、ユーザの返信した新規メッセージの構造を考慮に基づき、返信する可能性の高い新規メッセージを高精度に推薦することで、ユーザに新規メッセージの返信を促すことが可能な情報推薦装置及び方法及びプログラムを提供することを目的とする。
図1は、本発明の原理構成図である。
本発明(請求項1)は、Bulletin Board System(BBS),Social Networking Service(SNS),Question/Answer(QA)サイトを含むインターネット上のコミュニケーション装置のうち、各メッセージがタイトルや本文、カテゴリの構造を持つメッセージにおいて、返信の対象となるメッセージを新規メッセージと呼ぶとき、ユーザが過去に返信した新規メッセージと、メッセージに含まれる単語の統計量を用いて各構造のテキストが類似した新規メッセージを、当該ユーザが返信する可能性の高いものとして発見するための情報推薦装置であって、
BBS,SNS、QAサイトを含むインターネット上のコミュニケーションにおける新規メッセージを取得してメッセージ記憶手段47に格納するするメッセージ取得手段41と、
メッセージ記憶手段から読み出した各新規メッセージの内、指定されたユーザが返信した投稿記事の各構造から単語を抽出する単語抽出手段42と、
投稿記事の構造における各単語の統計量を算出し、統計量記憶手段48に格納する統計量算出手段43と、
投稿記事の構造に基づく推薦度に対する重みパラメータを設定する重み設定手段45と、
統計量記憶手段48に格納されている投稿記事の構造における各単語の統計量と重みパラメータとを用いて、インターネット上のコミュニケーションにおける各新規メッセージの当該構造におけるユーザ毎の推薦度を算出し、該推薦度と当該構造における推薦度に対する重みパラメータの積の全構造の和を推薦スコアとして求める推薦スコア算出手段44と、
推薦スコアに基づいて、各新規メッセージの各ユーザに対する推薦スコアを決定し、推薦スコア記憶手段64に格納する推薦スコア決定手段46と、
ユーザIDが与えられると、推薦スコア記憶手段64から推薦スコアを読み出し、当該ユーザに対する推薦スコアが上位の所定の件数の新規メッセージをメッセージ記憶手段47から推薦メッセージとして選択する推薦メッセージ選択手段50と、を有する。
また、本発明(請求項2)は、請求項1の情報推薦装置において、
重み設定手段45は、
各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別とに基づいて、判別分析によって当該メッセージ構造における推薦度に対する重みパラメータの値を大きくする手段を含む。
また、本発明(請求項3)は、請求項1の情報推薦装置において、
重み設定手段45は、
各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別とに基づいて、ロジスティック回帰分析によって当該メッセージ構造における推薦度に対する重みパラメータの値を大きくする手段を含む。
また、本発明(請求項4)は、請求項1の情報推薦装置において、
統計量算出手段43は、
各単語の統計量を算出する際に、重要と見做される単語を抽出するためのTF値(単語の出現頻度)、TFIDF値(単語の出現頻度と逆出現頻度)を用いる。
図2は、本発明の原理を説明するための図である。
本発明(請求項5)は、BBS、SNS、QAサイトを含むインターネット上のコミュニケーション装置のうち、各メッセージがタイトルや本文、カテゴリの構造を持つメッセージにおいて、返信の対象となるメッセージを新規メッセージと呼ぶとき、ユーザが過去に返信した新規メッセージと、メッセージに含まれる単語の統計量を用いて各構造のテキストが類似した新規メッセージを、当該ユーザが返信する可能性の高いものとして発見するための情報推薦方法であって、
ユーザが返信する可能性の高い新規メッセージを提示するためのコンピュータは、
BBS,SNS、QAサイトを含むインターネット上のコミュニケーションにおける新規メッセージを取得してメッセージ記憶手段に格納するするメッセージ取得ステップ(ステップ1)と、
メッセージ記憶手段から読み出した各新規メッセージの内、指定されたユーザが返信した投稿記事の各構造から単語を抽出する単語抽出ステップ(ステップ2)と、
投稿記事の構造における各単語の統計量を算出し、統計量記憶手段に格納する統計量算出ステップ(ステップ3)と、
投稿記事の構造に基づく推薦度に対する重みパラメータを設定する重み設定ステップ(ステップ4)と、
統計量記憶手段に格納されている前記投稿記事の構造における各単語の統計量と前記重みパラメータとを用いて、インターネット上のコミュニケーションにおける各新規メッセージの当該構造におけるユーザ毎の推薦度を算出し、該推薦度と当該構造における推薦度に対する重みパラメータの積の全構造の和を推薦スコアとして求め、推薦スコアに基づいて、各新規メッセージの各ユーザに対する推薦スコアを決定し、推薦スコア記憶手段に格納する推薦スコア決定ステップ(ステップ5)と、
ユーザIDが与えられると、スコア記憶手段から推薦スコアを読み出し、当該ユーザに対する推薦スコアが上位の所定の件数の新規メッセージをメッセージ記憶手段から推薦メッセージとして選択する推薦メッセージ選択ステップ(ステップ6)。
また、本発明(請求項6)は、請求項4の情報推薦方法の重み設定ステップ(ステップ4)において、
各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別とに基づいて、判別分析によって当該メッセージ構造における推薦度に対する重みパラメータの値を大きくする。
また、本発明(請求項7)は、請求項4の情報推薦方法の重み設定ステップ(ステップ4)において、
各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別とに基づいて、ロジスティック回帰分析によって当該メッセージ構造における推薦度に対する重みパラメータの値を大きくする。
また、本発明(請求項8)は、請求項5の情報推薦方法の統計量算出ステップ(ステップ3)において、
各単語の統計量を算出する際に、重要と見做される単語を抽出するためのTF値(単語の出現頻度)、TFIDF値(単語の出現頻度と逆出現頻度)を用いる。
本発明(請求項9)は、請求項1乃至4のいずれか1項に記載の情報推薦装置を構成する各手段としてコンピュータを機能させるための情報推薦プログラムである。
上記のように本発明は、各ユーザの投稿した新規メッセージの構造(タイトルと本文)に着目し、構造毎にテキスト中に頻出する単語をユーザの興味として抽出する。興味は構造の数だけ得られる。その上で、同じように各構造にユーザの興味を多く含む新規メッセージをユーザに対して「返信する可能性が高い」ものとして推薦する。これにより、ユーザが返信した新規メッセージのタイトルと本文という構造からユーザの興味を取得することで、従来の技術では不可能であった、新規メッセージの高精度な推薦が可能になる。多くの新規メッセージつい返信がついていないコミュニティにおいて、従来の技術では十分な精度の推薦ができなかったが、本発明を適用することによって高精度に新規メッセージが推薦できるようになる。
本発明の原理構成図である。 本発明の原理を説明するための図である。 本発明の一実施の形態における情報推薦装置の構成図である。 本発明の一実施の形態におけるコミュニケーション情報テーブルの例である。 本発明の一実施の形態におけるタイトル興味情報テーブルの例である。 本発明の一実施の形態における本文興味情報テーブルの例である。 本発明の一実施の形態における推薦スコアテーブルの例である。 本発明の一実施の形態におけるメッセージ投稿時の処理のフローチャートである。 本発明の一実施の形態における図8のステップ120の詳細な処理のフローチャートである。 本発明の一実施の形態における図8のステップ130の詳細な処理のフローチャートである。 本発明の一実施の形態における推薦スコア更新時の処理のフローチャートである。 本発明の一実施の形態における推薦スコアテーブル更新部の構成図である。 本発明の一実施の形態における図11のステップ240の詳細な処理のフローチャートである。 本発明の一実施の形態におけるユーザログオン時の処理のフローチャートである。
以下、図面と共に本発明の実施の形態を説明する。
図3は、本発明の一実施の形態における情報推薦装置の構成を示す。
同図に示す情報推薦装置10は、コミュニケーション情報テーブル更新部10、タイトル興味情報テーブル更新部20、本文興味情報テーブル更新部30、推薦スコアテーブル更新部40、新規メッセージ推薦部50、記憶部60、通信部70、入出力部80から構成される。通信部70は、ネットワーク3と接続され、入出力部80は、外部装置4に接続される。
記憶部60は、ハードディスク装置等の記憶媒体であり、コミュニケーション情報テーブル61、タイトル興味情報テーブル62、本文興味情報テーブル63、推薦スコアテーブル64を格納する。
以下に、記憶部60内の各テーブルについて説明する。
<コミュニケーション情報テーブル>
コミュニケーション情報テーブル61は、図4に示すように、スレッドIDフィールド、メッセージIDフィールド、ユーザIDフィールド、メッセージ時刻フィールド、タイトルフィールド、本文フィールド、メッセージ種別フィールドの各項目を格納するテーブルである。
コミュニケーション情報テーブル61のスレッドIDフィールドは、コミュニケーションのスレッドを特定する識別子であり、各スレッドに対して一意に設定される。スレッドとは、1つの新規メッセージとそれに対する返信メッセージの集合である。スレッドIDは、メッセージmが新規であった場合は、他の新規メッセージと識別されるための新たなIDが、メッセージmが返信であった場合はどの新規メッセージ対する返信かを識別するためのIDが、それぞれコミュニケーション情報テーブル更新部10により設定される。
メッセージIDフィールドは、個々のメッセージmを特定する識別子が、コミュニケーション情報テーブル更新部10により設定される。
ユーザIDフィールドは、メッセージmを投稿したユーザを特定する識別子が、コミュニケーション情報テーブル更新部10により設定される。
メッセージ時刻フィールドは、メッセージmが投稿された時間が、コミュニケーション情報テーブル更新部10により設定される。
タイトルフィールドは、メッセージmのタイトルが、コミュニケーション情報テーブル更新部10により設定される。
本文フィールドは、メッセージmの本文が、コミュニケーション情報テーブル更新部10により設定される。
メッセージ種別フィールドは、メッセージmが新規か、他の新規メッセージに対する返信かが判定され、コミュニケーション情報テーブル更新部10により設定される。
<タイトル興味情報テーブル>
タイトル興味情報テーブル62は、図5に示すように、ユーザIDフィールド、単語フィールド、特徴量フィールドの各項目を格納するテーブルである。
ユーザIDフィールドは、メッセージmの投稿者uのユーザIDが、タイトル興味情報テーブル更新部20により設定される。
単語フィールドは、単語wが、タイトル興味情報テーブル20により設定される。
特徴量フィールドは、ユーザuの単語wに対する興味の強さをユーザuが返信した新規メッセージm'のタイトルから求めた尺度interest(u,w)であり、タイトル興味情報テーブル更新部20により設定される。
<本文興味情報テーブル>
本文興味情報テーブル63は、図6に示すように、ユーザIDフィールド、単語フィールド、特徴量フィールドの各項目を格納するテーブルである。
ユーザIDフィールドは、メッセージmの投稿者uのユーザIDが、本文興味情報テーブル更新部30により設定される。
単語フィールドは、単語wが本文興味情報テーブル更新部30により設定される。
特徴量フィールドは、ユーザuの単語wに対する興味の強さをユーザuが返信した新規メッセージm'の本文から求めた尺度interest(u,w)であり、本文興味情報テーブル更新部30により設定される。
<推薦スコアテーブル>
推薦スコアテーブル64は、図7に示すように、ユーザIDフィールド、スレッドIDフィールド、推薦スコアフィールドの各項目を格納するテーブルである。
推薦スコアフィールドは、ユーザuのスレッドaに対する推薦スコアscore(a,u)であり、推薦スコアテーブル更新部40により設定される。
最初に、上記の構成におけるメッセージ登校時の処理の流れを説明する。
図8は、本発明の一実施の形態におけるメッセージ投稿時の処理のフローチャートである。
ステップ110) コミュニケーション情報テーブル更新部10が、コミュニケーション情報テーブル61に、投稿したユーザ、投稿のあった時間、投稿されたメッセージ、投稿されたメッセージが新規メッセージか返信かに応じて、スレッドIDフィールド、メッセージIDフィールド、ユーザIDフィールド、メッセージ時刻フィールド、本文フィールド、メッセージ種別フィールドを設定し、行mとして挿入する。
ステップ120) タイトル興味情報テーブル更新部20が、上記行mの情報を元にタイトル興味情報テーブル62を更新する。
ステップ130) 本文興味情報テーブル更新部30が、上記行mの情報を元に本文興味情報テーブル63を更新する。
図5は、本発明の一実施の形態におけるコミュニケーション情報テーブルの例を示す。
次に、上記のステップ120の処理について詳細に説明する。
図9は、本発明の一実施の形態における図8のステップ120の詳細な処理のフローチャートである。
以下では、行mのユーザをu、スレッドIDをtとする。
ステップ121) タイトル興味情報テーブル更新部20が、コミュニケーション情報テーブル61を参照し、スレッドIDが行mのものと同じtである新規メッセージm'を取得する。
ステップ122) タイトル興味情報テーブル更新部20が、形態素解析器(図示せず)の分かち書き機能を用いて行m'のタイトルに含まれる単語集合Wを取得する。
ステップ123) タイトル興味情報テーブル更新部20が、上記単語集合Wに含まれる個々の単語wに対して、行m'のタイトルにおける統計量、例えば出現頻度(文献1:Manning, C. D. et al., "Introduction to information retrieval", 2008に記載のTF値)tf(m',w)を算出する。単語wの行m'のタイトルにおける統計量を算出するにあたって、出現頻度だけでなく、別の尺度(文献1のTFIDF値等)を用いても構わない。
ステップ124) タイトル興味情報テーブル更新部20が、タイトル興味情報テーブルを参照し、ユーザIDフィールドの値がu、単語フィールドの値がwの行の特徴量フィールドの値interest(u,w)を取得する。また、ユーザIDフィールドの値がu、単語フィールドの値がwの行が存在しない場合はinterest(u,w)の値は0とする。
ステップ125) タイトル興味情報テーブル更新部20が、タイトル興味情報テーブルに、ユーザIDフィールドの値がu、単語フィールドの値がwの行の特徴量フィールドの値をinterest(u,w)+tf(m',w)とするように更新または挿入する。
次に、上記のステップ130の処理について詳細に説明する。
図10は、本発明の一実施の形態における図8のステップ130の詳細な処理のフローチャートを示す。
ステップ131) 本文興味情報テーブル更新部30が、コミュニケーション情報テーブル61を参照し、スレッドIDが行mのものと同じtである新規メッセージm'を取得する。
ステップ132) 本文興味情報テーブル更新部30が、形態素解析器(図示せず)の分かち書き機能を用いて行m'の本文に含まれル単語集合Wを取得する。
ステップ133) 本文興味情報テーブル更新部30が、上記単語集合Wに含まれる個々の単語wに対して、行m'の本文における統計量、例えば出現頻度(文献1に記載のTF値)tf(m',w)を算出する。なお、単語wの行m'の本文における統計量を算出するにあたって、出現頻度だけでなく、別の尺度(文献1のTFIDF値等)を用いても構わない。
ステップ134) 本文興味情報テーブル更新部30が、本文興味情報テーブル63を参照し、ユーザIDフィールドの値がu、単語フィールドの値がwの行の特徴量フィールドの値interest(u,w)を取得する。また、ユーザIDフィールドの値がu、単語フィールドの値がwの行が存在しない場合はinterest(u,w)の値は0とする。
ステップ135) 本文興味情報テーブル更新部30が、本文興味情報テーブル63に、ユーザIDフィールドの値がu、単語フィールドの値がwの行の特徴量フィールドの値をinterest(u,w)+tf(m',w)とするように更新または挿入する。
次に、推薦スコア更新時の処理を説明する。
図11は、本発明の一実施の形態における推薦スコア更新時の処理のフローチャートである。
ステップ210) 推薦スコアテーブル更新部40が、コミュニケーション情報テーブル61を参照し、全ユーザID集合Uを取得する。
ステップ220) 推薦スコアテーブル更新部40が、上記ユーザID集合Uに含まれる各ユーザuに対して、タイトル興味情報テーブル62を参照し、ユーザIDフィールドの値がuの行集合Tを取得する。
ステップ230) 推薦スコアテーブル更新部40が、上記ユーザID集合Uに含まれる各ユーザuに対して、本文興味情報テーブル63を参照し、ユーザIDフィールドの値がuの行集合Bを取得する。
ステップ240) 推薦スコアテーブル更新部40が、上記行集合Tと上記行集合Bを用いて推薦スコアテーブル64を更新する。
次に、上記の推薦スコアテーブル更新部40について説明する。
図12は、本発明の一実施の形態における推薦スコアテーブル更新部の構成を示す。
同図に示す推薦スコアタテーブル更新部40は、新規メッセージ取得部41、単語抽出部42、統計量算出部43、推薦スコア算出部44、重みパラメータ設定部45、推薦スコア決定部46から構成される。
新規メッセージ取得部41は、コミュニケーション情報テーブル61から当該ユーザのユーザID以外のユーザIDが付与されている新規メッセージを取得してメモリ(図示せず)に格納する。
単語抽出部42は、メモリ(図示せず)から新規メッセージ取得部41で取得した新規メッセージを読み出して、タイトルと本文から単語を抽出する。
統計量算出部43は、単語抽出部42で抽出された単語について、出現頻度などの統計量を算出し、メモリ(図示せず)に格納する。
重みパラメータ設定部43は、入力装置(図示せず)を介して直接重みパラメータを入力する、または、各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別と、に基づいて、判別分析やロジスティック回帰分析等を用いて設定してもよい。
推薦スコア算出部44は、メモリ(図示せず)に格納されている統計量算出部43で算出された各単語の統計量と重みパラメータ設定部43で設定された重みパラメータの積の全構造の和を求め、推薦スコアを算出する。
推薦スコア決定部46は、各新規メッセージの各ユーザに対する推薦スコアを推薦スコアテーブル64に格納する。
次に、ステップ240の詳細な処理について説明する。
図13は、本発明の一実施の形態における図11のステップ240の詳細な処理のフローチャートである。以下では、推薦スコアはユーザuと新規メッセージの組み合わせ毎に算出される。
ステップ241) 推薦スコアテーブル更新部40の新規メッセージ取得部41が、コミュニケーション情報テーブル61を参照し、ユーザuによる投稿でない新規メッセージ集合Aを取得し、メモリ(図示せず)に格納する。
ステップ242) 推薦スコアテーブル更新部の単語抽出部42が、形態素解析器(図示せず)の分かち書き機能を用いて、メモリ(図示せず)に格納されている上記新規メッセージ集合Aの各メッセージaのタイトル、本文に含まれる単語集合をそれぞれW(i=1,2)取得し、メモリ(図示せず)に格納する。
ステップ243) 推薦スコアテーブル更新部40の統計量算出部43が、上記のメモリ(図示せず)に格納されている単語集合W(i=1,2)に含まれる個々の単語wに対して、上記メッセージaのタイトルもしくは本文における統計量、例えば、出現頻度(例えば、文献1のTF値)tf(m,w)を算出し、メモリ(図示せず)に格納する。単語wの行mのタイトル、もしくは本文における統計量を算出するにあたって、出現頻度だけでなく、別の尺度(例えば、文献1のTFID値等)を用いてもよい。
ステップ244) 推薦スコアテーブル更新部40の推薦スコア算出部44が、i=1の場合はタイトル興味情報テーブル62記載のユーザuに関する行集合Tから、i=2の場合は本文興味情報テーブル記載のユーザuに関する行集合Bから、単語wの行の特徴量フィールドの値interesti(u,w)を取得する。但し、単語wの行が存在しない場合は、interesti(u,w)の値は0とする。
ステップ245) 推薦スコアテーブル更新部40の推薦スコア算出部44が、統計量が格納されているメモリ(図示せず)から統計量tf(a,w),及び、重みパラメータ設定部45により設定されている重みパラメータλ、λを取得し、上記メッセージaのユーザuに対する推薦スコアscorei(a,u)を以下の式を用いて算出する。
Figure 2011053991
ステップ246) 推薦スコアテーブル更新部40の推薦スコア決定部46が、推薦スコアテーブル64にユーザIDフィールドの値がu、スレッドIDフィールドの値がaのもの、推薦スコアフィールドの値がλ・score(a,u)+λ・score(a,u)である行を推薦スコアテーブル64に挿入する。
但し、λ、λは、重みパラメータ設定部45で設定される重みパラメータで、0以上の小数であり、人手によって設定してもよい。各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別と、に基づいて、判別分析やロジスティック回帰分析等を用いて設定してもよい。また、重みパラメータλ、λは、メモリ等の記録部に記録してもよいし、推薦スコア更新時の度に設定し直してもよい。
次に、ユーザログオン時の処理を説明する。
図14は、本発明の一実施の形態におけるユーザログオン時の処理のフローチャートである。
ステップ310) 新規メッセージ推薦部50が、推薦スコアテーブル64を参照し、ユーザuの推薦スコア集合Sを取得する。
ステップ320) 新規メッセージ推薦部50が、上記推薦スコア集合Sの各行の推薦スコアの値を用いてユーザuに推薦すべき新規メッセージを決定する。その際、推薦スコアフィードの値が大きいものから順にN(N=1,2,5,10,…)件を推薦すべき新規メッセージとしてもよいし、推薦スコアに対しある閾値を設けて、Sの中で推薦スコアフィールドの値がその閾値を超えるものを推薦すべき新規メッセージとしてもよい。
また、上記の情報推薦装置の構成要素の動作をプログラムとして構築し、情報推薦装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、BBS, SNS,QAサイトを含むインターネット上でのコミュニケーションを行うコミュニケーションシステムに適用可能である。
1 情報推薦装置
2 外部端末
3 ネットワーク
4 外部装置
10 コミュニケーション情報テーブル更新部
20 タイトル興味情報テーブル更新部
30 本文興味情報テーブル更新部
40 推薦スコアテーブル更新部
41 メッセージ取得手段、新規メッセージ取得部
42 単語抽出手段、単語抽出部
43 統計量算出手段、統計量算出部
44 推薦スコア算出手段、推薦スコア算出部
45 重み設定手段、重みパラメータ設定部
46 推薦スコア決定手段、推薦スコア決定部
47 メッセージ記憶手段
48 統計量記憶手段
50 新規メッセージ推薦部
60 記憶部
61 コミュニケーション情報テーブル
62 タイトル興味情報テーブル
63 本文興味情報テーブル
64 推薦スコア記憶手段、推薦スコアテーブル
70 通信部70
80 入出力部

Claims (9)

  1. Bulletin Board System(BBS),Social Networking Service(SNS),Question/Answer(QA)サイトを含むインターネット上のコミュニケーション装置のうち、各メッセージがタイトルや本文、カテゴリの構造を持つメッセージにおいて、返信の対象となるメッセージを新規メッセージと呼ぶとき、ユーザが過去に返信した新規メッセージと、メッセージに含まれる単語の統計量を用いて各構造のテキストが類似した新規メッセージを、当該ユーザが返信する可能性の高いものとして発見するための情報推薦装置であって、
    BBS,SNS、QAサイトを含むインターネット上のコミュニケーションにおける新規メッセージを取得してメッセージ記憶手段に格納するするメッセージ取得手段と、
    メッセージ記憶手段から読み出した各新規メッセージの内、指定されたユーザが返信した投稿記事の各構造から単語を抽出する単語抽出手段と、
    前記投稿記事の構造における各単語の統計量を算出し、統計量記憶手段に格納する統計量算出手段と、
    前記投稿記事の構造に基づく推薦度に対する重みパラメータを設定する重み設定手段と、
    前記統計量記憶手段に格納されている前記投稿記事の構造における各単語の統計量と前記重みパラメータとを用いて、インターネット上のコミュニケーションにおける各新規メッセージの当該構造におけるユーザ毎の推薦度を算出し、該推薦度と当該構造における推薦度に対する重みパラメータの積の全構造の和を推薦スコアとして求める推薦スコア算出手段と、
    前記推薦スコアに基づいて、各新規メッセージの各ユーザに対する推薦スコアを決定し、推薦スコア記憶手段に格納する推薦スコア決定手段と、
    ユーザIDが与えられると、前記スコア記憶手段から推薦スコアを読み出し、当該ユーザに対する推薦スコアが上位の所定の件数の新規メッセージをメッセージ記憶手段から推薦メッセージとして選択する推薦メッセージ選択手段と、
    を有することを特徴とする情報推薦装置。
  2. 前記重み設定手段は、
    各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別とに基づいて、判別分析によって当該メッセージ構造における推薦度に対する重みパラメータの値を大きくする手段を含む
    請求項1記載の情報推薦装置。
  3. 前記重み設定手段は、
    各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別とに基づいて、ロジスティック回帰分析によって当該メッセージ構造における推薦度に対する重みパラメータの値を大きくする手段を含む
    請求項1記載の情報推薦装置。
  4. 前記統計量算出手段は、
    前記各単語の統計量を算出する際に、重要と見做される単語を抽出するためのTF値(単語の出現頻度)、TFIDF値(単語の出現頻度と逆出現頻度)を用いる
    請求項1記載の情報推薦装置。
  5. Bulletin Board System(BBS),Social Networking Service(SNS),Question/Answer(QA)サイトを含むインターネット上のコミュニケーション装置のうち、各メッセージがタイトルや本文、カテゴリの構造を持つメッセージにおいて、返信の対象となるメッセージを新規メッセージと呼ぶとき、ユーザが過去に返信した新規メッセージと、メッセージに含まれる単語の統計量を用いて各構造のテキストが類似した新規メッセージを、当該ユーザが返信する可能性の高いものとして発見するための情報推薦方法であって、
    ユーザが返信する可能性の高い新規メッセージを提示するためのコンピュータは、
    BBS,SNS、QAサイトを含むインターネット上のコミュニケーションにおける新規メッセージを取得してメッセージ記憶手段に格納するするメッセージ取得ステップと、
    前記メッセージ記憶手段から読み出した各新規メッセージの内、指定されたユーザが返信した投稿記事の各構造から単語を抽出する単語抽出ステップと、
    前記投稿記事の構造における各単語の統計量を算出し、統計量記憶手段に格納する統計量算出ステップと、
    前記投稿記事の構造に基づく推薦度に対する重みパラメータを設定する重み設定ステップと、
    前記統計量記憶手段に格納されている前記投稿記事の構造における各単語の統計量と前記重みパラメータとを用いて、インターネット上のコミュニケーションにおける各新規メッセージの当該構造におけるユーザ毎の推薦度を算出し、該推薦度と当該構造における推薦度に対する重みパラメータの積の全構造の和を推薦スコアとして求める推薦スコア算出ステップと、
    前記推薦スコアに基づいて、各新規メッセージの各ユーザに対する推薦スコアを決定し、推薦スコア記憶手段に格納する推薦スコア決定ステップと、
    ユーザIDが与えられると、前記スコア記憶手段から推薦スコアを読み出し、当該ユーザに対する推薦スコアが上位の所定の件数の新規メッセージをメッセージ記憶手段から推薦メッセージとして選択する推薦メッセージ選択ステップと、
    を行うことを特徴とする情報推薦方法。
  6. 前記重み設定ステップにおいて、
    各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別とに基づいて、判別分析によって当該メッセージ構造における推薦度に対する重みパラメータの値を大きくする
    請求項5記載の情報推薦方法。
  7. 前記重み設定ステップにおいて、
    各ユーザの各新規メッセージのメッセージ構造に基づく推薦度と、当該ユーザが当該新規メッセージに返信したことがあるかないかのメッセージ種別とに基づいて、ロジスティック回帰分析によって当該メッセージ構造における推薦度に対する重みパラメータの値を大きくする
    請求項5記載の情報推薦方法。
  8. 前記統計量算出ステップにおいて、
    前記各単語の統計量を算出する際に、重要と見做される単語を抽出するためのTF値(単語の出現頻度)、TFIDF値(単語の出現頻度と逆出現頻度)を用いる
    請求項5記載の情報推薦方法。
  9. 請求項1乃至4のいずれか1項に記載の情報推薦装置を構成する各手段としてコンピュータを機能させるための情報推薦プログラム。
JP2009203169A 2009-09-02 2009-09-02 情報推薦装置及び方法及びプログラム Active JP5244745B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009203169A JP5244745B2 (ja) 2009-09-02 2009-09-02 情報推薦装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009203169A JP5244745B2 (ja) 2009-09-02 2009-09-02 情報推薦装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2011053991A true JP2011053991A (ja) 2011-03-17
JP5244745B2 JP5244745B2 (ja) 2013-07-24

Family

ID=43942913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009203169A Active JP5244745B2 (ja) 2009-09-02 2009-09-02 情報推薦装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5244745B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208033A (zh) * 2015-10-08 2015-12-30 华中科技大学 一种基于智能终端情景的群体辅助推荐方法及系统
CN112541796A (zh) * 2019-09-23 2021-03-23 北京轻享科技有限公司 一种车辆信息的处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256464A (ja) * 2002-03-01 2003-09-12 Osaka Gas Co Ltd 新着投稿情報表示装置
JP2005346494A (ja) * 2004-06-03 2005-12-15 Sony Corp コンテンツ共有システム及びコンテンツ重要度判定方法
JP2006094018A (ja) * 2004-09-22 2006-04-06 Sharp Corp 番組推薦装置、番組推薦方法、プログラムおよびそのプログラムを記録した記録媒体
JP2008234069A (ja) * 2007-03-16 2008-10-02 Fujitsu Ltd 電子掲示板制御プログラム、該装置、及び該制御方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256464A (ja) * 2002-03-01 2003-09-12 Osaka Gas Co Ltd 新着投稿情報表示装置
JP2005346494A (ja) * 2004-06-03 2005-12-15 Sony Corp コンテンツ共有システム及びコンテンツ重要度判定方法
JP2006094018A (ja) * 2004-09-22 2006-04-06 Sharp Corp 番組推薦装置、番組推薦方法、プログラムおよびそのプログラムを記録した記録媒体
JP2008234069A (ja) * 2007-03-16 2008-10-02 Fujitsu Ltd 電子掲示板制御プログラム、該装置、及び該制御方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200700420010; 深谷雅志: '電子掲示板における行動履歴を用いたユーザにとって興味あるスレッドの推薦手法' 電子情報通信学会技術研究報告 Vol.106,No.410, 20061130, pp.149-154, 社団法人電子情報通信学会 *
JPN6013001644; 深谷雅志: '電子掲示板における行動履歴を用いたユーザにとって興味あるスレッドの推薦手法' 電子情報通信学会技術研究報告 Vol.106,No.410, 20061130, pp.149-154, 社団法人電子情報通信学会 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208033A (zh) * 2015-10-08 2015-12-30 华中科技大学 一种基于智能终端情景的群体辅助推荐方法及系统
CN105208033B (zh) * 2015-10-08 2018-03-27 华中科技大学 一种基于智能终端情景的群体辅助推荐方法及系统
CN112541796A (zh) * 2019-09-23 2021-03-23 北京轻享科技有限公司 一种车辆信息的处理方法及装置

Also Published As

Publication number Publication date
JP5244745B2 (ja) 2013-07-24

Similar Documents

Publication Publication Date Title
Tenopir et al. Trustworthiness and authority of scholarly information in a digital age: Results of an international questionnaire
JP6092204B2 (ja) ソーシャルネットワーキングシステムにおけるユーザのコネクションのクラスタ化
CA2755577C (en) System and method of selecting a relevant user for introduction to a user in an online environment
US8631122B2 (en) Determining demographics based on user interaction
CN105468598B (zh) 好友推荐方法及装置
KR102347083B1 (ko) 소셜 미디어를 이용하는 사용자의 통계를 추정하는 방법 및 장치
Zhang et al. From social media with news: Journalists’ social media use for sourcing and verification
KR100952391B1 (ko) 인터넷 네트워크에서 콘텐츠의 평가에 따른 가치 분석시스템, 방법 및 이를 구현할 수 있는 컴퓨터로 읽을 수있는 기록 매체
CN110110201B (zh) 一种内容推荐方法和系统
EP3061018A1 (en) Systems and methods for dynamically determining influencers in a social data network using weighted analysis
CN106789598B (zh) 基于社交关系链的公众号消息推送方法、装置及系统
US20090024621A1 (en) Method to set up online book collections and facilitate social interactions on books
CN107808346B (zh) 一种潜在目标对象的评估方法及评估装置
US9870579B2 (en) Managing shareable content in a social network
US10504191B2 (en) Engagement-based selection of content for member segments of social networks
US20160335360A1 (en) System and method for determining suitable network paths
US20190333176A1 (en) Recording recommendation method, device, apparatus and computer-readable storage medium
Schecter et al. The power, accuracy, and precision of the relational event model
JP2011053992A (ja) 質問推薦装置及び方法及びプログラム
CN101944125A (zh) 网络交友用户推荐系统及方法
JP5244745B2 (ja) 情報推薦装置及び方法及びプログラム
Serov et al. An experimental approach to reputation in e-participation
CN112307297A (zh) 一种基于优先级规则的用户标识统一方法及系统
Bruce Bayesian nonparametric dynamic methods: Applications to linear and nonlinear advertising models
JP2011186855A (ja) 質問推薦装置及び方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350