JP7212600B2

JP7212600B2 - 情報提供システム

Info

Publication number: JP7212600B2
Application number: JP2019171383A
Authority: JP
Inventors: 知憲石原; 将之秦; 理恵角田
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2019-09-20
Filing date: 2019-09-20
Publication date: 2023-01-25
Anticipated expiration: 2039-09-20
Also published as: JP2021047785A

Description

本開示の一側面は情報提供システムに関する。

コンピュータ上での処理のために用いられるキーワードをユーザに提案する手法が知られている。例えば、特許文献１には、ネットワークに接続された利用者の端末がコンテンツにアクセスする場合に利用するキーワードを管理するキーワード管理システムが記載されている。このシステムは、キーワードの単位時間当たりの増加値を示すバースト値を算出し、該バースト値に対応するキーワードのコンテンツ上の特徴を基にしてバースト値を補正した総合バースト値を算出し、該総合バースト値に対応するキーワードに関連する関連キーワードをコンテンツから抽出し、キーワードと関連キーワードとを対応付けて利用者の端末に出力する。

国際公開第２００８／０８７７２８号

ユーザによって用いられる蓋然性が高いキーワードをより高い精度で該ユーザに提示することができれば、より便宜である。そこで、そのようなキーワードの提示をより高い精度で行う仕組みが望まれている。

本開示の一側面に係る情報提供システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、情報源におけるキーワード群から第１ユーザによって選択されたキーワードと、該キーワードが属するジャンルと、該ジャンルにおける第１ユーザのクラスタとの間の対応関係を示す被選択キーワード情報を記憶するデータベースを参照し、ジャンルおよびクラスタの組合せに対応する複数のキーワードのそれぞれについて該キーワードの選択回数を算出し、複数のキーワードのそれぞれについて、該キーワードの選択回数と情報源での該キーワードの出現頻度とに少なくとも基づいてスコアを算出し、複数のキーワードに対応する複数のスコアに基づいて、クラスタに属する第２ユーザに提示する１以上のキーワードを該複数のキーワードから選択し、選択された１以上のキーワードを含むキーワードリストを第２ユーザの端末上に表示させる。

このような側面においては、第１ユーザによって選択されたキーワードと、該キーワードのジャンルと、該第１ユーザのクラスタとの対応関係に基づいて、個々のキーワードの選択回数が算出される。そして、個々のキーワードについてその選択回数と情報源での出現頻度とに基づくスコアが算出され、そのスコアに基づいて、第２ユーザに提示する１以上のキーワードが選択される。このように、他のユーザ（第１ユーザ）による選択と情報源での出現頻度との双方を考慮してキーワードを選択することで、ユーザ（第２ユーザ）によって用いられる蓋然性が高いキーワードを精度良く提供することが可能になる。

本開示の一側面によれば、ユーザによって用いられる蓋然性が高いキーワードを精度良く提供することができる。

実施形態に係る情報提供システムの利用の一例を示す図である。実施形態に係る情報提供システムの構成の一例を示す図である。実施形態に係る情報提供システムの動作の一例を示すフローチャートである。第１候補キーワードを抽出する処理の一例を示すフローチャートである。キーワード辞書の一例を示す図である。第１候補キーワードを抽出するための中間レコードの一例を示す図である。閲覧者のクラスタリングの一例を示す図である。第１候補キーワードを抽出するための中間レコードの一例を示す図である。第２候補キーワードを抽出する処理の一例を示すフローチャートである。第２候補キーワードを抽出するための作業用レコードの一例を示す図である。第２候補キーワードのスコアリングの一例を示す図である。実施形態に係る情報提供システムで用いられるコンピュータのハードウェア構成の一例を示す図である。

以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。

実施形態に係る情報提供システム１は、コンピュータ上での処理のために用いられるキーワードを対象ユーザに提案するコンピュータシステムである。情報提供システム１は１以上のキーワードを対象ユーザのユーザ端末に送信することで該ユーザ端末上にそのキーワードを表示させ、これにより対象ユーザは提案されたキーワードを用いることができる。対象ユーザとは、キーワードを提供する宛先になるユーザのことをいう。

キーワードの目的および利用方法は限定されない。一例では、情報提供システム１は情報の検索に用いられるキーワードを提案してもよい。図１は情報提供システム１の利用の一例を示す図である。この例では、ユーザ端末２０はニュースなどの様々な情報を表示するニュース・アプリケーション・プログラムを実行しており、複数の記事２０１と、複数のキーワードから成るキーワードリスト２０２とを表示している。対象ユーザはそのキーワードリストから好みのキーワードを選択および登録することで、そのキーワードに対応する記事を検索して該記事をユーザ端末２０上に表示させることができる。

一例では、情報提供システム１は２種類の手法を用いてキーワードを選択し、それぞれの手法によって得られたキーワードの混合をキーワードリストとしてユーザ端末２０に提供する。第１の手法は、対象ユーザを含む複数の閲覧者が第１情報源から提供される第１コンテンツにアクセスしたことを示す閲覧履歴に基づいて少なくとも一つの第１キーワードを選択する手法である。第２の手法は、第１情報源とは異なる第２情報源から提供される第２コンテンツでのキーワードの出現頻度（端的にいうと、第２情報源でのキーワードの出現頻度）に少なくとも基づいて少なくとも一つの第２キーワードを選択する手法である。図１に示すキーワードリスト２０２は、少なくとも一つの第１キーワードと少なくとも一つの第２キーワードとによって構成される。

第１キーワードは対象ユーザが第１コンテンツを閲覧する傾向に基づいて提示されるキーワードであり、したがって、対象ユーザの関心が高いと推定されるキーワードであるといえる。一方、第２キーワードは世間での話題性に基づいて推定されるキーワードであり、したがって、他の人々と同様に対象ユーザが関心を持つ見込みが高いと推定されるキーワードであるといえる。このような２種類のキーワードをキーワードリストに含めることで、キーワードの選択の幅を効果的に拡げることができる。その結果、対象ユーザによって用いられる蓋然性が高いキーワードを精度良く提供することが可能になる。

図２は情報提供システム１の構成の一例を示す図である。情報提供システム１は、キーワードを対象ユーザに提供するコンピュータであるサーバ１０を備える。サーバ１０は通信ネットワークを介してユーザ端末２０とデータ通信を実行することができる。図２ではユーザ端末２０を一つのみ示すが、サーバ１０とデータ通信するユーザ端末２０の個数は何ら限定されず、サーバ１０は複数のユーザ端末２０と通信接続してもよい。さらに、サーバ１０は通信ネットワークを介してデータベース群３０にアクセスすることができる。通信ネットワークの構成は限定されず、任意の方針で設計されてよい。例えば、それぞれの通信ネットワークは移動体通信網、インターネット、イントラネット、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）のうちの少なくとも一つを含んで構成されてもよい。

サーバ１０は機能要素として閲覧履歴解析部１１、スコアリング部１２、受付部１３、第１選択部１４、第２選択部１５、リスト生成部１６、および送信部１７を備える。閲覧履歴解析部１１は、対象ユーザを含む複数の閲覧者が第１情報源から提供される第１コンテンツにアクセスしたことを示す閲覧履歴を解析して第１候補キーワードを抽出する機能要素である。第１候補キーワードとは、第１キーワードの候補となる語句のことをいう。スコアリング部１２は、第２情報源におけるキーワードに対してスコアリングを実行することで第２候補キーワードを抽出する機能要素である。第２候補キーワードとは、第２キーワードの候補となる語句のことをいう。受付部１３はキーワードを提供せよとの指示を受け付ける機能要素である。第１選択部１４は少なくとも一つの第１キーワードを選択する機能要素である。第２選択部１５は少なくとも一つの第２キーワードを選択する機能要素である。リスト生成部１６は少なくとも一つの第１キーワードと少なくとも一つの第２キーワードとを含むキーワードリストを生成する機能要素である。送信部１７はそのキーワードリストをユーザ端末２０に送信する機能要素であり、これによりキーワードがユーザ端末２０上に表示される。

サーバ１０は少なくとも一つのコンピュータを用いて構成される。複数のコンピュータが用いられる場合には、これらのコンピュータが通信ネットワークを介して相互に接続することで、論理的に一つのサーバ１０が構築される。

ユーザ端末２０は、対象ユーザによって操作されるコンピュータである。ユーザ端末２０の種類は限定されない。例えば、ユーザ端末２０は、携帯電話機、高機能携帯電話機（スマートフォン）、タブレット端末、ウェアラブル端末（例えば、スマートウォッチ、ヘッドマウントディスプレイ（ＨＭＤ）など）、ラップトップなどの携帯端末でもよい。あるいは、ユーザ端末２０は据置型のパーソナルコンピュータでもよい。

データベース群３０は、情報提供システム１において必要なデータを記憶するデータベースの集合である。本実施形態では、データベース群３０は閲覧履歴データベース３１、第１コンテンツデータベース３２、第１候補キーワードデータベース３３、メタ情報データベース３４、ユーザデータベース３５、および第２候補キーワードデータベース３６を含む。

閲覧履歴データベース３１は、対象ユーザを含む複数の閲覧者が第１情報源から提供される第１コンテンツにアクセスしたことを示す閲覧履歴を記憶する非一時的な記憶媒体または記憶装置である。一例では、閲覧履歴の個々のレコードはユーザＩＤ、コンテンツＩＤ、コンテンツ日時、および操作種別を含む。ユーザＩＤは、第１コンテンツにアクセスしたユーザ（すなわち閲覧者）を一意に特定する識別子である。コンテンツＩＤは個々の第１コンテンツを一意に特定する識別子である。コンテンツ日時は第１コンテンツが生成または公開された日時である。操作種別は、第１コンテンツに対するユーザ（閲覧者）の操作の種類を示す。例えば、操作種別は、ユーザが特定の第１コンテンツをユーザ端末２０上で見たことを示す「閲覧」、ユーザが特定の第１コンテンツ中に存在するリンクをクリックしたことを示す「クリック」などの様々な操作を示し得る。

第１情報源の種類は限定されず、これに対応して、第１コンテンツの種類も限定されない。例えば、第１情報源は通信ネットワークを介して任意の端末または装置に情報を提供する情報サービスまたは情報発信者でもよい。一例では、第１情報源は、キーワードリストを表示する機能を有するアプリケーション・プログラムのために第１コンテンツを提供する情報サービスまたは情報発信者でもよい。図１の例では、第１情報源は、ニュース・アプリケーション・プログラムのために第１コンテンツを提供する情報発信者または情報サービスでもよい。あるいは、第１情報源は、キーワードリストを表示する機能を有するアプリケーション・プログラムとは独立した別のアプリケーション・プログラムのために第１コンテンツを提供する情報発信者または情報サービスであってもよい。第１コンテンツは可視要素を含んで構成され、例えば、テキスト、画像（静止画または動画）、またはそれらの組合せを含んで構成される。第１コンテンツは個人または法人によって作成された記事であってもよく、例えば、新聞、雑誌、オンライン・ニュース、ブログ、ソーシャル・ネットワーキング・サービス（ＳＮＳ）などによって提供される記事でもよい。記事とは事柄を伝えるための文章のことをいう。記事は少なくとも文字列を含み、画像（静止画または動画）をさらに含んでもよい。

閲覧履歴はアクセス管理システムによって生成されて閲覧履歴データベース３１に格納される。アクセス管理システムの構成は限定されない。例えば、情報提供システム１がアクセス管理システムとしての機能を有してもよい。あるいは、情報提供システム１とは異なるコンピュータシステムがアクセス管理システムとして機能してもよい。アクセス管理システムは、１以上のユーザ端末２０からの第１コンテンツへのアクセスを監視し、その監視結果に基づいて閲覧履歴のレコードを生成し、そのレコードを閲覧履歴データベース３１に格納する。個々の第１コンテンツに対する個々のアクセスが監視されることで、閲覧履歴データベース３１に閲覧履歴が蓄積される。

第１コンテンツデータベース３２は第１コンテンツを記憶する非一時的な記憶媒体または記憶装置である。それぞれの第１コンテンツはコンテンツＩＤと関連付けられる。

第１候補キーワードデータベース３３は、閲覧履歴に基づいて抽出された第１候補キーワードに関する第１候補キーワード情報を記憶する非一時的な記憶媒体または記憶装置である。一例では、第１候補キーワード情報の個々のレコードはジャンルＩＤと、クラスタＩＤと、１以上の第１候補キーワードに関する第１特徴ベクトルとを含む。ジャンルＩＤは、コンテンツの分類または種別であるジャンルを一意に特定するための識別子である。クラスタＩＤは、ユーザが属するクラスタを一意に特定するための識別子である。個々のユーザのクラスタは、データの集合を複数のクラスタ（部分集合）に分類する処理であるクラスタリングによって決定される。クラスタリングの詳細は後述する。第１特徴ベクトルは、第１候補キーワードとスコアとの組合せによって表現される成分を１以上含んで構成される。この第１特徴ベクトルの詳細も後述する。

メタ情報データベース３４は、第２情報源から提供される第２コンテンツでのキーワードの出現頻度を示すメタ情報を永続的に記憶する非一時的な記憶媒体または記憶装置である。一例では、メタ情報の個々のレコードはキーワードと、時間帯と、該時間帯での該キーワードの出現頻度とを含む。キーワードは、第２コンテンツ上に現われた語句である。出現頻度は、キーワードが１以上の第２コンテンツ上に現われた程度を示す指標である。出現頻度を管理するための時間帯の長さは限定されず、例えば、３０分、１時間、３時間、２４時間（１日）などの任意の値に設定されてよい。

第２情報源の種類は限定されず、これに対応して、第２コンテンツの種類も限定されない。ただし、第２情報源は第１情報源と異なる。例えば、第２情報源は通信ネットワークまたは放送ネットワークを介して任意の端末または装置に情報を提供することができる情報サービスまたは情報発信者でもよい。一例では、第２情報源は放送ネットワークまたは通信ネットワークを介してテレビ番組またはラジオ番組を放送する放送局でもよいし、インターネットを介して記事を提供する発信者でもよい。第２コンテンツは可視要素を含んで構成され、例えば、テキスト、画像（静止画または動画）、またはそれらの組合せを含んで構成される。第２コンテンツは個人または法人によって作成されたテレビ番組、ラジオ番組、または記事であってもよい。

メタ情報はメタ情報管理システムによって生成されてメタ情報データベース３４に格納される。メタ情報管理システムの構成は限定されない。例えば、情報提供システム１がメタ情報管理システムとしての機能を有してもよい。あるいは、情報提供システム１とは異なるコンピュータシステムがメタ情報管理システムとして機能してもよい。メタ情報管理システムは、それぞれの時間帯において、放送または配信された第２コンテンツのそれぞれを解析することで、それぞれの第２コンテンツ中にテキスト、画像、または音声によって表された所定のキーワードを抽出する。そして、メタ情報管理システムは個々のキーワードの出現回数をカウントし、この集計結果に基づいてメタ情報のレコードを生成し、そのレコードをメタ情報データベース３４に格納する。それぞれの時間帯において個々の第２コンテンツが解析されることで、メタ情報データベース３４にメタ情報が蓄積される。出現頻度の設定方法は限定されない。例えば、或るキーワードが１以上の第２コンテンツ中に１回以上現われた場合に、メタ情報管理システムはその出現回数をそのまま出現頻度として設定してもよいし、そのキーワードが現われた第２コンテンツの個数を出現頻度として設定してもよい。いずれにしても、出現頻度は第２情報源におけるキーワードの露出量を示す指標であるということができる。

ユーザデータベース３５は、ユーザに関連する各種情報を永続的に記憶する非一時的な記憶媒体または記憶装置である。具体的には、ユーザデータベース３５は、第２情報源におけるキーワード群から第１ユーザによって選択されたキーワードと、該キーワードが属するジャンルと、該ジャンルにおける第１ユーザのクラスタとの間の対応関係を示す被選択キーワード情報を記憶する。本実施形態では、ユーザデータベース３５は、対象ユーザによって選択および登録された好みのキーワードを示すキーワード情報と、個々のユーザの区分を示す区分情報という２種類の情報を記憶する。本実施形態では、被選択キーワード情報はキーワード情報および区分情報によって表すことができる。

一例では、キーワード情報の個々のレコードは、ユーザＩＤ、キーワード、キーワード種別、および登録日時を含む。ユーザＩＤはキーワードを選択および登録した対象ユーザを一意に特定する識別子である。キーワードは、対象ユーザによって選択および登録されたキーワードのことをいい、例えば、図１に示すキーワードリスト２０２から選択されたキーワードであり得る。キーワード種別は、そのキーワードの由来を示すデータ項目であり、例えば、そのキーワードが第１キーワードおよび第２キーワードのうちのどちらであったかを示す。登録日時は対象ユーザによってキーワードが選択されたタイミングを示す日時である。

キーワード情報はキーワード管理システムによって生成されてユーザデータベース３５に格納される。キーワード管理システムの構成は限定されない。例えば、情報提供システム１がキーワード管理システムとしての機能を有してもよい。あるいは、情報提供システム１とは異なるコンピュータシステムがキーワード管理システムとして機能してもよい。キーワード管理システムは、ユーザ端末２０において選択されたキーワードと、そのキーワードに関連付けられたキーワード種別と、ユーザＩＤとをそのユーザ端末２０から受信する。そして、キーワード管理システムはこれらのデータ項目に基づいてキーワード情報のレコードを生成し、そのレコードをユーザデータベース３５に格納する。キーワード管理システムは現在日時をレコードの登録日時に設定する。

一例では、区分情報の個々のレコードは、ユーザＩＤ、ジャンルＩＤ、およびクラスタＩＤを含む。区分情報は閲覧履歴解析部１１によって登録される。

第２候補キーワードデータベース３６は、第２情報源におけるキーワードに対してスコアリングを実行することで抽出された第２候補キーワードに関する第２候補キーワード情報を記憶する非一時的な記憶媒体または記憶装置である。一例では、第２候補キーワード情報の個々のレコードはジャンルＩＤと、クラスタＩＤと、時間帯と、１以上の第２候補キーワードに関する第２特徴ベクトルとを含む。第２候補キーワード情報の時間帯はメタ情報の時間帯と合致するように設定される。第２特徴ベクトルは、第２候補キーワードとスコアとの組合せによって表現される成分を１以上含んで構成される。第２特徴ベクトルの詳細も後述する。

個々のデータベースに格納される個々の情報のデータ構造は限定されず、任意の方針で設計されてよい。例えば、上記の各種情報のうちの少なくとも一つが任意の方針で正規化または非正規化されて一または複数のデータテーブル上に記憶されてもよい。

図３は情報提供システム１の動作の一例を処理フローＳ１として示すフローチャートである。ステップＳ１１では、受付部１３がキーワードリストの要求を受け付ける。この要求は、キーワードリストの提供を指示するためのデータ信号である。要求は、キーワードリストの送信先であるユーザ端末２０に対応する対象ユーザのユーザＩＤを含む。本開示では、この対象ユーザを「第２ユーザ」ともいう。要求の受付方法は限定されない。例えば、受付部１３はユーザ端末２０での所定の操作に基づいて該ユーザ端末２０から送信されてきた要求を受信してもよい。あるいは、受付部１３は情報提供システム１内の他の機能要素から入力された要求を取得してもよい。要求は少なくとも一つのジャンルＩＤを含んでもよく、この場合には、それぞれのジャンルＩＤに対応するキーワードによって構成されるキーワードリストがユーザ端末２０に送信される。

ステップＳ１２では、第１選択部１４がその要求に応答して少なくとも一つの第１キーワードを選択する。この選択のために、閲覧履歴解析部１１が予め、第１候補キーワードを抽出して第１候補キーワード情報を第１候補キーワードデータベース３３に格納する。図４は第１候補キーワードを抽出する処理の一例を処理フローＳ２として示すフローチャートである。一例では、閲覧履歴解析部１１は定期的な（例えば１時間毎の）バッチ処理によって処理フローＳ２を実行し、これにより、第１候補キーワード情報が最新の状態に更新される。

ステップＳ２１では、閲覧履歴解析部１１は閲覧履歴の個々のレコードについて第１候補キーワードの第１特徴ベクトルを算出する。閲覧履歴解析部１１は閲覧履歴のそれぞれのレコード、すなわち、閲覧履歴で示されるそれぞれのアクセスについて、第１コンテンツから１以上の第１候補キーワードを特定する。閲覧履歴解析部１１は閲覧履歴データベース３１から１レコードを読み出し、そのコンテンツＩＤに対応する第１コンテンツを第１コンテンツデータベース３２から読み出す。閲覧履歴解析部１１はその第１コンテンツのタイトルおよび本文のうちの少なくとも一方を解析することで１以上の第１候補キーワードを該第１コンテンツから特定する。閲覧履歴解析部１１は閲覧履歴の個々のレコードについてその処理を実行する。

続いて、閲覧履歴解析部１１は閲覧履歴のそれぞれのレコード（閲覧履歴で示されるそれぞれのアクセス）について、１以上の第１候補キーワードのそれぞれの特徴量を算出し、第１候補キーワードおよび特徴量の１以上の組合せを含む第１特徴ベクトルを生成する。

閲覧履歴解析部１１はこの処理のために、キーワードと、基準特徴量と、ジャンルＩＤとの関連付けを示すキーワード辞書を参照する。このキーワード辞書は予め用意されて情報提供システム１内の任意の記憶装置に記憶される。このキーワード辞書は少なくとも一部のキーワードについての表記ゆれ、類義語、または同義語をさらに示してもよい。キーワード辞書に登録されるキーワードは、第１候補キーワードとしても第２候補キーワードとしても用いることができる。図５はキーワード辞書の一例を示す。この例では、キーワード辞書の個々のレコードは、キーワードとして用いられる主語句と、主語句に対応する副語句と、個々の副語句の基準特徴量（図５において括弧書きで示される数値）と、ジャンルＩＤとを含む。一つのキーワードが複数のジャンルに関連付けられてもよい。

閲覧履歴解析部１１はそのキーワード辞書を参照して、第１コンテンツのジャンルＩＤに対応する第１候補キーワードおよび基準特徴量を特定する。図５の例に関して、副語句「ＮａｔｉｏｎａｌＴｅａｍ」から第１候補キーワード「日本代表」が得られた場合には、閲覧履歴解析部１１はその第１候補キーワードの基準特徴量を０．５に設定する。閲覧履歴解析部１１は特定された基準特徴量に、第１コンテンツが生成されてからの経過時間と、第１コンテンツに対する操作種別とのうちの少なくとも一方に基づく重みを適用することで特徴量を算出してもよい。例えば、閲覧履歴解析部１１は基準特徴量に重みを乗ずることで特徴量を得てもよい。第１コンテンツが生成されてからの経過時間はコンテンツ日時に基づいて求めることができる。例えば、その重みは、経過時間が短いほど（すなわち、コンテンツ日時が新しいほど）特徴量が高くなるように設定されてもよい。あるいは、重みは、「閲覧」よりも「クリック」の方の特徴量が高くなるように設定されてもよい。

閲覧履歴解析部１１は閲覧履歴の個々のレコードについて第１候補キーワードの第１特徴ベクトルを算出し、その第１特徴ベクトルを示す第１中間レコードを生成する。個々の第１中間レコードはユーザＩＤ、コンテンツＩＤ、および第１特徴ベクトルを含む。図６は第１中間レコードの一例を示す。この例では説明の便宜のために、特定の閲覧者であるユーザＡに関する５個の第１中間レコード３０１のみを示すが、当然ながら、閲覧履歴解析部１１は個々の閲覧者の個々の閲覧履歴について第１候補キーワードの第１特徴ベクトルを算出し第１中間レコードを生成する。図６の例ではコンテンツＩＤ「Ｃ４０４２」が２レコード存在し、これは、ユーザＡがそのコンテンツＩＤで識別される第１コンテンツに２回アクセスしたことを意味する。

ステップＳ２２では、閲覧履歴解析部１１は閲覧者と第１コンテンツのジャンルとの組合せごとに第１特徴ベクトルを合算する。閲覧履歴解析部１１は或る一人の閲覧者について次のように処理する。すなわち、閲覧履歴解析部１１はその閲覧者の１以上の第１中間レコードのそれぞれについて第１コンテンツのジャンルＩＤを特定し、これにより、その閲覧者に対応する１以上のジャンルＩＤを特定する。そして、閲覧履歴解析部１１は特定された１以上のジャンルＩＤのそれぞれについて、該ジャンルＩＤの第１特徴ベクトルを合算し、その計算結果を示す第２中間レコードを生成する。第１特徴ベクトルの合算とは、具体的には、１以上の第１候補キーワードのそれぞれについて特徴量の和を求める処理のことをいう。閲覧履歴解析部１１は複数の閲覧者のそれぞれについて、このような一連の処理を実行する。

図６は第１特徴ベクトルの合算により得られる第２中間レコードの一例も示す。この例では、コンテンツＩＤが「Ｃ４０４２」、「Ｃ４０４２」、「Ｃ４０５３」である３レコードがジャンルＩＤ「３」に対応し、コンテンツＩＤが「Ｃ４００１」、「Ｃ４１０１」である２レコードがジャンルＩＤ「１５」に対応するとする。閲覧履歴解析部１１はこれらの第１中間レコード３０１について第１特徴ベクトルの合算を実行することで２個の第２中間レコード３０２を生成する。ジャンルＩＤ「３」の第２中間レコード３０２について説明すると、閲覧履歴解析部１１は第１候補キーワード「サッカー」の特徴量を１＋１．５＝２．５と合算する。同様に、第１候補キーワード「日本代表」の特徴量は１＋１．５＋０．７＝３．２と合算され、第１候補キーワード「チームＲ」の特徴量は０．９＋１．４＝２．３と合算される。第１候補キーワード「サッカーＷ杯」は１レコードでしか現われていないので、この第１候補キーワードの合算値は０．７である。

ステップＳ２３では、閲覧履歴解析部１１は第１特徴ベクトルに基づく閲覧者のクラスタリングをジャンル毎に実行する。閲覧履歴解析部１１がクラスタリングを実行することで複数の閲覧者が複数のクラスタに分類され、これにより、共通の特徴を有する１以上の閲覧者を含むクラスタが複数個生成される。クラスタリングの手法は限定されず、閲覧履歴解析部１１は１以上の任意の手法を用いて閲覧者をクラスタリングしてよい。例えば、閲覧履歴解析部１１はコサイン類似度およびＬｏｃａｌｉｔｙＳｅｎｓｉｔｉｖｅＨａｓｈｉｎｇ（ＬＳＨ）を用いて閲覧者をクラスタリングしてよい。より具体的には、閲覧履歴解析部１１はコサイン類似度を用いて１回目のクラスタリングを実行し、ＬＳＨを用いた２回目のクラスタリングを実行することでクラスタを再調整してもよい。

図７は或る一つのジャンルにおける閲覧者のクラスタリングの一例を示す図である。この例では、ユーザＡ，Ｂがクラスタ４０１に分類され、ユーザＣがクラスタ４０２に分類され、ユーザＤ，Ｅがクラスタ４０３に分類されている。それぞれクラスタの中心に描かれた点は該クラスタの重心を示す。図７は個々のクラスタが存在する空間を便宜的に３次元座標で示すが、クラスタリングにおいて考慮される次元数は限定されず、任意に設定されてよい。

個々のジャンルにおいて、閲覧履歴解析部１１は個々の閲覧者が属するクラスタを特定し、個々の第２中間レコードにクラスタＩＤを付加する。図８は、クラスタＩＤが付加された第２中間レコードの一例を示す図である。この例では、ジャンルＩＤ「３」についての５人のユーザＡ，Ｂ，Ｃ，Ｄ，Ｅの第２中間レコード３０３を示す。ユーザＡ，Ｂはクラスタ「１」に分類され、ユーザＣはクラスタ「２」に分類され、ユーザＤ，Ｅはクラスタ「３」に分類されている。

第２中間レコードにクラスタＩＤが付加されることで、ユーザＩＤ、ジャンルＩＤ、およびクラスタＩＤの組合せが得られる。閲覧履歴解析部１１は個々の組合せについて区分情報のレコードを生成し、生成したレコード群をユーザデータベース３５に格納する。ユーザＩＤおよびジャンルＩＤの組合せに対応するレコードが既にユーザデータベース３５内に存在する場合には、閲覧履歴解析部１１はその既存レコードを今回生成されたレコードによって上書きすることで区分情報を更新する。

ステップＳ２４では、閲覧履歴解析部１１はジャンルおよびクラスタの組合せ毎に第１特徴ベクトルを合算して第１候補キーワード情報を生成する。閲覧履歴解析部１１はジャンルおよびクラスタの組合せのそれぞれについて、該組合せに対応する１以上の第２中間レコードの第１特徴ベクトルを合算し、この計算結果を示す第３中間レコードを生成する。この合算も、１以上の第１候補キーワードのそれぞれについて特徴量の和を求める処理である。第３中間レコードは第１候補キーワード情報のレコードに対応する。図８は、第２中間レコード３０３の第１特徴ベクトルを合算して第３中間レコード３０４を生成する処理をさらに示す。ジャンルＩＤ「３」およびクラスタＩＤ「１」の組合せについていうと、閲覧履歴解析部１１は第１候補キーワード「サッカー」の特徴量を２．５＋１．０＝３．５と合算し、第１候補キーワード「サッカーＷ杯」の特徴量を０．７＋１．０＝１．７と合算する。第１候補キーワード「日本代表」、「チームＲ」、「イングランド代表」はそれぞれ１レコードでしか現われていないので、これら３語の特徴量はそのまま第３中間レコード３０４に組み込まれる。閲覧履歴解析部１１はクラスタＩＤ「２」、「３」のそれぞれについても同様に第３中間レコード３０４を生成する。

ステップＳ２５では、閲覧履歴解析部１１は生成された１以上の第３中間レコードを第１候補キーワード情報のレコードとして第１候補キーワードデータベース３３に登録する。或るジャンルおよびクラスタの組合せについて、第１候補キーワードデータベース３３がその組合せに対応するレコードを既に記憶している場合には、閲覧履歴解析部１１はそのレコードを第３中間レコードで上書きすることで第１候補キーワード情報を更新する。

図３に戻り、ステップＳ１２では、第１選択部１４は処理フローＳ２によって予め用意された第１候補キーワード情報に基づいて少なくとも一つの第１キーワードを選択する。第１選択部１４は、要求に対応するジャンルと対象ユーザが属するクラスタとの組合せに対応する１以上の第１候補キーワードのうちの少なくとも一つを第１キーワードとして選択する。第１選択部１４は第１候補キーワードデータベース３３を参照して、その組合せに対応するレコードを読み出し、相対的に特徴量が高い第１候補キーワードを第１キーワードとして選択する。例えば、第１選択部１４は特徴量の降順に第１候補キーワードを並べた上で、先頭から１以上の第１候補キーワードを第１キーワードとして選択してもよい。このように、第１選択部１４は対象ユーザが属するクラスタに対応する１以上の第１特徴ベクトルに基づいて複数の第１候補キーワードから少なくとも一つの第１キーワードを選択する。具体的には、第１選択部１４は対象ユーザが属するジャンルおよびクラスタの組合せに対応する１以上の第１特徴ベクトルに基づいて１以上の第１キーワードを選択する。典型的には、第１選択部１４は要求に対応するジャンルと対象ユーザが属するクラスタとに対応する１以上の第１特徴ベクトルに基づいて１以上の第１キーワードを選択する。

ステップＳ１３では、第２選択部１５が要求に応答して少なくとも一つの第２キーワードを選択する。この選択のために、スコアリング部１２が予め、第２候補キーワードを抽出して第２候補キーワード情報を第２候補キーワードデータベース３６に格納する。図９は第２候補キーワードを抽出する処理の一例を処理フローＳ３として示すフローチャートである。一例では、スコアリング部１２は定期的な（例えば１時間毎の）バッチ処理によって処理フローＳ３を実行し、これにより、第２候補キーワード情報が最新の状態に更新される。

ステップＳ３１では、スコアリング部１２はユーザデータベース３５を参照して複数の第２候補キーワードを抽出し、その第２候補キーワードを含む作業用レコードを生成する。スコアリング部１２はキーワード辞書を用いてキーワード情報と区分情報とを結合することで得られるレコードのうち、キーワード種別が第２キーワードを示すレコードを作業用レコードとして取得する。すなわち、スコアリング部１２は第２情報源に由来するキーワードを示す作業用レコードを取得する。作業用レコードはデータ項目としてユーザＩＤ、ジャンルＩＤ、クラスタＩＤ、キーワード、および登録日時を含む。以下では、作業用レコードで示されるキーワードを第２候補キーワードという。本開示では、作業用レコードのユーザＩＤで示されるユーザを「第１ユーザ」ともいう。

図１０は作業用レコードの一例を示す図である。図１０は、説明の便宜のために特定のレコードのみを示していることに留意されたい。この例では、スコアリング部１２は、キーワード情報のユーザＩＤおよびキーワードと、区分情報のユーザＩＤおよびジャンルＩＤと、キーワード辞書５０１の主語句（キーワード）およびジャンルＩＤとを参照して、対応し合うレコードを結合することで、作業用レコード５０２を得る。

ステップＳ３２では、スコアリング部１２は一つのジャンルＩＤ、一つのクラスタＩＤ、および一つの第２候補キーワードから成る一つの組合せを作業用レコードの群から選択する。図１０に示す作業用レコード５０２を例にとり、組合せを“（ジャンルＩＤ、クラスタＩＤ、第２候補キーワード）”で表現するとする。この前提では、スコアリング部１２は組合せ（５，１，京都）、または組合せ（５，１，アメリカ）を選択する。

ステップＳ３３では、スコアリング部１２は直近の時間帯における第２候補キーワードの選択回数を算出する。スコアリング部１２はメタ情報で示される直近の時間帯を特定する。例えば、メタ情報の時間帯が１時間毎に設定された場合には、スコアリング部１２はそのメタ情報で示される直近の１時間を、選択回数を算出するための時間帯として設定する。スコアリング部１２は選択された組合せを含み、且つ登録日時が直近の時間帯に含まれる作業用レコードの個数をカウントし、その個数を選択回数として取得する。

ステップＳ３４では、スコアリング部１２は直近の時間帯における第２候補キーワードの出現頻度を取得する。スコアリング部１２はメタ情報データベース３４を参照して、選択された第２候補キーワードと直近の時間帯との組合せに対応する出現頻度を取得する。対応するレコードがメタ情報データベース３４内に存在しない場合には、スコアリング部１２はその第２候補キーワードの出現頻度を０に設定する。

ステップＳ３５では、スコアリング部１２は直近の時間帯の一つ前の時間帯における第２候補キーワードのスコアを取得する。本開示では、このステップで得られるスコアを「前回スコア」という。スコアリング部１２は第２候補キーワードデータベース３６を参照して、選択された組合せを構成するジャンルＩＤおよびクラスタＩＤと、一つ前の時間帯とに対応する第２特徴ベクトルを読み出し、選択された第２候補キーワードのスコアを前回スコアとしてその第２特徴ベクトルから抽出する。対応する前回スコアが第２候補キーワードデータベース３６内に存在しない場合には、スコアリング部１２は前回スコアを０に設定する。

ステップＳ３６では、スコアリング部１２は直近の時間帯における、選択された組合せの第２候補キーワードのスコアを算出する。本開示では、このステップで算出スコアを「直近スコア」という。直近スコアをＳｃとし、取得された選択回数をＣｓとし、前回スコアをＳｐとし、取得された出現頻度をＦａとすると、スコアリング部１２は下記の式（１）によって直近スコアＳｃを求める。
Ｓｃ＝Ｃｓ＋α×Ｓｐ＋β×Ｆａ …（１）
ここで、第１係数αは、前回スコアＳｐの影響が時間の経過によって減衰することを示す減衰係数であり、１未満の正数である。第２係数βは直近スコアＳｃへの出現頻度Ｆａの影響の度合いを調整するための係数であり、１未満の正数である。

ステップＳ３７で示すように、スコアリング部１２は、ジャンル、クラスタ、および第２候補キーワードのすべての組合せについてステップＳ３２以降の処理を実行する。未処理の組合せが存在する場合には（ステップＳ３７においてＮＯ）、スコアリング部１２はステップＳ３２において次の組合せを選択し、その組合せについてステップＳ３３～Ｓ３６の処理を実行する。

すべての組合せを処理した場合には（ステップＳ３７においてＹＥＳ）、処理はステップＳ３８に進む。ステップＳ３８では、スコアリング部１２は直近の時間帯についての第２候補キーワード情報を登録する。スコアリング部１２はすべての組合せのスコア（直近スコア）に基づいて第２候補キーワード情報の複数のレコードを生成し、そのレコード群を第２候補キーワードデータベース３６に格納する。

図１１は、第２候補キーワードのスコアリングの一例を示す図である。この例では、スコアリング部１２は、２０１９年９月２０日の三つの時間帯（１３時～１４時、１４時～１５時、および１５時～１６時）のそれぞれにおいて第２候補キーワード「京都」「アメリカ」のそれぞれのスコアを算出する。ジャンルＩＤは「５」であり、クラスタＩＤは「１」であるとする。メタ情報データベース３４のメタ情報は、キーワード「京都」の出現頻度が時間帯の変化に伴って１０→１２→５と変化することと、キーワード「アメリカ」の出現頻度が同様に１５→８→８と変化することとを示す。説明の便宜上、これら二つのキーワードはいずれも、１３時～１４時に初めて第２情報源において出現したものと仮定し、したがって、１２時～１３時での該二つのキーワードのスコアが０であるとする。また、式（１）の二つの係数α，βはいずれも０．５であるとする。

時間帯「１３時～１４時」に対するスコアリングを説明する。キーワード「京都」については、その出現頻度は１０であり、選択回数は０である。したがって、キーワード「京都」の直近スコアＳｃは下記式より５である。
Ｓｃ＝０＋０．５×０＋０．５×１０＝５

時間帯「１３時～１４時」でのキーワード「アメリカ」については、その出現頻度は１５であり、選択回数は０である。したがって、キーワード「アメリカ」の直近スコアＳｃは下記式より７．５である。
Ｓｃ＝０＋０．５×０＋０．５×１５＝７．５

時間帯「１４時～１５時」に対するスコアリングを説明する。キーワード「京都」については、その出現頻度は１２であり、選択回数は２であり、前回スコアは５である。したがって、キーワード「京都」の直近スコアＳｃは下記式より１０．５である。
Ｓｃ＝２＋０．５×５＋０．５×１２＝１０．５

時間帯「１４時～１５時」でのキーワード「アメリカ」については、その出現頻度は８であり、選択回数は１であり、前回スコアは７．５である。したがって、キーワード「アメリカ」の直近スコアＳｃは下記式より８．７５である。
Ｓｃ＝１＋０．５×７．５＋０．５×８＝８．７５

時間帯「１５時～１６時」に対するスコアリングを説明する。キーワード「京都」については、その出現頻度は５であり、選択回数は０であり、前回スコアは１０．５である。したがって、キーワード「京都」の直近スコアＳｃは下記式より７．７５である。
Ｓｃ＝０＋０．５×１０．５＋０．５×５＝７．７５

時間帯「１５時～１６時」でのキーワード「アメリカ」については、その出現頻度は８であり、選択回数は１であり、前回スコアは８．７５である。したがって、キーワード「アメリカ」の直近スコアＳｃは下記式より９．３７５である。
Ｓｃ＝１＋０．５×８．７５＋０．５×８＝９．３７５

図１１に示すように、それぞれの時間帯おける上記の計算の結果、第２候補キーワードデータベース３６には、ジャンルＩＤ「５」およびクラスタＩＤ「１」の組合せに関して、二つのキーワード「京都」「アメリカ」に関する各時間帯の第２候補キーワード情報が蓄積される。

図３に戻り、ステップＳ１３では、第２選択部１５は処理フローＳ３によって予め用意された第２候補キーワード情報に基づいて少なくとも一つの第２キーワードを選択する。第２選択部１５は、要求に対応するジャンルと対象ユーザが属するクラスタとの組合せに対応する１以上の第２候補キーワードのうちの少なくとも一つを第２キーワードとして選択する。第２選択部１５は第２候補キーワードデータベース３６を参照して、その組合せに対応するレコードを読み出し、相対的にスコア（直近スコア）が高い第２候補キーワードを第２キーワードとして選択する。例えば、第２選択部１５はスコア（直近スコア）の降順に第２候補キーワードを並べた上で、先頭から１以上の第２候補キーワードを第２キーワードとして選択してもよい。このように、第２選択部１５は対象ユーザが属するクラスタに対応する１以上の第２特徴ベクトルに基づいて複数の第２候補キーワードから少なくとも一つの第２キーワードを選択する。具体的には、第２選択部１５は対象ユーザが属するジャンルおよびクラスタの組合せに対応する１以上の第２特徴ベクトルに基づいて１以上の第２キーワードを選択する。典型的には、第２選択部１５は要求に対応するジャンルと対象ユーザが属するクラスタとに対応する１以上の第２特徴ベクトルに基づいて１以上の第２キーワードを選択する。

ステップＳ１４では、リスト生成部１６が少なくとも一つの第１キーワードと少なくとも一つの第２キーワードとを含むキーワードリストを生成する。一例では、リスト生成部１６は複数の第１キーワードから一部をランダムに選択し、複数の第２キーワードから一部をランダムに選択する。

別の例では、リスト生成部１６はユーザデータベース３５にアクセスして、対象ユーザに対応するキーワード情報を読み出すことで、第２キーワードとして対象ユーザによって提示され且つ該対象ユーザによって選択されたキーワードの個数を特定する。そして、リスト生成部１６はその個数が所定の閾値未満である場合には、キーワードリストにおける第２キーワードの割合をＰａに設定し、その個数が該閾値以上である場合にはその割合をＰｂ（ただし、Ｐｂ＜Ｐａ）に設定する。これは、自身が関心を持つキーワードを多く選択する傾向がある対象ユーザに、他の人々が感心を持つキーワードをより多く提示することを意図する。Ｐａ＋Ｐｂ＝１００（％）になるように割合Ｐａ，Ｐｂが設定されてもよい。

あるいは、リスト生成部１６は、ユーザＩＤに対応する、ジャンルＩＤおよびクラスタＩＤの組合せの個数を特定する。そして、リスト生成部１６は、その個数が所定の閾値未満である場合には、キーワードリストにおける第２キーワードの割合をＰｃに設定し、その個数が該閾値以上である場合にはその割合をＰｄ（ただし、Ｐｄ＜Ｐｃ）に設定する。これは、自身の関心の範囲が狭い傾向がある対象ユーザに、様々な分野のキーワードをより多く提示することを意図する。Ｐｃ＋Ｐｄ＝１００（％）になるように割合Ｐｃ，Ｐｄが設定されてもよい。

リスト生成部１６はキーワードリスト内で第１キーワードおよび第２キーワードをシャッフルしてもよい。同じ語句が第１キーワードおよび第２キーワードの双方から選択された場合には、リスト生成部１６はその語句を重複してキーワードリストに含めるのではなく、一つのみをキーワードリストに含める。一例では、リスト生成部１６は第１キーワードおよび第２キーワードのそれぞれに、対応するキーワード種別を関連付ける。

ステップＳ１５では、送信部１７がキーワードリストをユーザ端末２０に送信する。ユーザ端末２０はそのキーワードリストを受信および表示する。例えば、ユーザ端末２０は図１に示すキーワードリスト２０２を表示する。送信部１７は、第１情報源での第１コンテンツの検索のために用いられるキーワードを対象ユーザに提供するためにキーワードリストをユーザ端末２０上に表示させてもよい。

閲覧履歴解析部１１および第１候補キーワードデータベース３３は必須の構成要素ではなく、第１選択部１４が閲覧履歴解析部１１の役割も担ってもよい。この場合、第１選択部１４は要求に応答して閲覧履歴データベース３１および第１コンテンツデータベース３２を参照し、閲覧履歴に基づいて少なくとも一つの第１キーワードを選択する。すなわち、閲覧履歴に基づいて少なくとも一つの第１キーワードを選択する一連の処理は、上記実施形態のように定期的なバッチ処理を含んでもよいし、すべてリアルタイムに処理されてもよい。

スコアリング部１２および第２候補キーワードデータベース３６は必須の構成要素ではなく、第２選択部１５がスコアリング部１２の役割も担ってもよい。この場合、第２選択部１５は要求に応答してメタ情報データベース３４およびユーザデータベース３５を参照し、第２情報源でのキーワードの出現頻度に少なくとも基づいて少なくとも一つの第２キーワードを選択する。すなわち、出現頻度に少なくとも基づいて少なくとも一つの第２キーワードを選択する一連の処理は、上記実施形態のように定期的なバッチ処理を含んでもよいし、すべてリアルタイムに処理されてもよい。

上記実施形態では情報提供システム１が第１キーワードおよび第２キーワードの双方を含むキーワードリストを生成するが、情報提供システムは第１キーワードを選択することなく第２キーワードを用いてキーワードリストを生成してもよい。すなわち、第１キーワードの選択は必須ではなく、これに対応して、閲覧履歴から第１候補キーワードを抽出する処理も必須ではない。この変形例では、区分情報は他のコンピュータシステムよって任意の手法でユーザデータベース３５などの所定の記憶装置に登録される。この変形例においても、対象ユーザによって用いられる蓋然性が高いキーワードを精度良く提供することが可能になる。

上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した１つの装置を用いて実現されてもよいし、物理的又は論理的に分離した２つ以上の装置を直接的又は間接的に（例えば、有線、無線などを用いて）接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記１つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。

機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知（broadcasting）、通知（notifying）、通信（communicating）、転送（forwarding）、構成（configuring）、再構成（reconfiguring）、割り当て（allocating、mapping）、割り振り（assigning）などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック（構成部）は、送信部（transmitting unit）または送信機（transmitter）と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。

例えば、本開示の一実施の形態における情報提供システム１またはサーバ１０は、本開示の処理を行うコンピュータとして機能してもよい。図１２は、情報提供システム１またはサーバ１０として機能するコンピュータ１００のハードウェア構成の一例を示す図である。コンピュータ１００は、物理的には、プロセッサ１００１、メモリ１００２、ストレージ１００３、通信装置１００４、入力装置１００５、出力装置１００６、バス１００７などを含んでもよい。

なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。サーバ１０のハードウェア構成は、図に示した各装置を１つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。

サーバ１０における各機能は、プロセッサ１００１、メモリ１００２などのハードウェア上に所定のソフトウェア（プログラム）を読み込ませることによって、プロセッサ１００１が演算を行い、通信装置１００４による通信を制御したり、メモリ１００２及びストレージ１００３におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。

プロセッサ１００１は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ１００１は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置（ＣＰＵ：Central Processing Unit）によって構成されてもよい。

また、プロセッサ１００１は、プログラム（プログラムコード）、ソフトウェアモジュール、データなどを、ストレージ１００３及び通信装置１００４の少なくとも一方からメモリ１００２に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、サーバ１０の各機能要素は、メモリ１００２に格納され、プロセッサ１００１において動作する制御プログラムによって実現されてもよい。上述の各種処理は、１つのプロセッサ１００１によって実行される旨を説明してきたが、２以上のプロセッサ１００１により同時又は逐次に実行されてもよい。プロセッサ１００１は、１以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されてもよい。

メモリ１００２は、コンピュータ読み取り可能な記録媒体であり、例えば、ＲＯＭ（Read Only Memory）、ＥＰＲＯＭ（Erasable Programmable ＲＯＭ）、ＥＥＰＲＯＭ（Electrically Erasable Programmable ＲＯＭ）、ＲＡＭ（Random Access Memory）などの少なくとも１つによって構成されてもよい。メモリ１００２は、レジスタ、キャッシュ、メインメモリ（主記憶装置）などと呼ばれてもよい。メモリ１００２は、本開示の一実施の形態に係る方法を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュールなどを保存することができる。

ストレージ１００３は、コンピュータ読み取り可能な記録媒体であり、例えば、ＣＤ－ＲＯＭ（Compact Disc ＲＯＭ）などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク（例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク）、スマートカード、フラッシュメモリ（例えば、カード、スティック、キードライブ）、フロッピー（登録商標）ディスク、磁気ストリップなどの少なくとも１つによって構成されてもよい。ストレージ１００３は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ１００２及びストレージ１００３の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。

通信装置１００４は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置１００４は、例えば周波数分割複信（ＦＤＤ：Frequency Division Duplex）及び時分割複信（ＴＤＤ：Time Division Duplex）の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。

入力装置１００５は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど）である。出力装置１００６は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカ、LEDランプなど）である。なお、入力装置１００５及び出力装置１００６は、一体となった構成（例えば、タッチパネル）であってもよい。

また、プロセッサ１００１、メモリ１００２などの各装置は、情報を通信するためのバス１００７によって接続される。バス１００７は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。

また、コンピュータ１００は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＰＬＤ（Programmable Logic Device）、ＦＰＧＡ（Field Programmable Gate Array）などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ１００１は、これらのハードウェアの少なくとも１つを用いて実装されてもよい。

以上説明したように、本開示の一側面に係る情報提供システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、情報源におけるキーワード群から第１ユーザによって選択されたキーワードと、該キーワードが属するジャンルと、該ジャンルにおける第１ユーザのクラスタとの間の対応関係を示す被選択キーワード情報を記憶するデータベースを参照し、ジャンルおよびクラスタの組合せに対応する複数のキーワードのそれぞれについて該キーワードの選択回数を算出し、複数のキーワードのそれぞれについて、該キーワードの選択回数と情報源での該キーワードの出現頻度とに少なくとも基づいてスコアを算出し、複数のキーワードに対応する複数のスコアに基づいて、クラスタに属する第２ユーザに提示する１以上のキーワードを該複数のキーワードから選択し、選択された１以上のキーワードを含むキーワードリストを第２ユーザの端末上に表示させる。

他の側面に係る情報提供システムでは、被選択キーワード情報が、キーワードと、キーワードが第１ユーザによって選択されたタイミングと、ジャンルと、クラスタとの間の対応関係を示してもよい。少なくとも一つのプロセッサは、直近の時間帯における選択回数を複数のキーワードのそれぞれについて算出し、複数のキーワードのそれぞれについて、直近の時間帯における選択回数と、直近の時間帯における出現頻度と、直近の時間帯の一つ前の時間帯での前回スコアとに基づいて、直近の時間帯における直近スコアを算出し、複数のキーワードに対応する、直近の時間帯における複数の直近スコアに基づいて、複数のキーワードから１以上のキーワードを選択してもよい。キーワードを選択するために用いる直近スコアの計算において前回スコアを用いることで、時間の経過に伴うキーワードの流行の変化を考慮してキーワードを選択することができる。

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、１未満の正数である第１係数を前回スコアに乗じることで得られた値と、１未満の正数である第２係数を出現頻度に乗じることで得られた値と、選択回数とを加算することで直近スコアを算出してもよい。このように直近スコアを計算することで、一つ前の時間帯での動向、および情報源での出現頻度よりも、直近の時間帯において他のユーザ（第１ユーザ）によって選択された事実の方を重視してキーワードをユーザ（第２ユーザ）に提示することができる。

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、情報源とは異なる別の情報源でのコンテンツの検索のために用いられるキーワードを第２ユーザに提供するために、キーワードリストを端末上に表示させてもよい。この場合には、対象ユーザが別の情報源のコンテンツを検索するために用いる蓋然性が高いキーワードを精度良く提供することが可能になる。

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、被選択キーワード情報を生成して被選択キーワード情報をデータベースに格納してもよい。被選択キーワード情報の生成は、複数の第１ユーザが別の情報源から提供されるコンテンツにアクセスしたことを示す閲覧履歴を記憶する別のデータベースを参照するステップと、閲覧履歴で示されるそれぞれのアクセスについてコンテンツから１以上のキーワードを特定するステップと、閲覧履歴で示されるそれぞれのアクセスについて、１以上のキーワードのそれぞれについて特徴量を算出し、キーワードおよび特徴量の１以上の組合せを含む特徴ベクトルを生成するステップと、第１ユーザとコンテンツのジャンルとの組合せ毎に特徴ベクトルを合算するステップと、ジャンル毎に、それぞれの特徴ベクトルに基づいて複数の第１ユーザをクラスタリングすることで複数のクラスタを生成するステップと、クラスタリングの結果に基づいて被選択キーワード情報を生成するステップとを含んでもよい。このような一連の処理により被選択キーワード情報を生成することで、それぞれのジャンルにおいて複数のユーザが適切にクラスタリングされる。したがって、ユーザによって用いられる蓋然性が高いキーワードを精度良く提供することができる。

以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。

情報の通知は、本開示において説明した態様／実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング（例えば、ＤＣＩ（Downlink Control Information）、ＵＣＩ（Uplink Control Information））、上位レイヤシグナリング（例えば、ＲＲＣ（Radio Resource Control）シグナリング、ＭＡＣ（Medium Access Control）シグナリング、報知情報（ＭＩＢ（Master Information Block）、ＳＩＢ（System Information Block）））、その他の信号又はこれらの組み合わせによって実施されてもよい。また、ＲＲＣシグナリングは、ＲＲＣメッセージと呼ばれてもよく、例えば、ＲＲＣ接続セットアップ（RRC Connection Setup）メッセージ、ＲＲＣ接続再構成（RRC Connection Reconfiguration）メッセージなどであってもよい。

本開示において説明した各態様／実施形態は、ＬＴＥ（Long Term Evolution）、ＬＴＥ－Ａ（LTE-Advanced）、ＳＵＰＥＲ３Ｇ、ＩＭＴ－Ａｄｖａｎｃｅｄ、４Ｇ（4th generation mobile communication system）、５Ｇ（5th generation mobile communication system）、ＦＲＡ（Future Radio Access）、ＮＲ（new Radio）、Ｗ－ＣＤＭＡ（登録商標）、ＧＳＭ（登録商標）、ＣＤＭＡ２０００、ＵＭＢ（Ultra Mobile Broadband）、ＩＥＥＥ８０２．１１（Ｗｉ－Ｆｉ（登録商標））、ＩＥＥＥ８０２．１６（ＷｉＭＡＸ（登録商標））、ＩＥＥＥ８０２．２０、ＵＷＢ（Ultra-WideBand）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて（例えば、ＬＴＥ及びＬＴＥ－Ａの少なくとも一方と５Ｇとの組み合わせ等）適用されてもよい。

本開示において説明した各態様／実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。

本開示において基地局によって行われるとした特定動作は、場合によってはその上位ノード（upper node）によって行われることもある。基地局を有する１つ又は複数のネットワークノード（network nodes）からなるネットワークにおいて、端末との通信のために行われる様々な動作は、基地局及び基地局以外の他のネットワークノード（例えば、ＭＭＥ又はＳ－ＧＷなどが考えられるが、これらに限られない）の少なくとも１つによって行われ得ることは明らかである。上記において基地局以外の他のネットワークノードが１つである場合を例示したが、複数の他のネットワークノードの組み合わせ（例えば、ＭＭＥ及びＳ－ＧＷ）であってもよい。

情報等は、上位レイヤ（又は下位レイヤ）から下位レイヤ（又は上位レイヤ）へ出力され得る。複数のネットワークノードを介して入出力されてもよい。

入出力された情報等は特定の場所（例えば、メモリ）に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。

判定は、１ビットで表される値（０か１か）によって行われてもよいし、真偽値（Boolean：true又はfalse）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

本開示において説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われてもよい。

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術（同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ：Digital Subscriber Line）など）及び無線技術（赤外線、マイクロ波など）の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。

本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。

なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。例えば、チャネル及びシンボルの少なくとも一方は信号（シグナリング）であってもよい。また、信号はメッセージであってもよい。また、コンポーネントキャリア（ＣＣ：Component Carrier）は、キャリア周波数、セル、周波数キャリアなどと呼ばれてもよい。

本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。

また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。例えば、無線リソースはインデックスによって指示されるものであってもよい。

上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々なチャネル（例えば、ＰＵＣＣＨ、ＰＤＣＣＨなど）及び情報要素は、あらゆる好適な名称によって識別できるので、これらの様々なチャネル及び情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。

本開示においては、「基地局（ＢＳ：Base Station）」、「無線基地局」、「固定局（fixed station）」、「ＮｏｄｅＢ」、「ｅＮｏｄｅＢ（ｅＮＢ）」、「ｇＮｏｄｅＢ（ｇＮＢ）」、「アクセスポイント（access point）」、「送信ポイント（transmission point）」、「受信ポイント（reception point）、「送受信ポイント（transmission/reception point）」、「セル」、「セクタ」、「セルグループ」、「キャリア」、「コンポーネントキャリア」などの用語は、互換的に使用され得る。基地局は、マクロセル、スモールセル、フェムトセル、ピコセルなどの用語で呼ばれる場合もある。

基地局は、１つ又は複数（例えば、３つ）のセルを収容することができる。基地局が複数のセルを収容する場合、基地局のカバレッジエリア全体は複数のより小さいエリアに区分でき、各々のより小さいエリアは、基地局サブシステム（例えば、屋内用の小型基地局（ＲＲＨ：ＲｅｍｏｔｅＲａｄｉｏＨｅａｄ）によって通信サービスを提供することもできる。「セル」又は「セクタ」という用語は、このカバレッジにおいて通信サービスを行う基地局及び基地局サブシステムの少なくとも一方のカバレッジエリアの一部又は全体を指す。

本開示においては、「移動局（ＭＳ：Mobile Station）」、「ユーザ端末（user terminal）」、「ユーザ装置（ＵＥ：User Equipment）」、「端末」などの用語は、互換的に使用され得る。

移動局は、当業者によって、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、又はいくつかの他の適切な用語で呼ばれる場合もある。

基地局及び移動局の少なくとも一方は、送信装置、受信装置、通信装置などと呼ばれてもよい。なお、基地局及び移動局の少なくとも一方は、移動体に搭載されたデバイス、移動体自体などであってもよい。当該移動体は、乗り物（例えば、車、飛行機など）であってもよいし、無人で動く移動体（例えば、ドローン、自動運転車など）であってもよいし、ロボット（有人型又は無人型）であってもよい。なお、基地局及び移動局の少なくとも一方は、必ずしも通信動作時に移動しない装置も含む。例えば、基地局及び移動局の少なくとも一方は、センサなどのＩｏＴ（Internet of Things）機器であってもよい。

また、本開示における基地局は、ユーザ端末で読み替えてもよい。例えば、基地局及びユーザ端末間の通信を、複数のユーザ端末間の通信（例えば、Ｄ２Ｄ（Device-to-Device）、Ｖ２Ｘ（Vehicle-to-Everything）などと呼ばれてもよい）に置き換えた構成について、本開示の各態様／実施形態を適用してもよい。この場合、基地局が有する機能をユーザ端末が有する構成としてもよい。また、「上り」及び「下り」などの文言は、端末間通信に対応する文言（例えば、「サイド（side）」）で読み替えられてもよい。例えば、上りチャネル、下りチャネルなどは、サイドチャネルで読み替えられてもよい。

同様に、本開示におけるユーザ端末は、基地局で読み替えてもよい。この場合、ユーザ端末が有する機能を基地局が有する構成としてもよい。

本開示で使用する「判断（determining）」、「決定（determining）」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定（judging）、計算（calculating）、算出（computing）、処理（processing）、導出（deriving）、調査（investigating）、探索（looking up、search、inquiry）（例えば、テーブル、データベース又は別のデータ構造での探索）、確認（ascertaining）した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信（receiving）（例えば、情報を受信すること）、送信（transmitting）（例えば、情報を送信すること）、入力（input）、出力（output）、アクセス（accessing）（例えば、メモリ中のデータにアクセスすること）した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決（resolving）、選択（selecting）、選定（choosing）、確立（establishing）、比較（comparing）などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断（決定）」は、「想定する（assuming）」、「期待する（expecting）」、「みなす（considering）」などで読み替えられてもよい。

「接続された（connected）」、「結合された（coupled）」という用語、又はこれらのあらゆる変形は、２又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された２つの要素間に１又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、２つの要素は、１又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光（可視及び不可視の両方）領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。

本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

本開示において使用する「第１の」、「第２の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、２つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第１及び第２の要素への参照は、２つの要素のみが採用され得ること、又は何らかの形で第１の要素が第２の要素に先行しなければならないことを意味しない。

本開示において、「含む（include）」、「含んでいる（including）」及びそれらの変形が使用されている場合、これらの用語は、用語「備える（comprising）」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は（or）」は、排他的論理和ではないことが意図される。

本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。

本開示において、「ＡとＢが異なる」という用語は、「ＡとＢが互いに異なる」ことを意味してもよい。なお、当該用語は、「ＡとＢがそれぞれＣと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。

１…情報提供システム、１０…サーバ、１１…閲覧履歴解析部、１２…スコアリング部、１３…受付部、１４…第１選択部、１５…第２選択部、１６…リスト生成部、１７…送信部、２０…ユーザ端末、３０…データベース群、３１…閲覧履歴データベース、３２…第１コンテンツデータベース、３３…第１候補キーワードデータベース、３４…メタ情報データベース、３５…ユーザデータベース、３６…第２候補キーワードデータベース、２０２…キーワードリスト。

Claims

少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
情報源におけるキーワード群から第１ユーザによって選択されたキーワードと、該キーワードが属するジャンルと、該ジャンルにおける第１ユーザのクラスタとの間の対応関係を示す被選択キーワード情報を記憶するデータベースを参照し、
前記ジャンルおよび前記クラスタの組合せに対応する複数の前記キーワードのそれぞれについて該キーワードの選択回数を算出し、
前記複数のキーワードのそれぞれについて、該キーワードの前記選択回数と前記情報源での該キーワードの出現頻度とに少なくとも基づいてスコアを算出し、
前記複数のキーワードに対応する複数の前記スコアに基づいて、前記クラスタに属する第２ユーザに提示する１以上のキーワードを該複数のキーワードから選択し、
前記選択された１以上のキーワードを含むキーワードリストを前記第２ユーザの端末上に表示させる、
情報提供システム。
前記被選択キーワード情報が、前記キーワードと、前記キーワードが前記第１ユーザによって選択されたタイミングと、前記ジャンルと、前記クラスタとの間の対応関係を示し、
前記少なくとも一つのプロセッサが、
直近の時間帯における前記選択回数を前記複数のキーワードのそれぞれについて算出し、
前記複数のキーワードのそれぞれについて、前記直近の時間帯における前記選択回数と、前記直近の時間帯における前記出現頻度と、前記直近の時間帯の一つ前の時間帯での前回スコアとに基づいて、前記直近の時間帯における直近スコアを算出し、
前記複数のキーワードに対応する、前記直近の時間帯における複数の前記直近スコアに基づいて、前記複数のキーワードから前記１以上のキーワードを選択する、
請求項１に記載の情報提供システム。
前記少なくとも一つのプロセッサが、１未満の正数である第１係数を前記前回スコアに乗じることで得られた値と、１未満の正数である第２係数を前記出現頻度に乗じることで得られた値と、前記選択回数とを加算することで前記直近スコアを算出する、
請求項２に記載の情報提供システム。
前記少なくとも一つのプロセッサが、前記情報源とは異なる別の情報源でのコンテンツの検索のために用いられるキーワードを前記第２ユーザに提供するために、前記キーワードリストを前記端末上に表示させる、
請求項１～３のいずれか一項に記載の情報提供システム。
前記少なくとも一つのプロセッサが、前記被選択キーワード情報を生成して前記被選択キーワード情報を前記データベースに格納し、
前記被選択キーワード情報の生成が、
複数の第１ユーザが別の情報源から提供されるコンテンツにアクセスしたことを示す閲覧履歴を記憶する別のデータベースを参照するステップと、
前記閲覧履歴で示されるそれぞれのアクセスについて前記コンテンツから１以上のキーワードを特定するステップと、
前記閲覧履歴で示されるそれぞれのアクセスについて、前記１以上のキーワードのそれぞれについて特徴量を算出し、前記キーワードおよび前記特徴量の１以上の組合せを含む特徴ベクトルを生成するステップと、
前記第１ユーザと前記コンテンツのジャンルとの組合せ毎に前記特徴ベクトルを合算するステップと、
前記ジャンル毎に、それぞれの特徴ベクトルに基づいて前記複数の第１ユーザをクラスタリングすることで複数のクラスタを生成するステップと、
前記クラスタリングの結果に基づいて前記被選択キーワード情報を生成するステップとを含む、
請求項１～４のいずれか一項に記載の情報提供システム。