JP7212599B2 - Information provision system - Google Patents

Information provision system Download PDF

Info

Publication number
JP7212599B2
JP7212599B2 JP2019167336A JP2019167336A JP7212599B2 JP 7212599 B2 JP7212599 B2 JP 7212599B2 JP 2019167336 A JP2019167336 A JP 2019167336A JP 2019167336 A JP2019167336 A JP 2019167336A JP 7212599 B2 JP7212599 B2 JP 7212599B2
Authority
JP
Japan
Prior art keywords
keyword
information
keywords
content
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019167336A
Other languages
Japanese (ja)
Other versions
JP2021043878A (en
Inventor
知憲 石原
将之 秦
理恵 角田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2019167336A priority Critical patent/JP7212599B2/en
Publication of JP2021043878A publication Critical patent/JP2021043878A/en
Application granted granted Critical
Publication of JP7212599B2 publication Critical patent/JP7212599B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示の一側面は情報提供システムに関する。 One aspect of the present disclosure relates to an information providing system.

コンピュータ上での処理のために用いられるキーワードをユーザに提案する手法が知られている。例えば、特許文献1には、放送内容に関連するキーワードを自動的にユーザに提供するキーワード提供システムが記載されている。このシステムは、所定のキーワード群から、放送内容に対応するキーワードと一致するキーワードを抽出し、その抽出されたキーワードを放送情報に関連するキーワードとしてユーザ端末装置に提供する。 Techniques for proposing keywords for use in computer processing to users are known. For example, Patent Literature 1 describes a keyword providing system that automatically provides users with keywords related to broadcast content. This system extracts keywords that match keywords corresponding to broadcast content from a predetermined keyword group, and provides the extracted keywords to user terminal devices as keywords related to broadcast information.

特開2006-319456号公報JP 2006-319456 A

ユーザによって用いられる蓋然性が高いキーワードをより高い精度で該ユーザに提示することができれば、より便宜である。そこで、そのようなキーワードの提示をより高い精度で行う仕組みが望まれている。 It would be more convenient if keywords that are likely to be used by the user could be presented to the user with higher accuracy. Therefore, a mechanism for presenting such keywords with higher accuracy is desired.

本開示の一側面に係る情報提供システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、対象ユーザを含む複数の閲覧者が第1情報源から提供される第1コンテンツにアクセスしたことを示す閲覧履歴を記憶する第1データベースを参照し、該閲覧履歴に基づいて少なくとも一つの第1キーワードを選択し、第2情報源から提供される第2コンテンツでのキーワードの出現頻度を示すメタ情報を記憶する第2データベースを参照し、該メタ情報に基づいて少なくとも一つの第2キーワードを選択し、少なくとも一つの第1キーワードのうちの少なくとも一つと、少なくとも一つの第2キーワードのうちの少なくとも一つとを含むキーワードリストを生成し、キーワードリストを対象ユーザの端末上に表示させる。 An information providing system according to one aspect of the present disclosure includes at least one processor. At least one processor refers to a first database that stores browsing histories indicating that a plurality of viewers, including the target user, have accessed first content provided from a first information source, and based on the browsing histories, selecting at least one first keyword, referring to a second database storing meta information indicating frequency of occurrence of the keyword in second content provided from a second information source, and based on the meta information, at least one selecting a second keyword, generating a keyword list including at least one of the at least one first keyword and at least one of the at least one second keyword, and displaying the keyword list on the terminal of the target user; Let

このような側面においては、第1情報源に関する閲覧履歴に基づいて選択された第1キーワードと、第2情報源での出現頻度に基づいて選択された第2キーワードとの双方を含むキーワードリストが対象ユーザの端末上に表示される。第1キーワードは対象ユーザの関心が高いと推定されるキーワードであるといえ、第2キーワードは人々の間で関心が高いと推定されるキーワードであるといえる。したがって、これら2種類のキーワードの混合を端末上に表示させることで、対象ユーザによって用いられる蓋然性が高いキーワードを精度良く提供することが可能になる。 In such an aspect, a keyword list including both a first keyword selected based on the browsing history regarding the first information source and a second keyword selected based on the appearance frequency in the second information source is provided. Displayed on the terminal of the target user. It can be said that the first keyword is a keyword that is presumed to be of high interest to the target user, and that the second keyword is a keyword that is presumed to be of high interest to people. Therefore, by displaying a mixture of these two types of keywords on the terminal, it is possible to accurately provide keywords that are likely to be used by the target user.

本開示の一側面によれば、ユーザによって用いられる蓋然性が高いキーワードを精度良く提供することができる。 According to one aspect of the present disclosure, it is possible to accurately provide keywords that are highly likely to be used by users.

実施形態に係る情報提供システムの利用の一例を示す図である。It is a figure which shows an example of utilization of the information provision system which concerns on embodiment. 実施形態に係る情報提供システムの構成の一例を示す図である。It is a figure showing an example of composition of an information service system concerning an embodiment. 実施形態に係る情報提供システムの動作の一例を示すフローチャートである。It is a flow chart which shows an example of operation of an information service system concerning an embodiment. 第1候補キーワードを抽出する処理の一例を示すフローチャートである。9 is a flow chart showing an example of processing for extracting a first candidate keyword; キーワード辞書の一例を示す図である。It is a figure which shows an example of a keyword dictionary. 第1候補キーワードを抽出するための中間レコードの一例を示す図である。It is a figure which shows an example of the intermediate record for extracting a 1st candidate keyword. 閲覧者のクラスタリングの一例を示す図である。FIG. 5 is a diagram showing an example of clustering of viewers; 第1候補キーワードを抽出するための中間レコードの一例を示す図である。It is a figure which shows an example of the intermediate record for extracting a 1st candidate keyword. 第2キーワードを選択する処理の一例を示すフローチャートである。10 is a flowchart showing an example of processing for selecting a second keyword; 実施形態に係る情報提供システムで用いられるコンピュータのハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of the computer used with the information provision system which concerns on embodiment.

以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。 Hereinafter, embodiments of the present disclosure will be described in detail with reference to the accompanying drawings. In the description of the drawings, the same or equivalent elements are denoted by the same reference numerals, and overlapping descriptions are omitted.

実施形態に係る情報提供システム1は、コンピュータ上での処理のために用いられるキーワードを対象ユーザに提案するコンピュータシステムである。情報提供システム1は1以上のキーワードを対象ユーザのユーザ端末に送信することで該ユーザ端末上にそのキーワードを表示させ、これにより対象ユーザは提案されたキーワードを用いることができる。対象ユーザとは、キーワードを提供する宛先になるユーザのことをいう。 The information providing system 1 according to the embodiment is a computer system that proposes a keyword to be used for processing on a computer to a target user. By transmitting one or more keywords to the user terminal of the target user, the information providing system 1 displays the keywords on the user terminal, so that the target user can use the suggested keywords. A target user is a user to whom a keyword is provided.

キーワードの目的および利用方法は限定されない。一例では、情報提供システム1は情報の検索に用いられるキーワードを提案してもよい。図1は情報提供システム1の利用の一例を示す図である。この例では、ユーザ端末20はニュースなどの様々な情報を表示するニュース・アプリケーション・プログラムを実行しており、複数の記事201と、複数のキーワードから成るキーワードリスト202とを表示している。対象ユーザはそのキーワードリストから好みのキーワードを選択および登録することで、そのキーワードに対応する記事を検索して該記事をユーザ端末20上に表示させることができる。 The purpose and usage of keywords are not limited. In one example, the information providing system 1 may suggest keywords that are used to search for information. FIG. 1 is a diagram showing an example of use of the information providing system 1. As shown in FIG. In this example, the user terminal 20 is running a news application program that displays various information such as news, and displays a plurality of articles 201 and a keyword list 202 consisting of a plurality of keywords. By selecting and registering a favorite keyword from the keyword list, the target user can retrieve an article corresponding to the keyword and display the article on the user terminal 20 .

情報提供システム1は2種類の手法を用いてキーワードを選択し、それぞれの手法によって得られたキーワードの混合をキーワードリストとしてユーザ端末20に提供する。第1の手法は、対象ユーザを含む複数の閲覧者が第1情報源から提供される第1コンテンツにアクセスしたことを示す閲覧履歴に基づいて少なくとも一つの第1キーワードを選択する手法である。第2の手法は、第1情報源とは異なる第2情報源から提供される第2コンテンツでのキーワードの出現頻度に基づいて少なくとも一つの第2キーワードを選択する手法である。図1に示すキーワードリスト202は、少なくとも一つの第1キーワードと少なくとも一つの第2キーワードとによって構成される。 The information providing system 1 selects keywords using two types of techniques, and provides the user terminal 20 with a mixture of keywords obtained by the respective techniques as a keyword list. A first method is to select at least one first keyword based on viewing histories indicating that a plurality of viewers, including the target user, have accessed first content provided from a first information source. A second method is to select at least one second keyword based on the appearance frequency of the keyword in the second content provided from a second information source different from the first information source. The keyword list 202 shown in FIG. 1 consists of at least one first keyword and at least one second keyword.

第1キーワードは対象ユーザが第1コンテンツを閲覧する傾向に基づいて提示されるキーワードであり、したがって、対象ユーザの関心が高いと推定されるキーワードであるといえる。一方、第2キーワードは世間での話題性に基づいて推定されるキーワードであり、したがって、他の人々と同様に対象ユーザが関心を持つ見込みが高いと推定されるキーワードであるといえる。このような2種類のキーワードをキーワードリストに含めることで、キーワードの選択の幅を効果的に拡げることができる。その結果、対象ユーザによって用いられる蓋然性が高いキーワードを精度良く提供することが可能になる。 The first keyword is a keyword presented based on the tendency of the target user to browse the first content, and therefore can be said to be a keyword that is presumed to be of high interest to the target user. On the other hand, the second keyword is a keyword that is estimated based on public topicality, and therefore can be said to be a keyword that is highly likely to be of interest to the target user as well as other people. By including these two types of keywords in the keyword list, it is possible to effectively expand the range of keyword selection. As a result, it is possible to accurately provide keywords that are highly likely to be used by the target user.

図2は情報提供システム1の構成の一例を示す図である。情報提供システム1は、キーワードを対象ユーザに提供するコンピュータであるサーバ10を備える。サーバ10は通信ネットワークを介してユーザ端末20とデータ通信を実行することができる。図2ではユーザ端末20を一つのみ示すが、サーバ10とデータ通信するユーザ端末20の個数は何ら限定されず、サーバ10は複数のユーザ端末20と通信接続してもよい。さらに、サーバ10は通信ネットワークを介してデータベース群30にアクセスすることができる。通信ネットワークの構成は限定されず、任意の方針で設計されてよい。例えば、それぞれの通信ネットワークは移動体通信網、インターネット、イントラネット、WAN(Wide Area Network)のうちの少なくとも一つを含んで構成されてもよい。 FIG. 2 is a diagram showing an example of the configuration of the information providing system 1. As shown in FIG. The information providing system 1 includes a server 10 which is a computer that provides keywords to target users. The server 10 can perform data communication with the user terminal 20 via the communication network. Although only one user terminal 20 is shown in FIG. 2, the number of user terminals 20 that communicate with the server 10 is not limited, and the server 10 may be connected to a plurality of user terminals 20 for communication. Furthermore, the server 10 can access the database group 30 via a communication network. The configuration of the communication network is not limited and may be designed according to any policy. For example, each communication network may include at least one of a mobile communication network, the Internet, an intranet, and a WAN (Wide Area Network).

サーバ10は機能要素として閲覧履歴解析部11、受付部12、第1選択部13、第2選択部14、リスト生成部15、および送信部16を備える。閲覧履歴解析部11は、対象ユーザを含む複数の閲覧者が第1情報源から提供される第1コンテンツにアクセスしたことを示す閲覧履歴を解析して第1候補キーワードを抽出する機能要素である。第1候補キーワードとは、第1キーワードの候補となる語句のことをいう。受付部12はキーワードを提供せよとの指示を受け付ける機能要素である。第1選択部13は少なくとも一つの第1キーワードを選択する機能要素である。第2選択部14は、第2情報源から提供される第2コンテンツでのキーワードの出現頻度に基づいて少なくとも一つの第2キーワードを選択する機能要素である。リスト生成部15は少なくとも一つの第1キーワードと少なくとも一つの第2キーワードとを含むキーワードリストを生成する機能要素である。送信部16はそのキーワードリストをユーザ端末20に送信する機能要素であり、これによりキーワードがユーザ端末20上に表示される。 The server 10 includes a viewing history analysis unit 11, a reception unit 12, a first selection unit 13, a second selection unit 14, a list generation unit 15, and a transmission unit 16 as functional elements. The viewing history analysis unit 11 is a functional element that analyzes viewing histories indicating that a plurality of viewers, including the target user, have accessed first content provided from a first information source, and extracts first candidate keywords. . A first candidate keyword is a phrase that is a candidate for the first keyword. The receiving unit 12 is a functional element that receives an instruction to provide a keyword. The first selection unit 13 is a functional element that selects at least one first keyword. The second selection unit 14 is a functional element that selects at least one second keyword based on the appearance frequency of keywords in the second content provided from the second information source. The list generator 15 is a functional element that generates a keyword list including at least one first keyword and at least one second keyword. The transmission unit 16 is a functional element that transmits the keyword list to the user terminal 20 , whereby the keywords are displayed on the user terminal 20 .

サーバ10は少なくとも一つのコンピュータを用いて構成される。複数のコンピュータが用いられる場合には、これらのコンピュータが通信ネットワークを介して相互に接続することで、論理的に一つのサーバ10が構築される。 The server 10 is configured using at least one computer. When a plurality of computers are used, one server 10 is logically constructed by connecting these computers to each other via a communication network.

ユーザ端末20は、対象ユーザによって操作されるコンピュータである。ユーザ端末20の種類は限定されない。例えば、ユーザ端末20は、携帯電話機、高機能携帯電話機(スマートフォン)、タブレット端末、ウェアラブル端末(例えば、スマートウォッチ、ヘッドマウントディスプレイ(HMD)など)、ラップトップなどの携帯端末でもよい。あるいは、ユーザ端末20は据置型のパーソナルコンピュータでもよい。 The user terminal 20 is a computer operated by the target user. The type of user terminal 20 is not limited. For example, the user terminal 20 may be a portable terminal such as a mobile phone, a high-performance mobile phone (smartphone), a tablet terminal, a wearable terminal (for example, a smart watch, a head-mounted display (HMD), etc.), or a laptop. Alternatively, the user terminal 20 may be a stationary personal computer.

データベース群30は、情報提供システム1において必要なデータを記憶するデータベースの集合である。本実施形態では、データベース群30は閲覧履歴データベース31、第1コンテンツデータベース32、第1候補キーワードデータベース33、メタ情報データベース34、およびユーザデータベース35を含む。 The database group 30 is a set of databases that store necessary data in the information providing system 1 . In this embodiment, the database group 30 includes a browsing history database 31 , a first content database 32 , a first candidate keyword database 33 , a meta information database 34 and a user database 35 .

閲覧履歴データベース31は、対象ユーザを含む複数の閲覧者が第1情報源から提供される第1コンテンツにアクセスしたことを示す閲覧履歴を記憶する非一時的な記憶媒体または記憶装置である。一例では、閲覧履歴の個々のレコードはユーザID、コンテンツID、コンテンツ日時、および操作種別を含む。ユーザIDは、第1コンテンツにアクセスしたユーザ(すなわち閲覧者)を一意に特定する識別子である。コンテンツIDは個々の第1コンテンツを一意に特定する識別子である。コンテンツ日時は第1コンテンツが生成または公開された日時である。操作種別は、第1コンテンツに対するユーザ(閲覧者)の操作の種類を示す。例えば、操作種別は、ユーザが特定の第1コンテンツをユーザ端末20上で見たことを示す「閲覧」、ユーザが特定の第1コンテンツ中に存在するリンクをクリックしたことを示す「クリック」などの様々な操作を示し得る。 The viewing history database 31 is a non-temporary storage medium or storage device that stores viewing histories indicating that a plurality of viewers including the target user have accessed the first content provided from the first information source. In one example, each record of viewing history includes a user ID, a content ID, a content date and time, and an operation type. A user ID is an identifier that uniquely identifies a user (that is, a viewer) who has accessed the first content. A content ID is an identifier that uniquely identifies each first content. The content date and time is the date and time when the first content was generated or published. The operation type indicates the type of user's (viewer's) operation on the first content. For example, the operation type may be "browse" indicating that the user has viewed a specific first content on the user terminal 20, or "click" indicating that the user has clicked on a link in a specific first content. can represent various manipulations of

第1情報源の種類は限定されず、これに対応して、第1コンテンツの種類も限定されない。例えば、第1情報源は通信ネットワークを介して任意の端末または装置に情報を提供する情報サービスまたは情報発信者でもよい。一例では、第1情報源は、キーワードリストを表示する機能を有するアプリケーション・プログラムのために第1コンテンツを提供する情報サービスまたは情報発信者でもよい。図1の例では、第1情報源は、ニュース・アプリケーション・プログラムのために第1コンテンツを提供する情報発信者または情報サービスでもよい。あるいは、第1情報源は、キーワードリストを表示する機能を有するアプリケーション・プログラムとは独立した別のアプリケーション・プログラムのために第1コンテンツを提供する情報発信者または情報サービスであってもよい。第1コンテンツは可視要素を含んで構成され、例えば、テキスト、画像(静止画または動画)、またはそれらの組合せを含んで構成される。第1コンテンツは個人または法人によって作成された記事であってもよく、例えば、新聞、雑誌、オンライン・ニュース、ブログ、ソーシャル・ネットワーキング・サービス(SNS)などによって提供される記事でもよい。記事とは事柄を伝えるための文章のことをいう。記事は少なくとも文字列を含み、画像(静止画または動画)をさらに含んでもよい。 The type of the first information source is not limited, and correspondingly, the type of the first content is also not limited. For example, the first information source may be an information service or information originator that provides information to any terminal or device over a communication network. In one example, the first information source may be an information service or information originator that provides first content for an application program capable of displaying a keyword list. In the example of FIG. 1, the primary information source may be an information publisher or information service that provides primary content for a news application program. Alternatively, the first information source may be an information originator or information service that provides the first content for another application program independent of the application program having the function of displaying the keyword list. The first content includes visible elements, such as text, images (still or moving images), or a combination thereof. The first content may be an article created by an individual or a corporation, such as an article provided by newspapers, magazines, online news, blogs, social networking services (SNS), and the like. An article is a piece of writing that tells a story. An article includes at least a character string and may further include an image (still image or moving image).

閲覧履歴はアクセス管理システムによって生成されて閲覧履歴データベース31に格納される。アクセス管理システムの構成は限定されない。例えば、情報提供システム1がアクセス管理システムとしての機能を有してもよい。あるいは、情報提供システム1とは異なるコンピュータシステムがアクセス管理システムとして機能してもよい。アクセス管理システムは、1以上のユーザ端末20からの第1コンテンツへのアクセスを監視し、その監視結果に基づいて閲覧履歴のレコードを生成し、そのレコードを閲覧履歴データベース31に格納する。個々の第1コンテンツに対する個々のアクセスが監視されることで、閲覧履歴データベース31に閲覧履歴が蓄積される。 The browsing history is generated by the access management system and stored in the browsing history database 31 . The configuration of the access management system is not limited. For example, the information providing system 1 may have a function as an access management system. Alternatively, a computer system different from the information providing system 1 may function as the access management system. The access management system monitors access to the first content from one or more user terminals 20 , generates a browsing history record based on the monitoring results, and stores the record in the browsing history database 31 . A browsing history is accumulated in the browsing history database 31 by monitoring individual accesses to individual first contents.

第1コンテンツデータベース32は第1コンテンツを記憶する非一時的な記憶媒体または記憶装置である。それぞれの第1コンテンツはコンテンツIDと関連付けられる。 The first content database 32 is a non-temporary storage medium or storage device that stores first content. Each first content is associated with a content ID.

第1候補キーワードデータベース33は、閲覧履歴に基づいて抽出された第1候補キーワードに関する第1候補キーワード情報を記憶する非一時的な記憶媒体または記憶装置である。一例では、第1候補キーワード情報の個々のレコードはジャンルIDと、クラスタIDと、1以上の第1候補キーワードに関する特徴ベクトルとを含む。ジャンルIDは、コンテンツの分類または種別であるジャンルを一意に特定するための識別子である。クラスタIDは、ユーザが属するクラスタを一意に特定するための識別子である。個々のユーザのクラスタは、データの集合を複数のクラスタ(部分集合)に分類する処理であるクラスタリングによって決定される。クラスタリングの詳細は後述する。特徴ベクトルは、第1候補キーワードとスコアとの組合せによって表現される成分を1以上含んで構成される。特徴ベクトルの詳細も後述する。 The first candidate keyword database 33 is a non-temporary storage medium or storage device that stores first candidate keyword information related to first candidate keywords extracted based on browsing history. In one example, each record of first candidate keyword information includes a genre ID, a cluster ID, and a feature vector for one or more first candidate keywords. A genre ID is an identifier for uniquely identifying a genre, which is a classification or type of content. A cluster ID is an identifier for uniquely identifying a cluster to which a user belongs. Clusters of individual users are determined by clustering, which is the process of classifying a set of data into multiple clusters (subsets). The details of clustering will be described later. A feature vector includes one or more components expressed by a combination of a first candidate keyword and a score. Details of the feature vector will also be described later.

メタ情報データベース34は、第2情報源から提供される第2コンテンツでのキーワードの出現頻度を示すメタ情報を永続的に記憶する非一時的な記憶媒体または記憶装置である。一例では、メタ情報の個々のレコードはキーワードおよび出現頻度を含む。キーワードは、第2コンテンツ上に現われた語句である。出現頻度は、所定の期間においてそのキーワードが1以上の第2コンテンツ上に現われた程度を示す指標である。 The meta-information database 34 is a non-temporary storage medium or storage device that permanently stores meta-information indicating the appearance frequency of keywords in the second content provided from the second information source. In one example, each record of meta information includes keywords and frequency of occurrence. A keyword is a phrase that appears on the second content. Appearance frequency is an index that indicates the extent to which the keyword appears in one or more second contents during a predetermined period.

第2情報源の種類は限定されず、これに対応して、第2コンテンツの種類も限定されない。ただし、第2情報源は第1情報源と異なる。例えば、第2情報源は通信ネットワークまたは放送ネットワークを介して任意の端末または装置に情報を提供することができる情報サービスまたは情報発信者でもよい。一例では、第2情報源は放送ネットワークまたは通信ネットワークを介してテレビ番組またはラジオ番組を放送する放送局でもよいし、インターネットを介して記事を提供する発信者でもよい。第2コンテンツは可視要素を含んで構成され、例えば、テキスト、画像(静止画または動画)、またはそれらの組合せを含んで構成される。第2コンテンツは個人または法人によって作成されたテレビ番組、ラジオ番組、または記事であってもよい。 The type of the second information source is not limited, and correspondingly, the type of the second content is also not limited. However, the second information source is different from the first information source. For example, the second information source may be an information service or information originator capable of providing information to any terminal or device via a communication network or broadcast network. In one example, the second source may be a broadcast station that broadcasts television or radio programs over a broadcast or communications network, or a publisher that provides articles over the Internet. The second content includes visible elements, such as text, images (still or moving images), or a combination thereof. The secondary content may be television programs, radio programs, or articles produced by individuals or corporations.

メタ情報はメタ情報管理システムによって生成されてメタ情報データベース34に格納される。メタ情報管理システムの構成は限定されない。例えば、情報提供システム1がメタ情報管理システムとしての機能を有してもよい。あるいは、情報提供システム1とは異なるコンピュータシステムがメタ情報管理システムとして機能してもよい。メタ情報管理システムは、所定の期間内に放送または配信された第2コンテンツのそれぞれを解析することで、それぞれの第2コンテンツ中にテキスト、画像、または音声によって表された所定のキーワードを抽出する。そして、メタ情報管理システムは個々のキーワードの出現回数をカウントし、この集計結果に基づいてメタ情報のレコードを生成し、そのレコードをメタ情報データベース34に格納する。個々の第2コンテンツが解析されることで、メタ情報データベース34にメタ情報が蓄積される。出現頻度の設定方法は限定されない。例えば、或るキーワードが1以上の第2コンテンツ中に1回以上現われた場合に、メタ情報管理システムはその出現回数をそのまま出現頻度として設定してもよいし、そのキーワードが現われた第2コンテンツの個数を出現頻度として設定してもよい。 Meta information is generated by the meta information management system and stored in the meta information database 34 . The configuration of the meta information management system is not limited. For example, the information providing system 1 may have a function as a meta information management system. Alternatively, a computer system different from the information providing system 1 may function as the meta information management system. The meta-information management system analyzes each of the secondary contents broadcasted or distributed within a predetermined period of time to extract predetermined keywords represented by text, images, or sounds in each of the secondary contents. . Then, the meta-information management system counts the number of appearances of each keyword, generates a meta-information record based on the result of counting, and stores the record in the meta-information database 34 . Meta information is accumulated in the meta information database 34 by analyzing each second content. The setting method of appearance frequency is not limited. For example, when a certain keyword appears one or more times in one or more second contents, the meta information management system may set the number of times of appearance as the frequency of appearance, or the second contents in which the keyword appears. may be set as the appearance frequency.

ユーザデータベース35は対象ユーザによって選択および登録された好みのキーワードを示すキーワード情報を永続的に記憶する非一時的な記憶媒体または記憶装置である。一例では、キーワード情報の個々のレコードは、ユーザID、キーワード、およびキーワード種別を含む。ユーザIDはキーワードを選択および登録した対象ユーザを一意に特定する識別子である。キーワードは、対象ユーザによって選択および登録されたキーワードのことをいい、例えば、図1に示すキーワードリスト202から選択されたキーワードであり得る。キーワード種別は、そのキーワードの由来を示すデータ項目であり、例えば、そのキーワードが第1キーワードおよび第2キーワードのうちのどちらであったかを示す。キーワード情報はキーワード管理システムによって生成されてユーザデータベース35に格納される。キーワード管理システムの構成は限定されない。例えば、情報提供システム1がキーワード管理システムとしての機能を有してもよい。あるいは、情報提供システム1とは異なるコンピュータシステムがキーワード管理システムとして機能してもよい。キーワード管理システムは、ユーザ端末20において選択されたキーワードと、そのキーワードに関連付けられたキーワード種別と、ユーザIDとをそのユーザ端末20から受信する。そして、キーワード管理システムはこれらのデータ項目に基づいてキーワード情報のレコードを生成し、そのレコードをユーザデータベース35に格納する。 The user database 35 is a non-temporary storage medium or storage device that permanently stores keyword information indicating preferred keywords selected and registered by the target user. In one example, each record of keyword information includes a user ID, a keyword, and a keyword type. A user ID is an identifier that uniquely identifies a target user who has selected and registered a keyword. A keyword refers to a keyword selected and registered by a target user, and can be, for example, a keyword selected from the keyword list 202 shown in FIG. The keyword type is a data item indicating the origin of the keyword, and indicates, for example, whether the keyword was the first keyword or the second keyword. Keyword information is generated by the keyword management system and stored in the user database 35 . The configuration of the keyword management system is not limited. For example, the information providing system 1 may have a function as a keyword management system. Alternatively, a computer system different from the information providing system 1 may function as the keyword management system. The keyword management system receives from the user terminal 20 the keyword selected by the user terminal 20, the keyword type associated with the keyword, and the user ID. Then, the keyword management system generates a keyword information record based on these data items and stores the record in the user database 35 .

個々のデータベースに格納される個々の情報のデータ構造は限定されず、任意の方針で設計されてよい。例えば、閲覧履歴、第1候補キーワード情報、メタ情報、およびキーワード情報の少なくとも一つが任意の方針で正規化または非正規化されて一または複数のデータテーブル上に記憶されてもよい。 The data structure of each piece of information stored in each database is not limited, and may be designed according to any policy. For example, at least one of browsing history, first candidate keyword information, meta information, and keyword information may be normalized or non-normalized according to an arbitrary policy and stored on one or more data tables.

図3は情報提供システム1の動作の一例を処理フローS1として示すフローチャートである。ステップS11では、受付部12がキーワードリストの要求を受け付ける。この要求は、キーワードリストの提供を指示するためのデータ信号である。要求は、キーワードリストの送信先であるユーザ端末20に対応する対象ユーザのユーザIDを含む。要求の受付方法は限定されない。例えば、受付部12はユーザ端末20での所定の操作に基づいて該ユーザ端末20から送信されてきた要求を受信してもよい。あるいは、受付部12は情報提供システム1内の他の機能要素から入力された要求を取得してもよい。要求は少なくとも一つのジャンルIDを含んでもよく、この場合には、それぞれのジャンルIDに対応するキーワードによって構成されるキーワードリストがユーザ端末20に送信される。 FIG. 3 is a flow chart showing an example of the operation of the information providing system 1 as a processing flow S1. In step S11, the receiving unit 12 receives a request for a keyword list. This request is a data signal for instructing provision of the keyword list. The request includes the user ID of the target user corresponding to the user terminal 20 to which the keyword list is sent. The request acceptance method is not limited. For example, the reception unit 12 may receive a request transmitted from the user terminal 20 based on a predetermined operation on the user terminal 20 . Alternatively, the reception unit 12 may acquire requests input from other functional elements within the information providing system 1 . The request may include at least one genre ID, in which case a keyword list consisting of keywords corresponding to each genre ID is sent to the user terminal 20 .

ステップS12では、第1選択部13がその要求に応答して少なくとも一つの第1キーワードを選択する。この選択のために、閲覧履歴解析部11が予め、第1候補キーワードを抽出して第1候補キーワード情報を第1候補キーワードデータベース33に格納する。図4は第1候補キーワードを抽出する処理の一例を処理フローS2として示すフローチャートである。一例では、閲覧履歴解析部11は定期的な(例えば1時間毎の)バッチ処理によって処理フローS2を実行し、これにより、第1候補キーワード情報が最新の状態に更新される。 At step S12, the first selection unit 13 selects at least one first keyword in response to the request. For this selection, the browsing history analysis unit 11 extracts first candidate keywords in advance and stores first candidate keyword information in the first candidate keyword database 33 . FIG. 4 is a flow chart showing an example of processing for extracting the first candidate keyword as a processing flow S2. In one example, the browsing history analysis unit 11 executes the process flow S2 by periodic (for example, hourly) batch processing, thereby updating the first candidate keyword information to the latest state.

ステップS21では、閲覧履歴解析部11は閲覧履歴の個々のレコードについて第1候補キーワードの特徴ベクトルを算出する。閲覧履歴解析部11は閲覧履歴のそれぞれのレコード、すなわち、閲覧履歴で示されるそれぞれのアクセスについて、第1コンテンツから1以上の第1候補キーワードを特定する。閲覧履歴解析部11は閲覧履歴データベース31から1レコードを読み出し、そのコンテンツIDに対応する第1コンテンツを第1コンテンツデータベース32から読み出す。閲覧履歴解析部11はその第1コンテンツのタイトルおよび本文のうちの少なくとも一方を解析することで1以上の第1候補キーワードを該第1コンテンツから特定する。閲覧履歴解析部11は閲覧履歴の個々のレコードについてその処理を実行する。 In step S21, the browsing history analysis unit 11 calculates the feature vector of the first candidate keyword for each record of the browsing history. The browsing history analysis unit 11 identifies one or more first candidate keywords from the first content for each record of the browsing history, that is, for each access indicated by the browsing history. The viewing history analysis unit 11 reads one record from the viewing history database 31 and reads the first content corresponding to the content ID from the first content database 32 . The browsing history analysis unit 11 identifies one or more first candidate keywords from the first content by analyzing at least one of the title and text of the first content. The viewing history analysis unit 11 executes the processing for each record of the viewing history.

続いて、閲覧履歴解析部11は閲覧履歴のそれぞれのレコード(閲覧履歴で示されるそれぞれのアクセス)について、1以上の第1候補キーワードのそれぞれの特徴量を算出し、第1候補キーワードおよび特徴量の1以上の組合せを含む特徴ベクトルを生成する。 Subsequently, the browsing history analysis unit 11 calculates the feature amount of each of the one or more first candidate keywords for each record of the browsing history (each access indicated in the browsing history), and calculates the first candidate keyword and the feature amount. generate a feature vector containing one or more combinations of

閲覧履歴解析部11はこの処理のために、第1候補キーワードと、基準特徴量と、ジャンルIDとの関連付けを示すキーワード辞書を参照する。このキーワード辞書は予め用意されて情報提供システム1内の任意の記憶装置に記憶される。このキーワード辞書は少なくとも一部の第1候補キーワードについての表記ゆれ、類義語、または同義語をさらに示してもよい。図5は第1候補キーワードに関するキーワード辞書の一例を示す。この例では、キーワード辞書の個々のレコードは、第1候補キーワードである主語句と、主語句に対応する副語句と、個々の副語句の基準特徴量(図5において括弧書きで示される数値)と、ジャンルIDとを含む。一つの第1候補キーワードが複数のジャンルに関連付けられてもよい。 For this process, the browsing history analysis unit 11 refers to a keyword dictionary that indicates the association between the first candidate keyword, the reference feature amount, and the genre ID. This keyword dictionary is prepared in advance and stored in an arbitrary storage device within the information providing system 1 . The keyword dictionary may further indicate alternatives, synonyms, or synonyms for at least some of the first candidate keywords. FIG. 5 shows an example of a keyword dictionary for the first candidate keyword. In this example, each record in the keyword dictionary contains the subject phrase that is the first candidate keyword, the sub-phrase corresponding to the subject phrase, and the reference feature amount of each sub-phrase (numerical values shown in parentheses in FIG. 5). and a genre ID. One first candidate keyword may be associated with multiple genres.

閲覧履歴解析部11はそのキーワード辞書を参照して、第1コンテンツのジャンルIDに対応する第1候補キーワードおよび基準特徴量を特定する。図5の例に関して、副語句「National Team」から第1候補キーワード「日本代表」が得られた場合には、閲覧履歴解析部11はその第1候補キーワードの基準特徴量を0.5に設定する。閲覧履歴解析部11は特定された基準特徴量に、第1コンテンツが生成されてからの経過時間と、第1コンテンツに対する操作種別とのうちの少なくとも一方に基づく重みを適用することで特徴量を算出してもよい。例えば、閲覧履歴解析部11は基準特徴量に重みを乗ずることで特徴量を得てもよい。第1コンテンツが生成されてからの経過時間はコンテンツ日時に基づいて求めることができる。例えば、その重みは、経過時間が短いほど(すなわち、コンテンツ日時が新しいほど)特徴量が高くなるように設定されてもよい。あるいは、重みは、「閲覧」よりも「クリック」の方の特徴量が高くなるように設定されてもよい。 The browsing history analysis unit 11 refers to the keyword dictionary to specify the first candidate keyword and the reference feature amount corresponding to the genre ID of the first content. Regarding the example of FIG. 5, when the first candidate keyword "Japanese representative" is obtained from the subphrase "National Team", the browsing history analysis unit 11 sets the reference feature amount of the first candidate keyword to 0.5. do. The browsing history analysis unit 11 applies a weight based on at least one of the elapsed time after the generation of the first content and the type of operation on the first content to the specified reference feature value to determine the feature value. can be calculated. For example, the browsing history analysis unit 11 may obtain a feature amount by multiplying the reference feature amount by a weight. The elapsed time since the first content was generated can be obtained based on the date and time of the content. For example, the weight may be set such that the shorter the elapsed time (that is, the newer the date and time of the content), the higher the feature amount. Alternatively, the weight may be set so that the feature amount of "click" is higher than that of "view".

閲覧履歴解析部11は閲覧履歴の個々のレコードについて第1候補キーワードの特徴ベクトルを算出し、その特徴ベクトルを示す第1中間レコードを生成する。個々の第1中間レコードはユーザID、コンテンツID、および特徴ベクトルを含む。図6は第1中間レコードの一例を示す。この例では説明の便宜のために、特定の閲覧者であるユーザAに関する5個の第1中間レコード301のみを示すが、当然ながら、閲覧履歴解析部11は個々の閲覧者の個々の閲覧履歴について第1候補キーワードの特徴ベクトルを算出し第1中間レコードを生成する。図6の例ではコンテンツID「C4042」が2レコード存在し、これは、ユーザAがそのコンテンツIDで識別される第1コンテンツに2回アクセスしたことを意味する。 The browsing history analysis unit 11 calculates the feature vector of the first candidate keyword for each record of the browsing history, and generates a first intermediate record indicating the feature vector. Each first intermediate record contains a user ID, a content ID, and a feature vector. FIG. 6 shows an example of the first intermediate record. In this example, for convenience of explanation, only five first intermediate records 301 related to user A, who is a specific viewer, are shown. is calculated to generate a first intermediate record. In the example of FIG. 6, there are two records with the content ID "C4042", which means that the user A has accessed the first content identified by the content ID twice.

ステップS22では、閲覧履歴解析部11は閲覧者と第1コンテンツのジャンルとの組合せごとに特徴ベクトルを合算する。閲覧履歴解析部11は或る一人の閲覧者について次のように処理する。すなわち、閲覧履歴解析部11はその閲覧者の1以上の第1中間レコードのそれぞれについて第1コンテンツのジャンルIDを特定し、これにより、その閲覧者に対応する1以上のジャンルIDを特定する。そして、閲覧履歴解析部11は特定された1以上のジャンルIDのそれぞれについて、該ジャンルIDの特徴ベクトルを合算し、その計算結果を示す第2中間レコードを生成する。特徴ベクトルの合算とは、具体的には、1以上の第1候補キーワードのそれぞれについて特徴量の和を求める処理のことをいう。閲覧履歴解析部11は複数の閲覧者のそれぞれについて、このような一連の処理を実行する。 In step S22, the viewing history analysis unit 11 sums the feature vectors for each combination of the viewer and the genre of the first content. The browsing history analysis unit 11 processes a certain browsing person as follows. That is, the viewing history analysis unit 11 identifies the genre ID of the first content for each of the one or more first intermediate records of the viewer, thereby identifying one or more genre IDs corresponding to the viewer. Then, the browsing history analysis unit 11 sums up the feature vectors of the genre IDs for each of the specified one or more genre IDs, and generates a second intermediate record indicating the calculation result. Summation of feature vectors specifically refers to a process of obtaining the sum of feature amounts for each of the one or more first candidate keywords. The viewing history analysis unit 11 executes such a series of processes for each of a plurality of viewers.

図6は特徴ベクトルの合算により得られる第2中間レコードの一例も示す。この例では、コンテンツIDが「C4042」、「C4042」、「C4053」である3レコードがジャンルID「3」に対応し、コンテンツIDが「C4001」、「C4101」である2レコードがジャンルID「15」に対応するとする。閲覧履歴解析部11はこれらの第1中間レコード301について特徴ベクトルの合算を実行することで2個の第2中間レコード302を生成する。ジャンルID「3」の第2中間レコード302について説明すると、閲覧履歴解析部11は第1候補キーワード「サッカー」の特徴量を1+1.5=2.5と合算する。同様に、第1候補キーワード「日本代表」の特徴量は1+1.5+0.7=3.2と合算され、第1候補キーワード「チームR」の特徴量は0.9+1.4=2.3と合算される。第1候補キーワード「サッカーW杯」は1レコードでしか現われていないので、この第1候補キーワードの合算値は0.7である。 FIG. 6 also shows an example of the second intermediate record obtained by summing the feature vectors. In this example, three records with content IDs "C4042", "C4042", and "C4053" correspond to genre ID "3", and two records with content IDs "C4001", "C4101" correspond to genre ID "C4042", "C4042", and "C4053". 15". The browsing history analysis unit 11 generates two second intermediate records 302 by adding feature vectors for these first intermediate records 301 . For the second intermediate record 302 with the genre ID "3", the browsing history analysis unit 11 sums the feature amount of the first candidate keyword "soccer" as 1+1.5=2.5. Similarly, the feature amount of the first candidate keyword "Japan national team" is 1+1.5+0.7=3.2, and the feature amount of the first candidate keyword "team R" is 0.9+1.4=2.3. added up. Since the first candidate keyword "Soccer World Cup" appears in only one record, the total value of this first candidate keyword is 0.7.

ステップS23では、閲覧履歴解析部11は特徴ベクトルに基づく閲覧者のクラスタリングをジャンル毎に実行する。閲覧履歴解析部11がクラスタリングを実行することで複数の閲覧者が複数のクラスタに分類され、これにより、共通の特徴を有する1以上の閲覧者を含むクラスタが複数個生成される。クラスタリングの手法は限定されず、閲覧履歴解析部11は1以上の任意の手法を用いて閲覧者をクラスタリングしてよい。例えば、閲覧履歴解析部11はコサイン類似度およびLocality Sensitive Hashing(LSH)を用いて閲覧者をクラスタリングしてよい。より具体的には、閲覧履歴解析部11はコサイン類似度を用いて1回目のクラスタリングを実行し、LSHを用いた2回目のクラスタリングを実行することでクラスタを再調整してもよい。 In step S23, the viewing history analysis unit 11 performs clustering of viewers based on feature vectors for each genre. A plurality of viewers are classified into a plurality of clusters by clustering performed by the viewing history analysis unit 11, thereby generating a plurality of clusters each including one or more viewers having common features. The clustering method is not limited, and the viewing history analysis unit 11 may cluster viewers using one or more arbitrary methods. For example, the viewing history analysis unit 11 may cluster viewers using cosine similarity and Locality Sensitive Hashing (LSH). More specifically, the browsing history analysis unit 11 may perform first clustering using cosine similarity, and may readjust clusters by performing second clustering using LSH.

図7は或る一つのジャンルにおける閲覧者のクラスタリングの一例を示す図である。この例では、ユーザA,Bがクラスタ401に分類され、ユーザCがクラスタ402に分類され、ユーザD,Eがクラスタ403に分類されている。それぞれクラスタの中心に描かれた点は該クラスタの重心を示す。図7は個々のクラスタが存在する空間を便宜的に3次元座標で示すが、クラスタリングにおいて考慮される次元数は限定されず、任意に設定されてよい。 FIG. 7 is a diagram showing an example of viewer clustering in a certain genre. In this example, users A and B are classified into cluster 401 , user C is classified into cluster 402 , and users D and E are classified into cluster 403 . The point drawn at the center of each cluster indicates the centroid of the cluster. Although FIG. 7 shows the space in which individual clusters exist in three-dimensional coordinates for the sake of convenience, the number of dimensions considered in clustering is not limited and may be set arbitrarily.

個々のジャンルにおいて、閲覧履歴解析部11は個々の閲覧者が属するクラスタを特定し、個々の第2中間レコードにクラスタIDを付加する。図8は、クラスタIDが付加された第2中間レコードの一例を示す図である。この例では、ジャンルID「3」についての5人のユーザA,B,C,D,Eの第2中間レコード303を示す。ユーザA,Bはクラスタ「1」に分類され、ユーザCはクラスタ「2」に分類され、ユーザD,Eはクラスタ「3」に分類されている。 In each genre, the viewing history analysis unit 11 identifies the cluster to which each viewer belongs, and adds a cluster ID to each second intermediate record. FIG. 8 is a diagram showing an example of a second intermediate record to which a cluster ID is added. This example shows the second intermediate record 303 of five users A, B, C, D, and E for genre ID "3". Users A and B are classified into cluster "1", user C is classified into cluster "2", and users D and E are classified into cluster "3".

ステップS24では、閲覧履歴解析部11はジャンルおよびクラスタの組合せ毎に特徴ベクトルを合算して第1候補キーワード情報を生成する。閲覧履歴解析部11はジャンルおよびクラスタの組合せのそれぞれについて、該組合せに対応する1以上の第2中間レコードの特徴ベクトルを合算し、この計算結果を示す第3中間レコードを生成する。この合算も、1以上の第1候補キーワードのそれぞれについて特徴量の和を求める処理である。第3中間レコードは第1候補キーワード情報のレコードに対応する。図8は、第2中間レコード303の特徴ベクトルを合算して第3中間レコード304を生成する処理をさらに示す。ジャンルID「3」およびクラスタID「1」の組合せについていうと、閲覧履歴解析部11は第1候補キーワード「サッカー」の特徴量を2.5+1.0=3.5と合算し、第1候補キーワード「サッカーW杯」の特徴量を0.7+1.0=1.7と合算する。第1候補キーワード「日本代表」、「チームR」、「イングランド代表」はそれぞれ1レコードでしか現われていないので、これら3語の特徴量はそのまま第3中間レコード304に組み込まれる。閲覧履歴解析部11はクラスタID「2」、「3」のそれぞれについても同様に第3中間レコード304を生成する。 In step S24, the viewing history analysis unit 11 generates first candidate keyword information by summing the feature vectors for each combination of genre and cluster. For each combination of genre and cluster, browsing history analysis unit 11 sums the feature vectors of one or more second intermediate records corresponding to the combination, and generates a third intermediate record indicating this calculation result. This addition is also a process of obtaining the sum of feature amounts for each of the one or more first candidate keywords. The third intermediate record corresponds to the record of the first candidate keyword information. FIG. 8 further illustrates the process of summing the feature vectors of the second intermediate record 303 to generate the third intermediate record 304 . Regarding the combination of the genre ID “3” and the cluster ID “1”, the browsing history analysis unit 11 sums the feature amount of the first candidate keyword “soccer” as 2.5+1.0=3.5, and obtains the first candidate The feature amount of the keyword “soccer world cup” is summed up as 0.7+1.0=1.7. Since the first candidate keywords "Japan national team", "Team R", and "England national team" appear only in one record each, the feature values of these three words are incorporated into the third intermediate record 304 as they are. The browsing history analysis unit 11 similarly generates the third intermediate records 304 for each of the cluster IDs "2" and "3".

ステップS25では、閲覧履歴解析部11は生成された1以上の第3中間レコードを第1候補キーワード情報のレコードとして第1候補キーワードデータベース33に登録する。或るジャンルおよびクラスタの組合せについて、第1候補キーワードデータベース33がその組合せに対応するレコードを既に記憶している場合には、閲覧履歴解析部11はそのレコードを第3中間レコードで上書きすることで第1候補キーワード情報を更新する。 In step S25, the browsing history analysis unit 11 registers the generated one or more third intermediate records in the first candidate keyword database 33 as records of first candidate keyword information. If the first candidate keyword database 33 already stores a record corresponding to the combination of genre and cluster, the browsing history analysis unit 11 overwrites the record with the third intermediate record. Update the first candidate keyword information.

図3に戻り、ステップS12では、第1選択部13は処理フローS2によって予め用意された第1候補キーワード情報に基づいて少なくとも一つの第1キーワードを選択する。第1選択部13は、要求に対応するジャンルと対象ユーザが属するクラスタとの組合せに対応する1以上の第1候補キーワードのうちの少なくとも一つを第1キーワードとして選択する。第1選択部13は第1候補キーワードデータベース33を参照して、その組合せに対応するレコードを読み出し、相対的に特徴量が高い第1候補キーワードを第1キーワードとして選択する。例えば、第1選択部13は特徴量の降順に第1候補キーワードを並べた上で、先頭から1以上の第1候補キーワードを第1キーワードとして選択してもよい。このように、第1選択部13は対象ユーザが属するクラスタに対応する1以上の特徴ベクトルに基づいて複数の第1候補キーワードから少なくとも一つの第1キーワードを選択する。具体的には、第1選択部13は対象ユーザが属するジャンルおよびクラスタの組合せに対応する1以上の特徴ベクトルに基づいて1以上の第1キーワードを選択する。典型的には、第1選択部13は要求に対応するジャンルと対象ユーザが属するクラスタとに対応する1以上の特徴ベクトルに基づいて1以上の第1キーワードを選択する。 Returning to FIG. 3, in step S12, the first selection unit 13 selects at least one first keyword based on the first candidate keyword information prepared in advance by the process flow S2. The first selection unit 13 selects at least one of the one or more first candidate keywords corresponding to the combination of the genre corresponding to the request and the cluster to which the target user belongs, as the first keyword. The first selection unit 13 refers to the first candidate keyword database 33, reads a record corresponding to the combination, and selects a first candidate keyword having a relatively high feature amount as the first keyword. For example, the first selection unit 13 may arrange the first candidate keywords in descending order of feature amount, and then select one or more first candidate keywords from the top as the first keyword. Thus, the first selection unit 13 selects at least one first keyword from a plurality of first candidate keywords based on one or more feature vectors corresponding to the cluster to which the target user belongs. Specifically, the first selection unit 13 selects one or more first keywords based on one or more feature vectors corresponding to a combination of genres and clusters to which the target user belongs. Typically, the first selection unit 13 selects one or more first keywords based on one or more feature vectors corresponding to the genre corresponding to the request and the cluster to which the target user belongs.

ステップS13では、第2選択部14が要求に応答して少なくとも一つの第2キーワードを選択する。ステップS13の詳細を図9に示す。図9は第2キーワードを選択する処理の一例を示すフローチャートである。 In step S13, the second selection unit 14 selects at least one second keyword in response to the request. Details of step S13 are shown in FIG. FIG. 9 is a flowchart showing an example of processing for selecting a second keyword.

ステップS131では、第2選択部14はメタ情報データベースを参照してキーワードを取得する。例えば、第2選択部14は出現頻度が所定の基準よりも大きいキーワードを取得する。具体的には、第2選択部14は所定数のキーワードを出現頻度の降順に取得してもよいし、出現頻度が所定の閾値以上であるキーワードを取得してもよい。1以上のジャンルが要求によって指定されている場合には、第2選択部14はその指定されたジャンルに属するキーワードを取得する。 In step S131, the second selection unit 14 refers to the meta information database and acquires keywords. For example, the second selection unit 14 acquires keywords whose frequency of appearance is higher than a predetermined standard. Specifically, the second selection unit 14 may acquire a predetermined number of keywords in descending order of appearance frequency, or may acquire keywords whose appearance frequency is equal to or higher than a predetermined threshold. If one or more genres are specified by the request, the second selection unit 14 acquires keywords belonging to the specified genres.

ステップS132では、第2選択部14は表記揺れを吸収することで第2候補キーワードを特定する。第2選択部14はキーワード辞書を参照して、ステップS131で取得したキーワードのそれぞれについて主語句を特定し、その主語句を第2候補キーワードとして特定する。第2選択部14は、キーワードが主語句であればそのキーワードをそのまま第2候補キーワードとして特定し、キーワードが副語句であればそのキーワードに対応する主語句を第2候補キーワードとして特定する。この処理の結果、複数のキーワードが一つの主語句に対応する場合には、第2選択部14は該複数のキーワードの出現頻度を合算することで、第2候補キーワードの出現頻度を得る。この処理によって、第2選択部14はそれぞれの第2候補キーワードの出現頻度を示す中間リストを得る。 In step S132, the second selection unit 14 identifies the second candidate keyword by absorbing spelling variations. The second selection unit 14 refers to the keyword dictionary, specifies the subject phrase for each of the keywords acquired in step S131, and specifies the subject phrase as the second candidate keyword. If the keyword is a subject phrase, the second selection unit 14 identifies the keyword as it is as the second candidate keyword, and if the keyword is a subphrase, identifies the subject phrase corresponding to the keyword as the second candidate keyword. As a result of this processing, when a plurality of keywords correspond to one subject phrase, the second selection unit 14 adds up the frequency of appearance of the plurality of keywords to obtain the frequency of appearance of the second candidate keyword. Through this process, the second selection unit 14 obtains an intermediate list indicating the appearance frequency of each second candidate keyword.

ステップS133では、第2選択部14は特定の第2候補キーワードを排除する。排除の条件は限定されず、任意の方針で設定されてよい。例えば、第2選択部14は、文字数が所定の閾値以上である第2候補キーワードを排除することで、文字数が長い第2候補キーワードが第2キーワードとして選択されることを防止してもよい。あるいは、第2選択部14は予め定められたルールに基づいて、公序良俗の観点から相応しくない第2候補キーワードを排除してもよい。あるいは、第2選択部14は第2候補キーワードに対応する第1コンテンツを検索して、該検索によって抽出される第1コンテンツの個数をヒット数として取得し、そのヒット数が所定の閾値未満である第2候補キーワードを排除してもよい。この処理によって、対応する第1コンテンツが少ない第2候補キーワードが第2キーワードとして選択されることを防止できる。言い換えると、第2選択部14は、ヒット数が所定の閾値以上である第2候補キーワードを残す。第2選択部14はこれら3種類の条件のうちの任意の2以上を用いて第2候補キーワードを排除してもよい。 In step S133, the second selection unit 14 excludes specific second candidate keywords. Conditions for exclusion are not limited and may be set by any policy. For example, the second selection unit 14 may prevent a second candidate keyword having a long number of characters from being selected as the second keyword by excluding second candidate keywords having a number of characters equal to or greater than a predetermined threshold. Alternatively, the second selection unit 14 may exclude second candidate keywords that are inappropriate from the viewpoint of public order and morals, based on predetermined rules. Alternatively, the second selection unit 14 searches for the first content corresponding to the second candidate keyword, acquires the number of the first content extracted by the search as the number of hits, and if the number of hits is less than a predetermined threshold, Certain second candidate keywords may be excluded. This processing can prevent a second candidate keyword with few corresponding first contents from being selected as a second keyword. In other words, the second selection unit 14 leaves the second candidate keywords whose number of hits is equal to or greater than the predetermined threshold. The second selection unit 14 may exclude the second candidate keyword using any two or more of these three types of conditions.

ステップS134では、第2選択部14は残った第2候補キーワードを第2キーワードとして選択する。以上の処理により、第2選択部14は1以上の第2キーワードを選択する。 In step S134, the second selection unit 14 selects the remaining second candidate keywords as second keywords. Through the above processing, the second selection unit 14 selects one or more second keywords.

図3に戻って、ステップS14では、リスト生成部15が少なくとも一つの第1キーワードと少なくとも一つの第2キーワードとを含むキーワードリストを生成する。一例では、リスト生成部15は複数の第1キーワードから一部をランダムに選択し、複数の第2キーワードから一部をランダムに選択する。 Returning to FIG. 3, in step S14, the list generator 15 generates a keyword list including at least one first keyword and at least one second keyword. In one example, the list generator 15 randomly selects some of the plurality of first keywords and randomly selects some of the plurality of second keywords.

別の例では、リスト生成部15はユーザデータベース35にアクセスして、対象ユーザに対応するキーワード情報を読み出すことで、第2キーワードとして対象ユーザによって提示され且つ該対象ユーザによって選択されたキーワードの個数を特定する。そして、リスト生成部15はその個数が所定の閾値未満である場合には、キーワードリストにおける第2キーワードの割合をPaに設定し、その個数が該閾値以上である場合にはその割合をPb(ただし、Pb<Pa)に設定する。これは、自身が関心を持つキーワードを多く選択する傾向がある対象ユーザに、他の人々が感心を持つキーワードをより多く提示することを意図する。Pa+Pb=100(%)になるように割合Pa,Pbが設定されてもよい。 In another example, the list generating unit 15 accesses the user database 35 and reads out keyword information corresponding to the target user, thereby determining the number of keywords presented by the target user as the second keywords and selected by the target user. identify. Then, the list generation unit 15 sets the ratio of the second keywords in the keyword list to Pa when the number is less than the predetermined threshold, and sets the ratio to Pb ( However, it is set to Pb<Pa). This is intended to present more keywords that other people are interested in to target users who tend to select more keywords that interest them. The ratios Pa and Pb may be set so that Pa+Pb=100(%).

あるいは、リスト生成部15は、ユーザIDに対応する、ジャンルIDおよびクラスタIDの組合せの個数を特定する。そして、リスト生成部15は、その個数が所定の閾値未満である場合には、キーワードリストにおける第2キーワードの割合をPcに設定し、その個数が該閾値以上である場合にはその割合をPd(ただし、Pd<Pc)に設定する。これは、自身の関心の範囲が狭い傾向がある対象ユーザに、様々な分野のキーワードをより多く提示することを意図する。Pc+Pd=100(%)になるように割合Pc,Pdが設定されてもよい。 Alternatively, the list generator 15 identifies the number of combinations of genre IDs and cluster IDs corresponding to user IDs. Then, the list generating unit 15 sets the ratio of the second keywords in the keyword list to Pc when the number is less than the predetermined threshold, and sets the ratio to Pd when the number is equal to or greater than the threshold. (However, Pd<Pc). This is intended to present more keywords in various fields to target users who tend to have narrower interests. The ratios Pc and Pd may be set so that Pc+Pd=100(%).

リスト生成部15はキーワードリスト内で第1キーワードおよび第2キーワードをシャッフルしてもよい。同じ語句が第1キーワードおよび第2キーワードの双方から選択された場合には、リスト生成部15はその語句を重複してキーワードリストに含めるのではなく、一つのみをキーワードリストに含める。一例では、リスト生成部15は第1キーワードおよび第2キーワードのそれぞれに、対応するキーワード種別を関連付ける。 The list generator 15 may shuffle the first keyword and the second keyword within the keyword list. When the same word/phrase is selected from both the first keyword and the second keyword, the list generation unit 15 does not duplicate the word/phrase in the keyword list, but includes only one word/phrase in the keyword list. In one example, the list generator 15 associates each of the first keyword and the second keyword with the corresponding keyword type.

ステップS15では、送信部16がキーワードリストをユーザ端末20に送信する。ユーザ端末20はそのキーワードリストを受信および表示する。例えば、ユーザ端末20は図1に示すキーワードリスト202を表示する。送信部16は、第1情報源での第1コンテンツの検索のために用いられるキーワードを対象ユーザに提供するためにキーワードリストをユーザ端末20上に表示させてもよい。 In step S<b>15 , the transmission unit 16 transmits the keyword list to the user terminal 20 . User terminal 20 receives and displays the keyword list. For example, the user terminal 20 displays the keyword list 202 shown in FIG. The transmitting unit 16 may cause the keyword list to be displayed on the user terminal 20 in order to provide the target user with keywords used for searching for the first content in the first information source.

コンテンツのジャンルは必須の構成要素ではなく、したがって、情報提供システム1はジャンルを考慮することなく、キーワードリストを生成および送信するための一連の処理を実行してもよい。 The genre of content is not an essential component, and therefore the information providing system 1 may perform a series of processes for generating and transmitting keyword lists without considering genre.

閲覧履歴解析部11および第1候補キーワードデータベース33は必須の構成要素ではなく、第1選択部13が閲覧履歴解析部11の役割も担ってもよい。この場合、第1選択部13は要求に応答して閲覧履歴データベース31および第1コンテンツデータベース32を参照し、閲覧履歴に基づいて少なくとも一つの第1キーワードを選択する。すなわち、閲覧履歴に基づいて少なくとも一つの第1キーワードを選択する一連の処理は、上記実施形態のように定期的なバッチ処理を含んでもよいし、すべてリアルタイムに処理されてもよい。 The viewing history analysis unit 11 and the first candidate keyword database 33 are not essential components, and the first selection unit 13 may also play the role of the viewing history analysis unit 11 . In this case, the first selection unit 13 refers to the browsing history database 31 and the first content database 32 in response to the request, and selects at least one first keyword based on the browsing history. That is, a series of processes for selecting at least one first keyword based on browsing history may include periodic batch processing as in the above embodiment, or may be processed in real time.

上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。 The block diagrams used in the description of the above embodiments show blocks for each function. These functional blocks (components) are realized by any combination of at least one of hardware and software. Also, the method of implementing each functional block is not particularly limited. That is, each functional block may be implemented using one device that is physically or logically coupled, or directly or indirectly using two or more devices that are physically or logically separated (e.g. , wired, wireless, etc.) and may be implemented using these multiple devices. A functional block may be implemented by combining software in the one device or the plurality of devices.

機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)または送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。 Functions include judging, determining, determining, calculating, calculating, processing, deriving, investigating, searching, checking, receiving, transmitting, outputting, accessing, resolving, selecting, choosing, establishing, comparing, assuming, expecting, assuming, Broadcasting, notifying, communicating, forwarding, configuring, reconfiguring, allocating, mapping, assigning, etc. can't For example, the functional block responsible for transmission is called a transmitting unit or transmitter. In either case, as described above, the implementation method is not particularly limited.

例えば、本開示の一実施の形態における情報提供システム1またはサーバ10は、本開示の処理を行うコンピュータとして機能してもよい。図10は、情報提供システム1またはサーバ10として機能するコンピュータ100のハードウェア構成の一例を示す図である。コンピュータ100は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含んでもよい。 For example, the information providing system 1 or the server 10 in one embodiment of the present disclosure may function as a computer that performs the processing of the present disclosure. FIG. 10 is a diagram showing an example of a hardware configuration of a computer 100 functioning as the information providing system 1 or server 10. As shown in FIG. Computer 100 may physically include processor 1001, memory 1002, storage 1003, communication device 1004, input device 1005, output device 1006, bus 1007, and the like.

なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。サーバ10のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。 Note that in the following description, the term "apparatus" can be read as a circuit, device, unit, or the like. The hardware configuration of the server 10 may be configured to include one or more of each device shown in the figure, or may be configured without some of the devices.

サーバ10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。 Each function in the server 10 is performed by causing the processor 1001 to perform calculations, controlling communication by the communication device 1004, controlling communication by the communication device 1004, and controlling the communication by the memory 1002 and It is realized by controlling at least one of data reading and writing in the storage 1003 .

プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。 The processor 1001, for example, operates an operating system to control the entire computer. The processor 1001 may be configured by a central processing unit (CPU) including an interface with peripheral devices, a control device, an arithmetic device, registers, and the like.

また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、サーバ10の各機能要素は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されてもよい。 The processor 1001 also reads programs (program codes), software modules, data, etc. from at least one of the storage 1003 and the communication device 1004 to the memory 1002, and executes various processes according to these. As the program, a program that causes a computer to execute at least part of the operations described in the above embodiments is used. For example, each functional element of the server 10 may be stored in the memory 1002 and implemented by a control program running on the processor 1001 . Although it has been explained that the above-described various processes are executed by one processor 1001, they may be executed simultaneously or sequentially by two or more processors 1001. FIG. Processor 1001 may be implemented by one or more chips. Note that the program may be transmitted from a network via an electric communication line.

メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。 The memory 1002 is a computer-readable recording medium, and is composed of at least one of, for example, ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), and RAM (Random Access Memory). may be The memory 1002 may also be called a register, cache, main memory (main storage device), or the like. The memory 1002 can store executable programs (program code), software modules, etc. to perform a method according to an embodiment of the present disclosure.

ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。 The storage 1003 is a computer-readable recording medium, for example, an optical disc such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disc, a magneto-optical disc (for example, a compact disc, a digital versatile disc, a Blu-ray disk), smart card, flash memory (eg, card, stick, key drive), floppy disk, magnetic strip, and/or the like. Storage 1003 may also be called an auxiliary storage device. The storage medium described above may be, for example, a database, server, or other suitable medium including at least one of memory 1002 and storage 1003 .

通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。 The communication device 1004 is hardware (transmitting/receiving device) for communicating between computers via at least one of a wired network and a wireless network, and is also called a network device, a network controller, a network card, a communication module, or the like. The communication device 1004 includes a high-frequency switch, a duplexer, a filter, a frequency synthesizer, and the like, for example, in order to realize at least one of frequency division duplex (FDD) and time division duplex (TDD). may consist of

入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカ、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。 The input device 1005 is an input device (for example, keyboard, mouse, microphone, switch, button, sensor, etc.) that receives input from the outside. The output device 1006 is an output device (for example, display, speaker, LED lamp, etc.) that outputs to the outside. Note that the input device 1005 and the output device 1006 may be integrated (for example, a touch panel).

また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。 Devices such as the processor 1001 and the memory 1002 are connected by a bus 1007 for communicating information. The bus 1007 may be configured using a single bus, or may be configured using different buses between devices.

また、コンピュータ100は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。 Further, the computer 100 includes hardware such as a microprocessor, a digital signal processor (DSP), an ASIC (Application Specific Integrated Circuit), a PLD (Programmable Logic Device), and an FPGA (Field Programmable Gate Array). A part or all of each functional block may be implemented by the hardware. For example, processor 1001 may be implemented using at least one of these pieces of hardware.

以上説明したように、本開示の一側面に係る情報提供システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、対象ユーザを含む複数の閲覧者が第1情報源から提供される第1コンテンツにアクセスしたことを示す閲覧履歴を記憶する第1データベースを参照し、該閲覧履歴に基づいて少なくとも一つの第1キーワードを選択し、第2情報源から提供される第2コンテンツでのキーワードの出現頻度を示すメタ情報を記憶する第2データベースを参照し、該メタ情報に基づいて少なくとも一つの第2キーワードを選択し、少なくとも一つの第1キーワードのうちの少なくとも一つと、少なくとも一つの第2キーワードのうちの少なくとも一つとを含むキーワードリストを生成し、キーワードリストを対象ユーザの端末上に表示させる。 As described above, the information providing system according to one aspect of the present disclosure includes at least one processor. At least one processor refers to a first database that stores browsing histories indicating that a plurality of viewers, including the target user, have accessed first content provided from a first information source, and based on the browsing histories, selecting at least one first keyword, referring to a second database storing meta information indicating frequency of occurrence of the keyword in second content provided from a second information source, and based on the meta information, at least one selecting a second keyword, generating a keyword list including at least one of the at least one first keyword and at least one of the at least one second keyword, and displaying the keyword list on the terminal of the target user; Let

このような側面においては、第1情報源に関する閲覧履歴に基づいて選択された第1キーワードと、第2情報源での出現頻度に基づいて選択された第2キーワードとの双方を含むキーワードリストが対象ユーザの端末上に表示される。第1キーワードは対象ユーザの関心が高いと推定されるキーワードであるといえ、第2キーワードは人々の間で関心が高いと推定されるキーワードであるといえる。したがって、これら2種類のキーワードの混合を端末上に表示させることで、対象ユーザによって用いられる蓋然性が高いキーワードを精度良く提供することが可能になる。 In such an aspect, a keyword list including both a first keyword selected based on the browsing history regarding the first information source and a second keyword selected based on the appearance frequency in the second information source is provided. Displayed on the terminal of the target user. It can be said that the first keyword is a keyword that is presumed to be of high interest to the target user, and that the second keyword is a keyword that is presumed to be of high interest to people. Therefore, by displaying a mixture of these two types of keywords on the terminal, it is possible to accurately provide keywords that are likely to be used by the target user.

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、閲覧履歴で示されるそれぞれのアクセスについて第1コンテンツから1以上の第1候補キーワードを特定し、閲覧履歴で示されるそれぞれのアクセスについて、1以上の第1候補キーワードのそれぞれについて特徴量を算出し、第1候補キーワードおよび特徴量の1以上の組合せを含む特徴ベクトルを生成し、それぞれの特徴ベクトルに基づいて複数の閲覧者をクラスタリングすることで複数のクラスタを生成し、対象ユーザが属するクラスタに対応する1以上の特徴ベクトルに基づいて、複数の第1候補キーワードから少なくとも一つの第1キーワードを選択してもよい。第1候補キーワードの特徴量を示す特徴ベクトルに基づいて閲覧者をクラスタリングし、対象ユーザが属するクラスタに対応する特徴ベクトルに基づいて第1キーワードを選択することで、対象ユーザの関心が高いと推定されるキーワードを高い精度で提供することができる。 In the information providing system according to another aspect, at least one processor identifies one or more first candidate keywords from the first content for each access indicated by the browsing history, and for each access indicated by the browsing history, A feature amount is calculated for each of the one or more first candidate keywords, a feature vector including one or more combinations of the first candidate keyword and the feature amount is generated, and a plurality of viewers are clustered based on each feature vector. By doing so, a plurality of clusters may be generated, and at least one first keyword may be selected from the plurality of first candidate keywords based on one or more feature vectors corresponding to the cluster to which the target user belongs. By clustering the viewers based on the feature vector indicating the feature amount of the first candidate keyword and selecting the first keyword based on the feature vector corresponding to the cluster to which the target user belongs, it is estimated that the target user is highly interested. It is possible to provide keywords with high accuracy.

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、閲覧者と第1コンテンツのジャンルとの組合せ毎に特徴ベクトルを合算し、ジャンル毎に、複数の閲覧者をクラスタリングすることで複数のクラスタを生成し、対応するジャンルと対象ユーザが属するクラスタとの組合せに対応する特徴ベクトルに基づいて少なくとも一つの第1キーワードを選択してもよい。第1コンテンツのジャンルを考慮して閲覧者をクラスタリングし特徴ベクトルを選択することで、対象ユーザの関心が高いジャンルに対応するキーワードを提供することができる。 In the information providing system according to another aspect, at least one processor sums the feature vectors for each combination of the viewer and the genre of the first content, and clusters the plurality of viewers for each genre. Clusters may be generated and at least one first keyword may be selected based on feature vectors corresponding to combinations of corresponding genres and clusters to which the target user belongs. By clustering viewers in consideration of the genre of the first content and selecting a feature vector, it is possible to provide keywords corresponding to the genre of which the target user is highly interested.

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、1以上の第1候補キーワードのそれぞれについて、所定の基準特徴量を取得し、1以上の第1候補キーワードのそれぞれについて、該第1候補キーワードに対応する第1コンテンツが生成されてからの経過時間と、該第1コンテンツに対する閲覧操作とのうちの少なくとも一つに基づいて重みを設定し、1以上の第1候補キーワードのそれぞれについて、基準特徴量に重みを適用することで特徴量を算出してもよい。この処理によって、特徴量は第1コンテンツの鮮度と第1コンテンツに対する閲覧者の関心の度合いとを示す。このような特徴量に基づいて第1キーワードを選択することで、対象ユーザの関心が高いと推定されるキーワードを高い精度で提供することができる。 In the information providing system according to another aspect, at least one processor obtains a predetermined reference feature amount for each of the one or more first candidate keywords, and for each of the one or more first candidate keywords, obtains the first A weight is set based on at least one of the elapsed time since the first content corresponding to the candidate keyword was generated and the viewing operation for the first content, and for each of the one or more first candidate keywords , the feature amount may be calculated by applying a weight to the reference feature amount. Through this process, the feature quantity indicates the freshness of the first content and the degree of interest of the viewer in the first content. By selecting the first keyword based on such a feature amount, it is possible to provide a keyword that is estimated to be of high interest to the target user with high accuracy.

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、出現頻度が所定の基準よりも大きいキーワードを少なくとも一つの第2キーワードとして選択してもよい。この場合には、人々の間で特に関心が高いと推定されるキーワードを提供することができる。 In the information providing system according to another aspect, at least one processor may select, as at least one second keyword, a keyword whose appearance frequency is higher than a predetermined standard. In this case, keywords that are presumed to be of particular interest to people can be provided.

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、メタ情報で示される1以上のキーワードのそれぞれについて、該キーワードに対応する第1コンテンツのヒット数を取得し、ヒット数が所定の閾値以上である場合に、該キーワードを少なくとも一つの第2キーワードとして選択してもよい。この処理により、人々の間で関心が高く、且つ第1コンテンツの検索に貢献できると推定されるキーワードを提供することができる。 In the information providing system according to another aspect, at least one processor acquires the number of hits of the first content corresponding to each of the one or more keywords indicated by the meta information, and the number of hits exceeds a predetermined threshold. If so, the keyword may be selected as at least one second keyword. Through this process, it is possible to provide keywords that are of high interest among people and that are estimated to contribute to searches for the first content.

他の側面に係る情報提供システムでは、少なくとも一つのプロセッサが、第1情報源での第1コンテンツの検索のために用いられるキーワードを対象ユーザに提供するために、キーワードリストを端末上に表示させてもよい。この場合には、対象ユーザが第1コンテンツを検索するために用いる蓋然性が高いキーワードを精度良く提供することが可能になる。 In the information providing system according to another aspect, at least one processor causes a keyword list to be displayed on a terminal in order to provide a target user with keywords used for searching for first content in a first information source. may In this case, it is possible to accurately provide keywords that are highly likely to be used by the target user to search for the first content.

以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。 Although the present disclosure has been described in detail above, it should be apparent to those skilled in the art that the present disclosure is not limited to the embodiments described in this disclosure. The present disclosure can be practiced with modifications and variations without departing from the spirit and scope of the present disclosure as defined by the claims. Accordingly, the description of the present disclosure is for illustrative purposes and is not meant to be limiting in any way.

情報の通知は、本開示において説明した態様/実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。 Notification of information is not limited to the aspects/embodiments described in this disclosure, and may be performed using other methods. For example, notification of information includes physical layer signaling (e.g., DCI (Downlink Control Information), UCI (Uplink Control Information)), higher layer signaling (e.g., RRC (Radio Resource Control) signaling, MAC (Medium Access Control) signaling, It may be implemented by broadcast information (MIB (Master Information Block), SIB (System Information Block)), other signals, or a combination thereof. RRC signaling may also be called an RRC message, and may be, for example, an RRC connection setup message, an RRC connection reconfiguration message, or the like.

本開示において説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G(4th generation mobile communication system)、5G(5th generation mobile communication system)、FRA(Future Radio Access)、NR(new Radio)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi(登録商標))、IEEE 802.16(WiMAX(登録商標))、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて(例えば、LTE及びLTE-Aの少なくとも一方と5Gとの組み合わせ等)適用されてもよい。 Each aspect/embodiment described in the present disclosure includes LTE (Long Term Evolution), LTE-A (LTE-Advanced), SUPER 3G, IMT-Advanced, 4G (4th generation mobile communication system), 5G (5th generation mobile communication system), FRA (Future Radio Access), NR (new Radio), W-CDMA (registered trademark), GSM (registered trademark), CDMA2000, UMB (Ultra Mobile Broadband), IEEE 802.11 (Wi-Fi (registered trademark) )), IEEE 802.16 (WiMAX®), IEEE 802.20, UWB (Ultra-WideBand), Bluetooth®, and other suitable systems and extended It may be applied to at least one of the next generation systems. Also, a plurality of systems may be applied in combination (for example, a combination of at least one of LTE and LTE-A and 5G, etc.).

本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。 The processing procedures, sequences, flowcharts, etc. of each aspect/embodiment described in this disclosure may be rearranged as long as there is no contradiction. For example, the methods described in this disclosure present elements of the various steps using a sample order, and are not limited to the specific order presented.

本開示において基地局によって行われるとした特定動作は、場合によってはその上位ノード(upper node)によって行われることもある。基地局を有する1つ又は複数のネットワークノード(network nodes)からなるネットワークにおいて、端末との通信のために行われる様々な動作は、基地局及び基地局以外の他のネットワークノード(例えば、MME又はS-GWなどが考えられるが、これらに限られない)の少なくとも1つによって行われ得ることは明らかである。上記において基地局以外の他のネットワークノードが1つである場合を例示したが、複数の他のネットワークノードの組み合わせ(例えば、MME及びS-GW)であってもよい。 Certain operations that are described in this disclosure as being performed by a base station may also be performed by its upper node in some cases. In a network consisting of one or more network nodes with a base station, various operations performed for communication with a terminal may be performed by the base station and other network nodes other than the base station (e.g. MME or S-GW, etc. (including but not limited to). Although the case where there is one network node other than the base station is exemplified above, it may be a combination of a plurality of other network nodes (for example, MME and S-GW).

情報等は、上位レイヤ(又は下位レイヤ)から下位レイヤ(又は上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。 Information, etc., may be output from a higher layer (or lower layer) to a lower layer (or higher layer). It may be input and output via multiple network nodes.

入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。 Input/output information and the like may be stored in a specific location (for example, memory), or may be managed using a management table. Input/output information and the like can be overwritten, updated, or appended. The output information and the like may be deleted. The entered information and the like may be transmitted to another device.

判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。 The determination may be made by a value represented by one bit (0 or 1), by a true/false value (Boolean: true or false), or by numerical comparison (for example, a predetermined value).

本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。 Each aspect/embodiment described in the present disclosure may be used alone, may be used in combination, or may be used by switching according to execution. In addition, the notification of predetermined information (for example, notification of “being X”) is not limited to being performed explicitly, but may be performed implicitly (for example, not notifying the predetermined information). good too.

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。 Software, whether referred to as software, firmware, middleware, microcode, hardware description language or otherwise, includes instructions, instruction sets, code, code segments, program code, programs, subprograms, and software modules. , applications, software applications, software packages, routines, subroutines, objects, executables, threads of execution, procedures, functions, and the like.

また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。 Software, instructions, information, etc. may also be sent and received over a transmission medium. For example, the software uses wired technology (coaxial cable, fiber optic cable, twisted pair, Digital Subscriber Line (DSL), etc.) and/or wireless technology (infrared, microwave, etc.) to create websites, Wired and/or wireless technologies are included within the definition of transmission medium when sent from a server or other remote source.

本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。 Information, signals, etc. described in this disclosure may be represented using any of a variety of different technologies. For example, data, instructions, commands, information, signals, bits, symbols, chips, etc. that may be referred to throughout the above description may refer to voltages, currents, electromagnetic waves, magnetic fields or magnetic particles, light fields or photons, or any of these. may be represented by a combination of

なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。例えば、チャネル及びシンボルの少なくとも一方は信号(シグナリング)であってもよい。また、信号はメッセージであってもよい。また、コンポーネントキャリア(CC:Component Carrier)は、キャリア周波数、セル、周波数キャリアなどと呼ばれてもよい。 The terms explained in this disclosure and the terms necessary for understanding the present disclosure may be replaced with terms having the same or similar meanings. For example, the channel and/or symbols may be signaling. A signal may also be a message. A component carrier (CC) may also be called a carrier frequency, a cell, a frequency carrier, or the like.

本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。 As used in this disclosure, the terms "system" and "network" are used interchangeably.

また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。例えば、無線リソースはインデックスによって指示されるものであってもよい。 In addition, the information, parameters, etc. described in the present disclosure may be expressed using absolute values, may be expressed using relative values from a predetermined value, or may be expressed using other corresponding information. may be represented. For example, radio resources may be indexed.

上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々なチャネル(例えば、PUCCH、PDCCHなど)及び情報要素は、あらゆる好適な名称によって識別できるので、これらの様々なチャネル及び情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。 The names used for the parameters described above are not limiting names in any way. Further, the formulas, etc., using these parameters may differ from those expressly disclosed in this disclosure. Since the various channels (e.g., PUCCH, PDCCH, etc.) and information elements can be identified by any suitable name, the various names assigned to these various channels and information elements are in no way restrictive names. is not.

本開示においては、「基地局(BS:Base Station)」、「無線基地局」、「固定局(fixed station)」、「NodeB」、「eNodeB(eNB)」、「gNodeB(gNB)」、「アクセスポイント(access point)」、「送信ポイント(transmission point)」、「受信ポイント(reception point)、「送受信ポイント(transmission/reception point)」、「セル」、「セクタ」、「セルグループ」、「キャリア」、「コンポーネントキャリア」などの用語は、互換的に使用され得る。基地局は、マクロセル、スモールセル、フェムトセル、ピコセルなどの用語で呼ばれる場合もある。 In the present disclosure, "base station (BS)", "radio base station", "fixed station", "NodeB", "eNodeB (eNB)", "gNodeB (gNB)", " "access point", "transmission point", "reception point", "transmission/reception point", "cell", "sector", "cell group", " Terms such as "carrier", "component carrier" may be used interchangeably. A base station may also be referred to by terms such as macrocell, small cell, femtocell, picocell, and the like.

基地局は、1つ又は複数(例えば、3つ)のセルを収容することができる。基地局が複数のセルを収容する場合、基地局のカバレッジエリア全体は複数のより小さいエリアに区分でき、各々のより小さいエリアは、基地局サブシステム(例えば、屋内用の小型基地局(RRH:Remote Radio Head)によって通信サービスを提供することもできる。「セル」又は「セクタ」という用語は、このカバレッジにおいて通信サービスを行う基地局及び基地局サブシステムの少なくとも一方のカバレッジエリアの一部又は全体を指す。 A base station may serve one or more (eg, three) cells. When a base station accommodates multiple cells, the overall coverage area of the base station can be partitioned into multiple smaller areas, each smaller area being associated with a base station subsystem (e.g., an indoor small base station (RRH: The term "cell" or "sector" refers to part or all of the coverage area of a base station and/or base station subsystem serving communication in this coverage. point to

本開示においては、「移動局(MS:Mobile Station)」、「ユーザ端末(user terminal)」、「ユーザ装置(UE:User Equipment)」、「端末」などの用語は、互換的に使用され得る。 In this disclosure, terms such as “Mobile Station (MS),” “user terminal,” “User Equipment (UE),” “terminal,” etc. may be used interchangeably. .

移動局は、当業者によって、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、又はいくつかの他の適切な用語で呼ばれる場合もある。 A mobile station is defined by those skilled in the art as a subscriber station, mobile unit, subscriber unit, wireless unit, remote unit, mobile device, wireless device, wireless communication device, remote device, mobile subscriber station, access terminal, mobile terminal, wireless It may also be called a terminal, remote terminal, handset, user agent, mobile client, client, or some other suitable term.

基地局及び移動局の少なくとも一方は、送信装置、受信装置、通信装置などと呼ばれてもよい。なお、基地局及び移動局の少なくとも一方は、移動体に搭載されたデバイス、移動体自体などであってもよい。当該移動体は、乗り物(例えば、車、飛行機など)であってもよいし、無人で動く移動体(例えば、ドローン、自動運転車など)であってもよいし、ロボット(有人型又は無人型)であってもよい。なお、基地局及び移動局の少なくとも一方は、必ずしも通信動作時に移動しない装置も含む。例えば、基地局及び移動局の少なくとも一方は、センサなどのIoT(Internet of Things)機器であってもよい。 At least one of a base station and a mobile station may be called a transmitter, a receiver, a communication device, and the like. At least one of the base station and the mobile station may be a device mounted on a mobile object, the mobile object itself, or the like. The mobile object may be a vehicle (e.g., car, airplane, etc.), an unmanned mobile object (e.g., drone, self-driving car, etc.), or a robot (manned or unmanned ). Note that at least one of the base station and the mobile station includes devices that do not necessarily move during communication operations. For example, at least one of the base station and the mobile station may be an IoT (Internet of Things) device such as a sensor.

また、本開示における基地局は、ユーザ端末で読み替えてもよい。例えば、基地局及びユーザ端末間の通信を、複数のユーザ端末間の通信(例えば、D2D(Device-to-Device)、V2X(Vehicle-to-Everything)などと呼ばれてもよい)に置き換えた構成について、本開示の各態様/実施形態を適用してもよい。この場合、基地局が有する機能をユーザ端末が有する構成としてもよい。また、「上り」及び「下り」などの文言は、端末間通信に対応する文言(例えば、「サイド(side)」)で読み替えられてもよい。例えば、上りチャネル、下りチャネルなどは、サイドチャネルで読み替えられてもよい。 Also, the base station in the present disclosure may be read as a user terminal. For example, communication between a base station and a user terminal is replaced with communication between multiple user terminals (for example, D2D (Device-to-Device), V2X (Vehicle-to-Everything), etc.) Regarding the configuration, each aspect/embodiment of the present disclosure may be applied. In this case, the user terminal may have the functions that the base station has. Also, words such as "up" and "down" may be replaced with words corresponding to inter-terminal communication (for example, "side"). For example, uplink channels, downlink channels, etc. may be read as side channels.

同様に、本開示におけるユーザ端末は、基地局で読み替えてもよい。この場合、ユーザ端末が有する機能を基地局が有する構成としてもよい。 Similarly, user terminals in the present disclosure may be read as base stations. In this case, the base station may have the functions that the user terminal has.

本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。 As used in this disclosure, the terms "determining" and "determining" may encompass a wide variety of actions. "Judgement", "determining" are, for example, judging, calculating, computing, processing, deriving, investigating, looking up, searching, inquiring (eg, lookup in a table, database, or other data structure), ascertaining as "judged" or "determined", and the like. Also, "judgment" and "decision" are used for receiving (e.g., receiving information), transmitting (e.g., transmitting information), input, output, access (accessing) (for example, accessing data in memory) may include deeming that something has been "determined" or "decided". In addition, "judgment" and "decision" are considered to be "judgment" and "decision" by resolving, selecting, choosing, establishing, comparing, etc. can contain. In other words, "judgment" and "decision" may include considering that some action is "judgment" and "decision". Also, "judgment (decision)" may be read as "assuming", "expecting", "considering", or the like.

「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。 The terms "connected," "coupled," or any variation thereof mean any direct or indirect connection or connection between two or more elements, It can include the presence of one or more intermediate elements between two elements being "connected" or "coupled." Couplings or connections between elements may be physical, logical, or a combination thereof. For example, "connection" may be read as "access". As used in this disclosure, two elements are defined using at least one of one or more wires, cables, and printed electrical connections and, as some non-limiting and non-exhaustive examples, in the radio frequency domain. , electromagnetic energy having wavelengths in the microwave and optical (both visible and invisible) regions, and the like.

本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。 As used in this disclosure, the phrase "based on" does not mean "based only on," unless expressly specified otherwise. In other words, the phrase "based on" means both "based only on" and "based at least on."

本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。 Any reference to elements using the "first," "second," etc. designations used in this disclosure does not generally limit the quantity or order of those elements. These designations may be used in this disclosure as a convenient method of distinguishing between two or more elements. Thus, reference to a first and second element does not imply that only two elements can be employed or that the first element must precede the second element in any way.

本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。 Where "include," "including," and variations thereof are used in this disclosure, these terms are inclusive, as is the term "comprising." is intended. Furthermore, the term "or" as used in this disclosure is not intended to be an exclusive OR.

本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。 In this disclosure, where articles have been added by translation, such as a, an, and the in English, the disclosure may include the plural nouns following these articles.

本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。 In the present disclosure, the term "A and B are different" may mean "A and B are different from each other." The term may also mean that "A and B are different from C". Terms such as "separate," "coupled," etc. may also be interpreted in the same manner as "different."

1…情報提供システム、10…サーバ、11…閲覧履歴解析部、12…受付部、13…第1選択部、14…第2選択部、15…リスト生成部、16…送信部、20…ユーザ端末、30…データベース群、31…閲覧履歴データベース、32…第1コンテンツデータベース、33…第1候補キーワードデータベース、34…メタ情報データベース、35…ユーザデータベース、202…キーワードリスト。 DESCRIPTION OF SYMBOLS 1... Information provision system, 10... Server, 11... Browsing history analysis part, 12... Reception part, 13... 1st selection part, 14... 2nd selection part, 15... List generation part, 16... Transmission part, 20... User Terminal, 30... Database group, 31... Browsing history database, 32... First content database, 33... First candidate keyword database, 34... Meta information database, 35... User database, 202... Keyword list.

Claims (7)

少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
対象ユーザを含む複数の閲覧者が第1情報源から提供される第1コンテンツにアクセスしたことを示す閲覧履歴を記憶する第1データベースを参照し、該閲覧履歴に基づいて少なくとも一つの第1キーワードを選択し、
第2情報源から提供される第2コンテンツでのキーワードの出現頻度を示すメタ情報を記憶する第2データベースを参照し、該メタ情報に基づいて少なくとも一つの第2キーワードを選択し、
前記少なくとも一つの第1キーワードのうちの少なくとも一つと、前記少なくとも一つの第2キーワードのうちの少なくとも一つとを含むキーワードリストを生成し、
前記キーワードリストを前記対象ユーザの端末上に表示させる、
情報提供システム。
comprising at least one processor,
the at least one processor
Referring to a first database storing browsing histories indicating that a plurality of viewers, including the target user, have accessed first content provided from a first information source, and determining at least one first keyword based on the browsing histories. and select
referring to a second database storing meta information indicating the appearance frequency of keywords in the second content provided from a second information source, selecting at least one second keyword based on the meta information;
generating a keyword list including at least one of the at least one first keyword and at least one of the at least one second keyword;
displaying the keyword list on the terminal of the target user;
information system.
前記少なくとも一つのプロセッサが、
前記閲覧履歴で示されるそれぞれのアクセスについて前記第1コンテンツから1以上の第1候補キーワードを特定し、
前記閲覧履歴で示されるそれぞれのアクセスについて、前記1以上の第1候補キーワードのそれぞれについて特徴量を算出し、前記第1候補キーワードおよび前記特徴量の1以上の組合せを含む特徴ベクトルを生成し、
それぞれの特徴ベクトルに基づいて前記複数の閲覧者をクラスタリングすることで複数のクラスタを生成し、
前記対象ユーザが属する前記クラスタに対応する1以上の前記特徴ベクトルに基づいて、複数の前記第1候補キーワードから前記少なくとも一つの第1キーワードを選択する、
請求項1に記載の情報提供システム。
the at least one processor
identifying one or more first candidate keywords from the first content for each access indicated by the browsing history;
calculating a feature amount for each of the one or more first candidate keywords for each access indicated by the browsing history, and generating a feature vector containing one or more combinations of the first candidate keyword and the feature amount;
generating a plurality of clusters by clustering the plurality of viewers based on their respective feature vectors;
Selecting the at least one first keyword from the plurality of first candidate keywords based on the one or more feature vectors corresponding to the cluster to which the target user belongs;
The information providing system according to claim 1.
前記少なくとも一つのプロセッサが、
前記閲覧者と前記第1コンテンツのジャンルとの組合せ毎に前記特徴ベクトルを合算し、
前記ジャンル毎に、前記複数の閲覧者をクラスタリングすることで前記複数のクラスタを生成し、
対応する前記ジャンルと前記対象ユーザが属する前記クラスタとの組合せに対応する前記特徴ベクトルに基づいて前記少なくとも一つの第1キーワードを選択する、
請求項2に記載の情報提供システム。
the at least one processor
summing the feature vectors for each combination of the viewer and the genre of the first content;
generating the plurality of clusters by clustering the plurality of viewers for each genre;
selecting the at least one first keyword based on the feature vector corresponding to the combination of the corresponding genre and the cluster to which the target user belongs;
The information providing system according to claim 2.
前記少なくとも一つのプロセッサが、
前記1以上の第1候補キーワードのそれぞれについて、所定の基準特徴量を取得し、
前記1以上の第1候補キーワードのそれぞれについて、該第1候補キーワードに対応する前記第1コンテンツが生成されてからの経過時間と、該第1コンテンツに対する閲覧操作とのうちの少なくとも一つに基づいて重みを設定し、
前記1以上の第1候補キーワードのそれぞれについて、前記基準特徴量に前記重みを適用することで前記特徴量を算出する、
請求項2または3に記載の情報提供システム。
the at least one processor
obtaining a predetermined reference feature amount for each of the one or more first candidate keywords;
for each of the one or more first candidate keywords, based on at least one of the elapsed time since the first content corresponding to the first candidate keyword was generated, and browsing operation on the first content to set the weights, and
calculating the feature amount by applying the weight to the reference feature amount for each of the one or more first candidate keywords;
The information providing system according to claim 2 or 3.
前記少なくとも一つのプロセッサが、前記出現頻度が所定の基準よりも大きい前記キーワードを前記少なくとも一つの第2キーワードとして選択する、
請求項1~4のいずれか一項に記載の情報提供システム。
The at least one processor selects, as the at least one second keyword, the keyword whose appearance frequency is greater than a predetermined criterion.
The information providing system according to any one of claims 1 to 4.
前記少なくとも一つのプロセッサが、
前記メタ情報で示される1以上の前記キーワードのそれぞれについて、該キーワードに対応する前記第1コンテンツのヒット数を取得し、
前記ヒット数が所定の閾値以上である場合に、該キーワードを前記少なくとも一つの第2キーワードとして選択する、
請求項1~5のいずれか一項に記載の情報提供システム。
the at least one processor
obtaining, for each of the one or more keywords indicated by the meta information, the number of hits of the first content corresponding to the keyword;
selecting the keyword as the at least one second keyword if the number of hits is greater than or equal to a predetermined threshold;
The information providing system according to any one of claims 1 to 5.
前記少なくとも一つのプロセッサが、前記第1情報源での前記第1コンテンツの検索のために用いられるキーワードを前記対象ユーザに提供するために、前記キーワードリストを前記端末上に表示させる、
請求項1~6のいずれか一項に記載の情報提供システム。
the at least one processor causing the keyword list to be displayed on the terminal to provide the target user with keywords used for searching the first content at the first information source;
The information providing system according to any one of claims 1-6.
JP2019167336A 2019-09-13 2019-09-13 Information provision system Active JP7212599B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019167336A JP7212599B2 (en) 2019-09-13 2019-09-13 Information provision system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019167336A JP7212599B2 (en) 2019-09-13 2019-09-13 Information provision system

Publications (2)

Publication Number Publication Date
JP2021043878A JP2021043878A (en) 2021-03-18
JP7212599B2 true JP7212599B2 (en) 2023-01-25

Family

ID=74864170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019167336A Active JP7212599B2 (en) 2019-09-13 2019-09-13 Information provision system

Country Status (1)

Country Link
JP (1) JP7212599B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251957A (en) 2008-04-07 2009-10-29 Nec Corp Interest information specification system, interest information specification method, and program for interest information specification
JP2013196435A (en) 2012-03-21 2013-09-30 Toshiba Corp Retrieval device, retrieval method, and program
JP2014106943A (en) 2012-11-30 2014-06-09 Kddi Corp Group extraction device, group extraction method, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251957A (en) 2008-04-07 2009-10-29 Nec Corp Interest information specification system, interest information specification method, and program for interest information specification
JP2013196435A (en) 2012-03-21 2013-09-30 Toshiba Corp Retrieval device, retrieval method, and program
JP2014106943A (en) 2012-11-30 2014-06-09 Kddi Corp Group extraction device, group extraction method, and program

Also Published As

Publication number Publication date
JP2021043878A (en) 2021-03-18

Similar Documents

Publication Publication Date Title
US20170041257A1 (en) Information Processing Method, Apparatus and System Based on Instant Messaging
US20190342415A1 (en) Event information push method, event information push apparatus, and storage medium
US10028011B2 (en) Predictive storage of broadcast content
US10387510B2 (en) Content search method and electronic device implementing same
US20160188733A1 (en) Generating Recommendations Based on Clustered Application States
US20130325892A1 (en) Application search query classifier
US20150310113A1 (en) Mobile Terminal, Server, System And Method For Realizing Search
WO2013173340A1 (en) Information searching method and system based on geographic location
CN109982293B (en) Flow product pushing method and system, electronic equipment and storage medium
CN108363817B (en) File processing method and device, mobile terminal and computer readable storage medium
US10572491B2 (en) Methods, systems, and media for presenting related media content items
CN110309357B (en) Application data recommendation method, model training method, device and storage medium
US20230268073A1 (en) Inquiry information processing method and apparatus, and medium
US10552438B2 (en) Triggering method for instant search
CN111026969B (en) Content recommendation method and device, storage medium and server
EP4221242A2 (en) System and method for selecting scenes for browsing histories in augmented reality interfaces
CN106851345B (en) Information pushing method, system and server
CN112261570B (en) Method, device, server and storage medium for associating interest point with wireless network
JP7212599B2 (en) Information provision system
JP7212600B2 (en) Information provision system
WO2018222933A1 (en) Services for messaging application with in-built web search
CN106375363A (en) Method, system and device for eliminating message alert in social application client
US9648554B2 (en) Mobile terminal for cell reselection in cellular mobile communication system and methods therefor
WO2018236437A1 (en) Methods, systems, and media for generating a group of media content items
CN111666485B (en) Information recommendation method, device and terminal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230113

R150 Certificate of patent or registration of utility model

Ref document number: 7212599

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150