JP5598265B2 - Information providing apparatus, method and program - Google Patents

Information providing apparatus, method and program Download PDF

Info

Publication number
JP5598265B2
JP5598265B2 JP2010248421A JP2010248421A JP5598265B2 JP 5598265 B2 JP5598265 B2 JP 5598265B2 JP 2010248421 A JP2010248421 A JP 2010248421A JP 2010248421 A JP2010248421 A JP 2010248421A JP 5598265 B2 JP5598265 B2 JP 5598265B2
Authority
JP
Japan
Prior art keywords
information
user
interest
vector
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010248421A
Other languages
Japanese (ja)
Other versions
JP2012099057A (en
Inventor
善雄 石澤
弘紀 水口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010248421A priority Critical patent/JP5598265B2/en
Publication of JP2012099057A publication Critical patent/JP2012099057A/en
Application granted granted Critical
Publication of JP5598265B2 publication Critical patent/JP5598265B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、利用者に情報を提供する情報提供装置、情報提供方法および情報提供プログラムに関する。   The present invention relates to an information providing apparatus, an information providing method, and an information providing program for providing information to a user.

近年、銭湯などにある大広間や病院の談話スペースなどに偶然集まった人々の間でコミュニケーションを取る機会を増やし、人と人のつながりを新たに作ったり、深めたりする試みがなされている。   In recent years, attempts have been made to increase communication opportunities among people who have gathered by chance in halls at public baths and hospital conversation spaces, and to create and deepen connections between people.

これに関連する技術として、例えば、特許文献1には、各利用者の情報閲覧履歴から、同じURLを見た回数や単語の出現頻度などに基づいて、利用者が興味を示しやすい情報を抽出して、利用者に提示する技術が記載されている。   As a technology related to this, for example, in Patent Document 1, information on which a user is likely to show interest is extracted from the information browsing history of each user based on the number of times the same URL is viewed, the appearance frequency of words, and the like. The technology presented to the user is described.

また、非特許文献1には、利用者の興味の特徴同士または情報の特徴同士の類似性を用いて、利用者や情報をまとめ、利用者グループや情報クラスタを作成する技術が記載されている。   Non-Patent Document 1 describes a technique for creating a user group and an information cluster by collecting users and information using similarities between features of interest of users or features of information. .

特開2008−97078号公報JP 2008-97078 A

Toby Segaran著、「集合知プログラミング」オライリー・ジャパン、2008年17月25日発行、p.31〜58Toby Segaran, “Collective Intelligence Programming”, O'Reilly Japan, published on 25th July 2008, p. 31-58

例えば、ある場所に集まった人達に何らかの情報を提供することで、会話するきっかけを与え、人々の会話を活性化するといった装置が提案されている。このような装置を実現するために、例えば、非特許文献1に記載された技術と特許文献1に記載された技術とを組み合わせて、以下のような方法を用いることが考えられる。   For example, an apparatus has been proposed in which some information is provided to people gathered in a certain place to give a conversation opportunity and activate people's conversation. In order to realize such an apparatus, for example, it is conceivable to use the following method by combining the technique described in Non-Patent Document 1 and the technique described in Patent Document 1.

・方法1
(1)閲覧情報には各利用者の興味が反映されていると仮定し、非特許文献1に記載されている方法を用いて、利用者が過去に閲覧した情報から、似た興味の利用者をまとめて利用者グループを作成する。
Method 1
(1) Assuming that each user's interests are reflected in the browsing information, the use of similar interests from information browsed by users in the past using the method described in Non-Patent Document 1. Group users together to create a user group.

(2)特許文献1に記載されている方法を用いて、利用者グループ中の多くの利用者の閲覧した情報に共通した単語などを含む情報を、その利用者グループに提供する。   (2) Using the method described in Patent Document 1, information including words and the like common to information viewed by many users in the user group is provided to the user group.

この方法を用いることにより、利用者グループ中の多くの利用者が興味を持ちやすい情報を提供することができる。   By using this method, it is possible to provide information that many users in the user group are likely to be interested in.

上記の方法では、同じような情報を見ている利用者のグループを作成し、各利用者グループ中の利用者の統計的な興味の高さに応じた情報提供を行っている。これとは別の方法として、例えば、似た内容の情報をクラスタとしてまとめ、各情報クラスタに含まれるような情報に興味を示す人を集めて、情報の提供を行うこともできる。   In the above method, a group of users who see similar information is created, and information is provided according to the statistical interest of the users in each user group. As another method, for example, information having similar contents can be gathered as a cluster, and people who are interested in the information included in each information cluster can be gathered to provide the information.

・方法2
(1)非特許文献1に記載されている方法を用いて、情報の類似性から情報をクラスタリングし、情報クラスタを作成する。
・ Method 2
(1) Using the method described in Non-Patent Document 1, information is clustered from information similarity to create an information cluster.

(2)情報クラスタに含まれる情報と利用者の興味の特徴との間の類似性から、情報クラスタを好む利用者を抽出し、利用者グループを作成する。 (2) From the similarity between the information included in the information cluster and the feature of interest of the user, users who prefer the information cluster are extracted and a user group is created.

(3)情報クラスタに含まれる情報を、利用者グループに提供する。 (3) Providing information included in the information cluster to the user group.

このように、方法1または方法2を適用することで、上記の装置を実現できる。   As described above, the above-described apparatus can be realized by applying the method 1 or the method 2.

しかしながら、装置に登録された利用者に情報を提供するとしても、利用者の興味は利用者毎に異なる。また、一定時間内に収集できる情報数は有限である。   However, even if information is provided to a user registered in the apparatus, the interest of the user varies from user to user. Further, the number of information that can be collected within a certain time is limited.

そのため、利用者の興味同士の類似性を見て1以上の利用者グループを作成しても、個々の利用者グループ内の全利用者共通の興味に合った情報が提供できるとは限らず、提供された情報に興味を持てない利用者が利用者グループ内に存在する可能性がある。   Therefore, even if one or more user groups are created by looking at the similarities between user interests, information that matches the interests common to all users in each user group may not be provided. There may be users in the user group who are not interested in the information provided.

また、情報同士の類似性を見て、1以上の情報クラスタを作成しても、利用者グループに所属する全利用者共通の興味に合った情報で構成された情報クラスタができるとは限らず、提供された情報に興味を持てない利用者が利用者グループ内に存在する可能性がある。   Also, looking at the similarity between information, creating one or more information clusters does not necessarily create an information cluster composed of information that meets the interests common to all users belonging to the user group. There may be users in the user group who are not interested in the provided information.

例えば、方法1を用いた場合には、利用者グループの分け方が適切にならない可能性がある。例えば、以下のような興味を持った利用者がいる場合を考える。   For example, when the method 1 is used, there is a possibility that the user group is not properly divided. For example, consider the case where there are users who are interested in the following.

・利用者A:サッカーと日本の政治とに興味がある。
・利用者B:サッカーだけでなく、野球やゴルフなど、スポーツ全般に興味があり、邦楽にも興味がある。
・利用者C:サッカーには興味があるが、Jリーグにしか興味がない。また、音楽に興味がある。
・利用者D:野球に興味があり、国際政治にも興味がある。
・利用者E:野球には興味があるが、日本のプロ野球にしか興味がない。また、邦楽に興味がある。
・ User A: Interested in soccer and Japanese politics.
-User B: Not only soccer but also interested in sports such as baseball and golf, and is also interested in Japanese music.
・ User C: Interested in soccer but only in the J-League. Also interested in music.
・ User D: Interested in baseball and international politics.
User E: Interested in baseball, but only interested in Japanese professional baseball. Also interested in Japanese music.

方法1を利用し、利用者グループ(A、B、C)と、利用者グループ(D、E)とを作成したとする。利用者グループ(A、B、C)に所属する各利用者の興味から、利用者グループ内の全利用者が興味を持てると考えられるJリーグの情報を、利用者グループ(A、B、C)に提供できると、利用者の会話が活性化すると考えられる。   It is assumed that the user group (A, B, C) and the user group (D, E) are created using the method 1. Based on the interests of each user belonging to the user group (A, B, C), the information of the J League considered that all users in the user group may be interested in the user group (A, B, C) ) Is considered to activate user conversation.

また、利用者グループ(D、E)に対しては、日本のプロ野球の情報を提供できると、利用者の会話が活性化すると考えられる。   Moreover, it is thought that a user's conversation will be activated if a Japanese professional baseball information can be provided with respect to a user group (D, E).

しかし、情報リストの中に、日韓関係と邦楽とに関する情報はあるが、Jリーグや日本のプロ野球の情報がない場合には、利用者グループ中の利用者の誰もが興味のある情報を提供できない。このような場合、利用者グループ(A、D)と、利用者グループ(B、C、E)とに利用者を分け、それぞれ、日本の国際政治に関する情報と、邦楽に関する情報とを提供した方が、会話が活性化すると考えられる。   However, if there is information on Japan-Korea relations and Japanese music in the information list, but there is no information on J-League or Japanese professional baseball, information that everyone in the user group is interested in Can not provide. In such a case, those who divide users into user groups (A, D) and user groups (B, C, E) and provide information on Japanese international politics and information on Japanese music, respectively. However, it is thought that conversation is activated.

また、先に情報をクラスタリングした場合も、同様のことが起こり得る。例えば、次の5つの情報を考える。   The same thing can happen when information is clustered first. For example, consider the following five pieces of information.

・情報1:プロゴルファーA、新ヘアスタイル「アシンメトリー」披露
・情報2:B選手が“季節先取り”ファッションで帰国
・情報3:イタリアブランドCがデザイナーDとコラボレーション
・情報4:「最悪。絶対にわが社の製品ではない」E首相愛用?イタリアの高級ブランド社長が一部報道
・情報5:F監督らに文科省参与の辞令「スポーツの地位向上を」
・ Information 1: Pro golfer A, new hairstyle “Asymmetry” is displayed ・ Information 2: B player returns to Japan in “season-first” fashion ・ Information 3: Italian brand C collaborates with designer D ・ Information 4: “Worst. Isn't it a company product? President of Italian luxury brand reports and information 5: Resignation from Ministry of Education, Ministry of Education, etc.

方法2を利用し、ファッションに関する情報クラスタ(1、2、3)と、政治に関する情報クラスタ(4、5)とを作成したとする。この場合、ファッションに興味のある利用者グループにファッション情報を提供し、政治に興味のあるユーザグループに政治情報を提供できれば、利用者の会話が活性化すると考えられる。   Assume that method 2 is used to create an information cluster (1, 2, 3) about fashion and an information cluster (4, 5) about politics. In this case, if fashion information can be provided to a user group interested in fashion and political information can be provided to a user group interested in politics, it is considered that user conversation is activated.

しかし、利用者の中に、スポーツに興味のある利用者と、イタリアに興味のある利用者とがいるが、ファッションに興味のある利用者と政治に興味のある利用者とがいない場合には、利用者グループに所属する利用者が興味のある情報を提供できない。   However, there are users who are interested in sports and users who are interested in Italy, but there are no users who are interested in fashion and politics. , Users who belong to user groups cannot provide information that interests them.

このような場合、情報クラスタを、スポーツに関する情報クラスタ(1、2、5)とイタリアに関する情報クラスタ(3、4)とにした方が、利用者の会話が活性化すると考えられる。   In such a case, it is considered that the user's conversation is activated when the information cluster is the sports information cluster (1, 2, 5) and the Italian information cluster (3, 4).

以上のように、同じ場所にいる上記装置の利用者の興味、または情報だけに基づいて、利用者グループや情報クラスタを作成しても、全利用者に対して、興味を持てる情報を提供することはできない。   As described above, even if a user group or an information cluster is created based only on the interests or information of the users of the above-mentioned devices in the same place, information that interests all users is provided. It is not possible.

そこで、本発明は、同じ場所に集まった人々に会話の話題となる情報を提供する際、提供する情報に対して興味を持たないような人がいないように利用者をグループ化し、個々の利用者グループに所属する全利用者が興味を持てる情報を提供する情報提供装置、情報提供方法及び情報提供プログラムを提供することを目的とする。   Therefore, the present invention groups users so that there are no people who are not interested in the information provided when providing information that is a topic of conversation to people gathered in the same place, It is an object of the present invention to provide an information providing apparatus, an information providing method, and an information providing program for providing information that all users belonging to a user group are interested in.

本発明による情報提供装置は、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力とし、利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供装置であって、各情報に対する利用者毎の興味の度合いを、情報ベクトルと利用者興味ベクトルとの類似性から推定し、各情報に対して、利用者を次元とし、興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成手段と、情報興味ベクトルを用いて情報をクラスタリングする情報クラスタ作成手段と、情報クラスタに対して、興味の度合いが高い利用者を、利用者グループを作成するために当該情報クラスタ中の情報ベクトルから抽出する利用者抽出手段とを備えたことを特徴とする。 An information providing apparatus according to the present invention receives an information vector representing a feature of information represented by a character string and a user interest vector representing a feature of information viewed by the user, and classifies the user, An information providing device that creates a user group and provides information to the user group, estimating the degree of interest for each user for each information from the similarity between the information vector and the user interest vector, For information, the information interest vector creating means for creating an information interest vector having a user as a dimension and the degree of interest as a value, an information cluster creating means for clustering information using the information interest vector, and an information cluster in contrast, the fact that a higher degree user interests, and a user extracting means for extracting from the information vector in the information cluster to create a user group And butterflies.

本発明による情報提供装置は、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力とし、利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供装置であって、各情報に対する利用者毎の興味の度合いを、情報ベクトルと利用者興味ベクトルとの類似性から推定し、各情報に対して、利用者を次元とし、興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成手段と、情報興味ベクトルを用いて情報をクラスタリングする情報クラスタ作成手段と、作成した情報クラスタの特徴を表すデータを利用者に提示し、利用者の選択操作に従って、利用者に対応する情報クラスタを選択する利用者選択手段とを備えたことを特徴とする。 An information providing apparatus according to the present invention receives an information vector representing a feature of information represented by a character string and a user interest vector representing a feature of information viewed by the user, and classifies the user, An information providing device that creates a user group and provides information to the user group, estimating the degree of interest for each user for each information from the similarity between the information vector and the user interest vector, Information interest vector creation means for creating an information interest vector having a user as a dimension and the degree of interest as information, information cluster creation means for clustering information using the information interest vector, and created information presents data representing features of a cluster to the user, according to user's selection operation, characterized in that a user selection means for selecting information cluster corresponding to the user To.

本発明による情報提供方法は、コンピュータが、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力し、利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供方法であって、コンピュータが、各情報に対する利用者毎の興味の度合いを、情報ベクトルと利用者興味ベクトルとの類似性から推定し、各情報に対して、利用者を次元とし、興味の度合いを値とする情報興味ベクトルを作成し、情報興味ベクトルを用いて情報をクラスタリングし、情報クラスタに対して、興味の度合いが高い利用者を、利用者グループを作成するために当該情報クラスタ中の情報ベクトルから抽出することを特徴とする。また、本発明による情報提供方法は、コンピュータが、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力し、利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供方法であって、コンピュータが、各情報に対する利用者毎の興味の度合いを、情報ベクトルと利用者興味ベクトルとの類似性から推定し、各情報に対して、利用者を次元とし、興味の度合いを値とする情報興味ベクトルを作成し、情報興味ベクトルを用いて情報をクラスタリングし、作成した情報クラスタの特徴を表すデータを利用者に提示し、利用者の選択操作に従って、利用者に対応する情報クラスタを選択することを特徴とする。 According to the information providing method of the present invention, a computer inputs an information vector representing a feature of information represented by a character string and a user interest vector representing a feature of information viewed by the user, and classifies the user. An information providing method for creating a user group and providing information to the user group, wherein the computer determines the degree of interest of each user for each piece of information by comparing the information vector with the user interest vector For each piece of information, create an information interest vector with each user as the dimension and the degree of interest as the value, cluster the information using the information interest vector, A user having a high degree is extracted from an information vector in the information cluster in order to create a user group . In the information providing method according to the present invention, the computer inputs an information vector representing the characteristics of the information represented by the character string and a user interest vector representing the characteristics of the information browsed by the user. Is an information providing method for creating a user group and providing information to the user group, wherein the computer determines the degree of interest of each user for each information as an information vector and a user interest vector. For each piece of information, create an information interest vector with the user as the dimension and the degree of interest as the value, cluster the information using the information interest vector, and the characteristics of the created information cluster Is displayed to the user, and an information cluster corresponding to the user is selected according to the user's selection operation.

本発明による情報提供プログラムは、コンピュータに、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力し、利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する処理を実行させるための情報提供プログラムであって、コンピュータに、各情報に対する利用者毎の興味の度合いを、情報ベクトルと利用者興味ベクトルとの類似性から推定し、各情報に対して、利用者を次元とし、興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成処理と、情報興味ベクトルを用いて情報をクラスタリングする情報クラスタ作成処理と、情報クラスタに対して、興味の度合いが高い利用者を、利用者グループを作成するために当該情報クラスタ中の情報ベクトルから抽出する利用者抽出処理とを実行させることを特徴とする。また、本発明による情報提供プログラムは、コンピュータに、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力し、利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する処理を実行させるための情報提供プログラムであって、コンピュータに、各情報に対する利用者毎の興味の度合いを、情報ベクトルと利用者興味ベクトルとの類似性から推定し、各情報に対して、利用者を次元とし、興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成処理と、情報興味ベクトルを用いて情報をクラスタリングする情報クラスタ作成処理と、作成した情報クラスタの特徴を表すデータを利用者に提示し、利用者の選択操作に従って、利用者に対応する情報クラスタを選択する利用者選択処理とを実行させることを特徴とする。 An information providing program according to the present invention inputs, to a computer, an information vector representing a feature of information represented by a character string and a user interest vector representing a feature of information viewed by the user, and classifies the user. An information providing program for creating a user group and executing a process for providing the user group with information, and using the information vector and the degree of interest of each user for each information Information interest vector creation processing that creates an information interest vector with a user as a dimension and a degree of interest as a value, and information using the information interest vector. Information cluster creation processing for clustering users and users who are highly interested in the information cluster in order to create user groups. Characterized in that to execute the user extraction process of extracting the information vector in register. In addition, the information providing program according to the present invention inputs an information vector representing the characteristics of the information represented by a character string and a user interest vector representing the characteristics of the information viewed by the user to the computer. Is an information providing program for executing a process of creating a user group and providing information to the user group, wherein the information vector indicates the degree of interest of each user for each piece of information. Information interest vector creation processing that creates an information interest vector that takes the user as a dimension and the degree of interest as a value for each information, and the information interest vector The information cluster creation process for clustering information and the data representing the characteristics of the created information cluster are presented to the user, and the user is selected according to the user's selection operation. Characterized in that to execute a user selecting process of selecting the corresponding information cluster's.

本発明によれば、同じ場所に集まった人々に会話の話題となる情報を提供する際、提供する情報に対して興味を持たないような人がいないように利用者をグループ化し、個々の利用者グループに所属する全利用者が興味を持てる情報を提供することができる。   According to the present invention, when providing information that is a topic of conversation to people gathered in the same place, users are grouped so that there is no person who is not interested in the information to be provided. Can provide information that all users who belong to a group of users are interested in.

情報提供装置の第1の実施形態の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of 1st Embodiment of an information provision apparatus. 情報単語頻度記憶部が格納するデータの一例を示す説明図である。It is explanatory drawing which shows an example of the data which an information word frequency memory | storage part stores. 閲覧単語頻度記憶部が格納するデータの一例を示す説明図である。It is explanatory drawing which shows an example of the data which a browsing word frequency memory | storage part stores. 情報提供装置の第1の実施形態の動作の例を示すフローチャートである。It is a flowchart which shows the example of operation | movement of 1st Embodiment of an information provision apparatus. 情報提供装置の第2の実施形態の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of 2nd Embodiment of an information provision apparatus. 情報提供装置の第2の実施形態の動作の例を示すフローチャートである。It is a flowchart which shows the example of operation | movement of 2nd Embodiment of an information provision apparatus. 情報提供装置の最小の構成例を示すブロック図である。It is a block diagram which shows the minimum structural example of an information provision apparatus.

実施形態1.
以下、本発明の第1の実施形態について図面を参照して説明する。図1は、情報提供装置の第1の実施形態の構成例を示すブロック図である。なお、本実施形態では、テキストとして表すことができるデータを情報と定義する。
Embodiment 1. FIG.
Hereinafter, a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram illustrating a configuration example of the first embodiment of the information providing apparatus. In the present embodiment, data that can be expressed as text is defined as information.

本実施形態では、情報提供装置は、情報記憶部100と、利用者興味記憶部101と、利用者グループ作成部102と、情報出力部106とを備えている。なお、情報提供装置は、具体的には、プログラムに従って動作するパーソナルコンピュータ等の情報処理装置によって実現される。   In the present embodiment, the information providing apparatus includes an information storage unit 100, a user interest storage unit 101, a user group creation unit 102, and an information output unit 106. The information providing apparatus is specifically realized by an information processing apparatus such as a personal computer that operates according to a program.

情報記憶部100は、情報と情報の特徴とを格納する。以下、特徴を格納するとの表現を用いるが、具体的には特徴を示すデータを格納する。情報記憶部100は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。図2に情報記憶部100が格納するデータの一例を示す。   The information storage unit 100 stores information and information features. Hereinafter, the expression “store the feature” is used. Specifically, the data indicating the feature is stored. Specifically, the information storage unit 100 is realized by a storage device such as a magnetic disk device or an optical disk device. FIG. 2 shows an example of data stored in the information storage unit 100.

図2に示す例では、あらかじめ情報に対して形態素解析を行い、各単語(図2の例では名詞)の出現頻度を求めている。そして、情報記憶部100は、単語を次元、出現頻度を値とするベクトル(ここでは、情報ベクトルと呼ぶ)の形で、情報の特徴を格納している。これらの情報は、例えば、管理者等によって予め情報記憶部100に登録されている。また、例えば、マスコミや広告配信事業者等が運営するサーバから定期的に収集し、形態素解析して、これらの情報を蓄積するようにしてもよい。   In the example shown in FIG. 2, morphological analysis is performed on information in advance to determine the appearance frequency of each word (noun in the example of FIG. 2). The information storage unit 100 stores information features in the form of vectors (herein referred to as information vectors) having words as dimensions and appearance frequencies as values. These pieces of information are registered in advance in the information storage unit 100 by, for example, an administrator. In addition, for example, the information may be collected periodically from a server operated by the media, an advertisement distribution company, or the like, analyzed by morpheme, and accumulated.

利用者興味記憶部101は、利用者が興味を示した情報の特徴を格納する。利用者興味記憶部101は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。図3に利用者興味記憶部101が格納するデータの一例を示す。   The user interest storage unit 101 stores characteristics of information that the user has shown interest in. Specifically, the user interest storage unit 101 is realized by a storage device such as a magnetic disk device or an optical disk device. FIG. 3 shows an example of data stored in the user interest storage unit 101.

図3に示す例では、利用者は興味のある情報を閲覧すると仮定し、ある利用者が閲覧した情報に対して形態素解析を行い、各単語(図3の例では名詞)の出現頻度を求めている。そして、利用者興味記憶部101は、単語を次元、出現頻度を値とするベクトル(ここでは、興味ベクトルと呼ぶ)の形で、各利用者の興味の特徴を格納している。これらの情報は、例えば、管理者等によって予め利用者興味記憶部101に登録されている。また、例えば、プロバイダ等のシステムを用いて、ユーザの検索履歴を定期的に収集し、形態素解析して、これらの情報を蓄積するようにしてもよい。   In the example shown in FIG. 3, it is assumed that the user browses information of interest, morphological analysis is performed on the information browsed by a certain user, and the appearance frequency of each word (in the example of FIG. 3) is obtained. ing. The user interest storage unit 101 stores the features of interest of each user in the form of a vector having a word as a dimension and an appearance frequency as a value (herein referred to as an interest vector). Such information is registered in the user interest storage unit 101 in advance by, for example, an administrator. Further, for example, a user's search history may be periodically collected using a system such as a provider, and morphological analysis may be performed to accumulate these pieces of information.

利用者グループ作成部102は、各情報に対する各利用者の興味の度合いを推定して情報のリスト(情報クラスタ)を作成し、各情報クラスタから利用者データを抽出して利用者グループデータを作成する機能を備えている。   The user group creation unit 102 creates a list of information (information cluster) by estimating the degree of interest of each user for each information, and creates user group data by extracting user data from each information cluster. It has a function to do.

以下、現実の利用者を特定するデータを利用者データと呼び、利用者グループを特定するデータを利用者グループデータと呼ぶ。なお、利用者グループとは、情報提供装置が設置された場所で現実に存在する利用者のグループではなく、ある情報を提供する対象として情報提供装置が定める利用者の集合のことである。また、本実施形態では、利用者グループを作成するとの表現を用いるが、具体的には、利用者グループを特定するための利用者グループデータを作成することである。   Hereinafter, data specifying an actual user is referred to as user data, and data specifying a user group is referred to as user group data. The user group is not a group of users that actually exist at the place where the information providing apparatus is installed, but a set of users determined by the information providing apparatus as a target for providing certain information. In this embodiment, the expression that a user group is created is used. Specifically, user group data for specifying a user group is created.

利用者グループ作成部102は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。利用者グループ作成部102は、情報興味ベクトル作成部103と、情報クラスタ作成部104と、利用者抽出部105とを含む。   Specifically, the user group creation unit 102 is realized by a CPU of an information processing apparatus that operates according to a program. The user group creation unit 102 includes an information interest vector creation unit 103, an information cluster creation unit 104, and a user extraction unit 105.

ここで、利用者の情報に対する興味の度合いを興味度と呼ぶ。情報興味ベクトル作成部103は、情報ベクトルと興味ベクトルとの類似性から各利用者の各情報に対する興味度を推定し、各情報に対して、利用者を次元とし、興味度を値とするベクトル(以下、情報興味ベクトルとも呼ぶ)を作成する機能を備えている。なお、情報興味ベクトル作成部103は、類似性の測定方法として、例えば、情報ベクトルと興味ベクトルとのcosine類似度を用いて測るなど、既存の方法を用いて興味度を求めることができる。   Here, the degree of interest in the user's information is called the interest level. The information interest vector creation unit 103 estimates the interest level of each user for each piece of information from the similarity between the information vector and the interest vector, and for each piece of information, a vector having the user as a dimension and the interest level as a value. (Hereinafter also referred to as an information interest vector). Note that the information interest vector creation unit 103 can obtain the degree of interest using an existing method, for example, by measuring the similarity between the information vector and the interest vector as a similarity measurement method.

情報クラスタ作成部104は、情報興味ベクトルをクラスタリングし、利用者が似た興味を示す情報をまとめて、N個のクラスタ(ここでは、情報クラスタと呼ぶ)を作成する機能を備えている。なお、情報クラスタ作成部104は、クラスタリングの方法として、例えば、階層型クラスタリングや、k−meansクラスタリングなど、既存の方法を用いることができる。また、例えば、情報を提供する際に用いるディスプレイ装置などの表示装置の設置数に基づいて、作成する情報クラスタの個数Nを定めるようにしてもよい。   The information cluster creation unit 104 has a function of clustering information interest vectors and collecting information indicating similar interests of users to create N clusters (referred to herein as information clusters). Note that the information cluster creation unit 104 can use an existing method such as hierarchical clustering or k-means clustering as a clustering method. Further, for example, the number N of information clusters to be created may be determined based on the number of display devices such as a display device used when providing information.

利用者抽出部105は、各情報クラスタに含まれる情報に対して、興味度の高い利用者から利用者グループに割り当てて利用者グループを形成し、利用者グループと情報クラスタとの対を作成する機能を備えている。   The user extraction unit 105 forms a user group by assigning the information included in each information cluster to a user group from a highly interested user, and creates a pair of the user group and the information cluster. It has a function.

例えば、(1)利用者抽出部105は、情報クラスタに含まれる情報に対する興味度の高い順に利用者データを抽出し、抽出した利用者データを含む利用者グループデータを生成する。そして、利用者抽出部105は、生成した利用者グループデータと抽出元の情報クラスタとを対応付ける。   For example, (1) the user extraction unit 105 extracts user data in descending order of interest with respect to information included in the information cluster, and generates user group data including the extracted user data. Then, the user extracting unit 105 associates the generated user group data with the extraction source information cluster.

また例えば、(2)利用者抽出部105は、情報クラスタに含まれる情報に対する興味度の高い順に利用者データを抽出し、抽出した利用者データと、予め抽出元の情報クラスタに対応付けられた利用者グループデータとを対応付ける。   Further, for example, (2) the user extraction unit 105 extracts user data in descending order of the degree of interest in the information included in the information cluster, and associates the extracted user data with the extraction source information cluster in advance. Correlate with user group data.

また例えば、(3)利用者抽出部105は、情報クラスタに含まれる情報に対する興味度の高い順に利用者データを抽出し、抽出した利用者データと抽出元の情報クラスタとを対応付け、対応付けられた利用者データの集合を情報クラスタに対する利用者グループデータと定める。   Further, for example, (3) the user extraction unit 105 extracts user data in descending order of interest with respect to information included in the information cluster, and associates the extracted user data with the extraction source information cluster. The set of the obtained user data is defined as user group data for the information cluster.

以下、「利用者データを利用者グループデータに割り当てる」や「利用者データを利用者グループデータに所属させる」などの表現を用いるが、具体的には、利用者抽出部105が上記の(1)から(3)のような処理を実行することである。   Hereinafter, expressions such as “assign user data to user group data” and “assign user data to user group data” are used. Specifically, the user extraction unit 105 performs the above (1). ) To (3).

情報出力部106は、利用者グループに対して、対応する情報クラスタに含まれる情報を提供する機能を備えている。情報出力部106は、例えば、ディスプレイ装置等の表示装置に情報を表示させるように制御することで、利用者グループに情報を提供する。また、例えば、情報出力部106は、利用者グループに含まれる利用者が保持する端末装置に情報を配信する。   The information output unit 106 has a function of providing information included in the corresponding information cluster to the user group. The information output unit 106 provides information to a user group by controlling the information output unit 106 to display the information on a display device such as a display device, for example. Further, for example, the information output unit 106 distributes information to terminal devices held by users included in the user group.

本実施形態では、情報提供装置が設置された場所に複数の利用者が存在し、表示装置に情報を表示させることによって、その複数の利用者に情報を提供する例について説明する。なお、このような形態に限らず、例えば、情報提供装置が、利用者がそれぞれ保持する端末装置に情報を配信するような形態であってもよい。この場合には、例えば、利用者興味記憶部101は、利用者が端末装置を用いてウェブサイト等で閲覧した内容を示す情報を蓄積し、興味ベクトルの形で格納しているものとする。   In the present embodiment, an example will be described in which a plurality of users exist in a place where the information providing apparatus is installed, and information is provided to the plurality of users by displaying the information on the display device. Note that the present invention is not limited to such a form, and for example, the information providing apparatus may be a form in which information is distributed to terminal devices held by users. In this case, for example, it is assumed that the user interest storage unit 101 accumulates information indicating contents viewed by a user on a website or the like using a terminal device and stores the information in the form of an interest vector.

次に、情報提供装置の動作について、図4を用いて説明する。図4は、情報提供装置の第1の実施形態の動作の例を示すフローチャートである。情報提供装置は、例えば、利用者や管理者の操作に従って以下の動作を実行する。   Next, the operation of the information providing apparatus will be described with reference to FIG. FIG. 4 is a flowchart illustrating an example of the operation of the information providing apparatus according to the first embodiment. For example, the information providing apparatus executes the following operation in accordance with the operation of the user or administrator.

例えば、管理者が情報提供装置の起動操作を行うと、情報興味ベクトル作成部103は、情報単語頻度記憶部100から情報の情報ベクトルを抽出する(ステップS1)。   For example, when the administrator performs an activation operation of the information providing apparatus, the information interest vector creation unit 103 extracts an information vector of information from the information word frequency storage unit 100 (step S1).

次いで、情報興味ベクトル作成部103は、利用者興味記憶部101から利用者の興味ベクトルを抽出する(ステップS2)。   Next, the information interest vector creation unit 103 extracts the user's interest vector from the user interest storage unit 101 (step S2).

次いで、情報興味ベクトル作成部103は、抽出した情報ベクトルと興味ベクトルとから興味度を推定する(ステップS3)。すなわち、情報興味ベクトル作成部103は、抽出した情報ベクトルと興味ベクトルとに基づいて、興味度を算出する。   Next, the information interest vector creation unit 103 estimates the degree of interest from the extracted information vector and interest vector (step S3). That is, the information interest vector creation unit 103 calculates the degree of interest based on the extracted information vector and interest vector.

具体的には、図2および図3に示す例の場合、情報興味ベクトル作成部103は、情報ベクトルと興味ベクトルとの単語の出現頻度の類似性を興味度として用いることができる。なお、類似度計算に関するcosine類似度などの具体的方法の詳細については、例えば文献(徳永健伸著、「情報検索と言語処理(言語と計算)」東京大学出版会、1999年11月発行、p.31)に記載されている。   Specifically, in the example illustrated in FIGS. 2 and 3, the information interest vector creation unit 103 can use the similarity of the appearance frequency of words between the information vector and the interest vector as the degree of interest. For details of specific methods such as cosine similarity for similarity calculation, see, for example, literature (Takenobu Tokunaga, “Information Retrieval and Language Processing (Language and Calculation)”, University of Tokyo Press, November 1999, p. .31).

その後、情報興味ベクトル作成部103は、情報ベクトルと興味ベクトルとの全ての組み合わせに対して、興味度を推定し終えるまで、ステップS1からS3の処理を繰り返す(ステップS4)。   Thereafter, the information interest vector creation unit 103 repeats the processing from step S1 to step S3 until the degree of interest has been estimated for all combinations of information vectors and interest vectors (step S4).

次いで、情報興味ベクトル作成部103は、情報に対して、利用者を次元とし、興味度を値とする情報興味ベクトルを作成する(ステップS5)。   Next, the information interest vector creation unit 103 creates an information interest vector with the user as the dimension and the interest level as the value for the information (step S5).

例えば、情報1に対して、利用者A、B、C、D、Eの興味度が、それぞれ、0.2、0.8、0.1、0.5、0.3とすると、情報興味ベクトル作成部103が作成する情報興味ベクトルvは、v=(0.2,0.8,0.1,0.5,0.3)となる。 For example, if the interest levels of users A, B, C, D, and E are 0.2, 0.8, 0.1, 0.5, and 0.3 for information 1, respectively, The information interest vector v 1 created by the vector creation unit 103 is v 1 = (0.2, 0.8, 0.1, 0.5, 0.3).

次いで、情報クラスタ作成部104は、情報興味ベクトルをクラスタリングし、情報を利用者の興味に応じたN個の情報クラスタにまとめる(ステップS6)。すなわち、情報クラスタ作成部104は、情報興味ベクトルをクラスタリングし、利用者が似た興味を示す情報をまとめて、N個の情報クラスタを作成する。   Next, the information cluster creation unit 104 clusters the information interest vectors and collects the information into N information clusters according to the user's interest (step S6). In other words, the information cluster creation unit 104 clusters information interest vectors, collects information indicating similar interests of users, and creates N information clusters.

次いで、利用者抽出部105は、情報クラスタに含まれる情報に対して、興味度の高い利用者を示す利用者データを抽出し、全利用者データが必ず情報クラスタに対応する利用者グループデータのいずれかに属するように振り分け、利用者グループデータを作成する(ステップS7)。   Next, the user extraction unit 105 extracts user data indicating users with a high degree of interest in the information included in the information cluster, and all user data is always user group data corresponding to the information cluster. Distribution is made so as to belong to any one of them, and user group data is created (step S7).

例えば、利用者抽出部105は、各情報クラスタ中の情報興味ベクトルの和を求めて規格化し、平均興味ベクトルを算出し、平均興味ベクトルの各値(各利用者の平均興味度)が高い利用者データから順に情報クラスタに対応する利用者グループデータに割り当てる。そして、利用者抽出部105は、この処理を、全ての利用者データがどこかの利用者グループデータに所属するまで繰り返すことで、利用者グループデータを作成できる。この際、利用者抽出部105は、どこかの利用者グループデータに既に割り当てた利用者データを、他の利用者グループデータに割り当てないように制御し、1の利用者データが、1の利用者グループデータにだけ所属するようにする。   For example, the user extraction unit 105 obtains and standardizes the sum of information interest vectors in each information cluster, calculates an average interest vector, and uses each value of the average interest vector (average interest of each user) high. The user group data corresponding to the information cluster is assigned in order from the user data. The user extracting unit 105 can create user group data by repeating this process until all user data belongs to some user group data. At this time, the user extraction unit 105 performs control so that user data already assigned to some user group data is not assigned to other user group data, and one user data is one use. To belong only to user group data.

以上の処理を実行することにより、興味度に基づいて特定した利用者の集合である利用者グループと情報クラスタとの対応付けができたため、情報出力部106は、利用者グループに対して、対応する情報クラスタに含まれる情報を提供する(ステップS8)。具体的には、情報出力部106は、ディスプレイ装置等の表示装置に情報を表示させるように制御することで、利用者グループに情報を提供する。   By executing the above processing, the user group, which is a set of users specified based on the degree of interest, can be associated with the information cluster. Therefore, the information output unit 106 supports the user group. The information included in the information cluster to be provided is provided (step S8). Specifically, the information output unit 106 provides information to the user group by performing control so that information is displayed on a display device such as a display device.

以上に説明したように、本実施形態では、情報と、情報の特徴と、利用者興味の特徴とを入力とし、情報に対する各利用者の興味度に基づいて情報をクラスタリングし、情報クラスタに対して興味度の高い順に利用者を割り当てて利用者グループデータを作成する。また、その際に全利用者データが必ずいずれかの利用者グループデータに所属するように利用者グループデータを作成する。そして、利用者グループに対して、対応する情報クラスタに含まれる情報を提供する。   As described above, in the present embodiment, information, information characteristics, and user interest characteristics are input, information is clustered based on each user's degree of interest in the information, User group data is created by assigning users in descending order of interest. At that time, user group data is created so that all user data must belong to one of the user group data. Then, the information included in the corresponding information cluster is provided to the user group.

したがって、提供する情報に対して興味を持たないような人がいないように利用者をグループ化し、個々の利用者グループに所属する全利用者が興味を持てる情報を提供する情報提供装置を実現することができる。   Accordingly, it is possible to realize an information providing apparatus that groups users so that no one is not interested in the information to be provided and provides information that all users belonging to each user group are interested in be able to.

実施形態2.
次に、本発明の第2の実施形態について図面を参照して説明する。図5は、情報提供装置の第2の実施形態の構成例を示すブロック図である。
Embodiment 2. FIG.
Next, a second embodiment of the present invention will be described with reference to the drawings. FIG. 5 is a block diagram illustrating a configuration example of the second embodiment of the information providing apparatus.

図5に示すように、本実施形態では、第1の実施形態に比べ、利用者抽出部105に代えて利用者選択部107を含む点で異なる。なお、他の構成要素については、第1の実施形態と同様である。以下、第1の実施形態と異なる点についてのみ説明する。   As shown in FIG. 5, this embodiment is different from the first embodiment in that a user selection unit 107 is included instead of the user extraction unit 105. Other components are the same as those in the first embodiment. Only differences from the first embodiment will be described below.

利用者選択部107は、情報クラスタから興味度が高い順に利用者データを抽出し、抽出した利用者データを利用者グループデータに割り当てる処理を、全利用者データがいずれかの利用者グループデータに所属するまで繰り返す機能を備えている。   The user selection unit 107 extracts user data from the information cluster in descending order of interest, and assigns the extracted user data to user group data. All user data is assigned to any user group data. Has the ability to repeat until you belong.

ここで、利用者選択部107は、第1の実施形態の利用者抽出部105と異なり、利用者データを複数の利用者グループデータに所属させることができる。   Here, unlike the user extraction unit 105 of the first embodiment, the user selection unit 107 can make user data belong to a plurality of user group data.

具体的には、利用者選択部107は、割り当てを繰り返す過程で、利用者データを複数の情報クラスタ(すなわち、利用者グループデータ)に割り当てた場合には、一旦、そのまま割り当てた利用者グループデータにその利用者データを所属させる。   Specifically, when the user selection unit 107 assigns user data to a plurality of information clusters (that is, user group data) in the process of repeating the assignment, the user group data once assigned as it is. To the user data.

また、利用者選択部107は、利用者グループへの割り当ての終了後、複数の利用者グループに所属した利用者に対して、情報クラスタに含まれる情報を表現する特徴語などのメタ情報を提示し、どの利用者グループに所属するかを利用者自身に選択させることができる。   In addition, after the assignment to the user group is completed, the user selection unit 107 presents meta information such as feature words representing information included in the information cluster to users belonging to a plurality of user groups. The user can select which user group the user belongs to.

具体的には、利用者選択部107は、ディスプレイ装置等の表示装置に複数の情報クラスタのメタ情報を表示させるように制御する。そして、メタ情報を見た利用者がいずれかの情報クラスタ(すなわち、所属する利用者グループ)を選択する操作を行うと、利用者選択部107は、利用者の操作に従って、対応する利用者データを選択した利用者グループデータにのみ割り当てる処理を行う。   Specifically, the user selection unit 107 performs control so that meta information of a plurality of information clusters is displayed on a display device such as a display device. When the user who has seen the meta information performs an operation of selecting one of the information clusters (that is, the user group to which the user belongs), the user selection unit 107 performs corresponding user data according to the user's operation. Allocate only to the user group data selected.

次に、本実施形態の動作について説明する。図6は、情報提供装置の第2の実施形態の動作の例を示すフローチャートである。   Next, the operation of this embodiment will be described. FIG. 6 is a flowchart illustrating an example of an operation of the information providing apparatus according to the second exemplary embodiment.

図6に示す本実施形態の動作の例は、図4に示す第1の実施形態の動作の例にステップS9およびステップS10を追加したものである。ステップS1からS6の処理については第1の実施形態と同様であるため、ステップS7以降の処理についてのみ説明する。   The example of the operation of this embodiment shown in FIG. 6 is obtained by adding steps S9 and S10 to the example of the operation of the first embodiment shown in FIG. Since the processing of steps S1 to S6 is the same as that of the first embodiment, only the processing after step S7 will be described.

ステップS6において情報クラスタを作成すると、利用者選択部107は、情報クラスタから興味度が高い順に利用者データを抽出し、抽出した利用者データを利用者グループデータに割り当てる(ステップS7)。ここでは、利用者選択部107は、第1の実施形態と異なり、1の利用者データが、1の利用者グループデータにだけ所属するように制御せず、利用者データを複数の利用者グループデータに所属させることができる。   When an information cluster is created in step S6, the user selection unit 107 extracts user data from the information cluster in descending order of interest, and assigns the extracted user data to user group data (step S7). Here, unlike the first embodiment, the user selection unit 107 does not control one user data so that it belongs only to one user group data, and the user data is stored in a plurality of user groups. Can belong to data.

次いで、利用者選択部107は、複数の利用者グループに所属している利用者が存在するか否かを判断する(ステップS9)。すなわち、利用者選択部107は、複数の利用者グループデータに含まれる利用者データが存在するか否かを判断する。   Next, the user selection unit 107 determines whether there are users belonging to a plurality of user groups (step S9). That is, the user selection unit 107 determines whether user data included in a plurality of user group data exists.

複数の利用者グループに所属している利用者が存在すると判断した場合には、利用者選択部107は、利用者に対して、所属している利用者グループに対応する情報クラスタに関するメタ情報を提示する(ステップS10)。具体的には、利用者選択部107は、ディスプレイ装置等の表示装置に複数の情報クラスタのメタ情報を表示させるように制御する。   If it is determined that there are users belonging to a plurality of user groups, the user selection unit 107 gives meta information about the information cluster corresponding to the user groups to which the user belongs. Present (step S10). Specifically, the user selection unit 107 performs control so that meta information of a plurality of information clusters is displayed on a display device such as a display device.

利用者選択部107は、情報クラスタに含まれる情報を表現するメタ情報を利用者に提示するために、例えば、各情報クラスタからTF−IDFなどの指標によりM語の特徴語を抽出し、利用者に特徴語を提示する。このような処理が実行されることで、利用者は各情報クラスタにどのような情報が含まれているのかを知ることができる。なお、特徴語を抽出するためのTF−IDFに関しては、例えば文献(徳永健伸著、「情報検索と言語処理(言語と計算)」東京大学出版会、1999年11月発行、p.32)に記載されている。   The user selection unit 107 extracts, for example, feature words of M words from each information cluster by using an index such as TF-IDF in order to present meta information representing information included in the information cluster to the user. Present characteristic words to the person. By executing such processing, the user can know what information is included in each information cluster. Note that TF-IDF for extracting feature words is described in, for example, a document (Takenobu Tokunaga, “Information Retrieval and Language Processing (Language and Calculation)”, University of Tokyo Press, November 1999, p. 32). Have been described.

これによって、複数の利用者グループに所属した利用者は、情報クラスタにどのような情報が含まれているのかを知ることができるので、そのときの利用者の好みに応じた情報を選択し、情報の提供を受けることができる。   As a result, users belonging to multiple user groups can know what information is included in the information cluster, so select the information according to the user's preference at that time, Information can be provided.

そして、メタ情報を見た利用者がいずれかの情報クラスタ(すなわち、所属する利用者グループ)を選択する操作を行うと、利用者選択部107は、利用者の操作に従って、対応する利用者データを選択した利用者グループデータにのみ割り当てる処理を行う。   When the user who has seen the meta information performs an operation of selecting one of the information clusters (that is, the user group to which the user belongs), the user selection unit 107 performs corresponding user data according to the user's operation. Allocate only to the user group data selected.

次いで、情報出力部106は、割り当てなおした利用者グループデータに基づいて、利用者グループに対して、対応する情報クラスタに含まれる情報を提供する(ステップS8)。具体的には、情報出力部106は、ディスプレイ装置等の表示装置に情報を表示させるように制御することで、利用者グループに情報を提供する。   Next, the information output unit 106 provides the information included in the corresponding information cluster to the user group based on the reassigned user group data (step S8). Specifically, the information output unit 106 provides information to the user group by performing control so that information is displayed on a display device such as a display device.

このように、本実施形態では、第1の実施形態の効果に加え、利用者に対して興味度の高い複数の情報クラスタを提示して選択させることで、より利用者の興味に合致した情報を提供することができる。   As described above, in this embodiment, in addition to the effects of the first embodiment, by presenting and selecting a plurality of information clusters having a high degree of interest for the user, information that more matches the user's interest Can be provided.

以上に説明したように、本発明によれば、情報に対する各利用者の興味の度合いに基づいて情報をクラスタリングし、情報クラスタに対して興味度の高い順に利用者を割り当てて利用者グループを作成する。そして、その際に全利用者が必ずいずれかの情報クラスタに割り当たるようにして利用者グループを作成する。そのため、提供する情報に対して興味を持たないような人がいないように利用者をグループ化し、個々の利用者グループに所属する全利用者が興味を持てる情報を提供することができる。   As described above, according to the present invention, information is clustered based on the degree of interest of each user with respect to information, and a user group is created by assigning users to the information cluster in descending order of interest. To do. At that time, a user group is created so that all users are always assigned to one of the information clusters. Therefore, users can be grouped so that there is no person who is not interested in the information to be provided, and information that all users belonging to individual user groups can be interested in can be provided.

次に、本発明による情報提供装置の最小構成について説明する。図7は、情報提供装置の最小の構成例を示すブロック図である。図7に示すように、利用者を分類した利用者グループに情報を提供する情報提供装置は、最小の構成要素として、利用者グループ作成手段1を含む。   Next, the minimum configuration of the information providing apparatus according to the present invention will be described. FIG. 7 is a block diagram illustrating a minimum configuration example of the information providing apparatus. As shown in FIG. 7, an information providing apparatus that provides information to a user group into which users are classified includes a user group creating means 1 as a minimum component.

図7に示す最小構成の情報提供装置では、利用者グループ作成手段1は、利用者の情報に対する興味の度合いを推定し、興味の度合いに基づいて情報を分類して情報クラスタを作成し、情報クラスタと興味の度合いとに基づいて利用者グループを作成する。   In the information providing apparatus with the minimum configuration shown in FIG. 7, the user group creation means 1 estimates the degree of interest in the user's information, classifies the information based on the degree of interest, creates an information cluster, Create user groups based on clusters and degree of interest.

従って、最小構成の情報提供装置によれば、同じ場所に集まった利用者に会話の話題となる情報を提供する際、提供する情報に対して興味を持たないような人がいないように利用者をグループ化し、個々の利用者グループに所属する全利用者が興味を持てる情報を提供することができる。   Therefore, according to the information providing apparatus with the minimum configuration, when providing information that becomes a topic of conversation to users gathered in the same place, there is no user who is not interested in the information to be provided. Can be grouped to provide information that all users belonging to individual user groups are interested in.

なお、本実施形態では、以下の(1)〜(5)に示すような情報提供装置の特徴的構成が示されている。   In this embodiment, the characteristic configuration of the information providing apparatus as shown in the following (1) to (5) is shown.

(1)情報提供装置は、利用者を分類した利用者グループに情報を提供する情報提供装置であって、利用者の情報に対する興味の度合い(例えば、興味度)を推定し、興味の度合いに基づいて情報を分類して情報クラスタを作成し、情報クラスタと興味の度合いとに基づいて利用者グループを作成する利用者グループ作成手段(例えば、利用者グループ作成部102によって実現される)を備えることを特徴とする。   (1) An information providing apparatus is an information providing apparatus that provides information to a user group into which users are classified, and estimates the degree of interest (for example, degree of interest) of the user's information. A user group creation unit (for example, realized by the user group creation unit 102) that creates an information cluster by classifying information based on the information cluster and a degree of interest is provided. It is characterized by that.

(2)情報提供装置は、文字列で表される情報と、情報の特徴要素集合と、情報の特徴要素集合で利用者の興味を表した利用者興味情報とを入力とし、利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供装置であって、情報、特徴要素集合および利用者興味情報に基づいて、利用者毎の各情報に対する興味の度合い(例えば、興味度)を推定し、興味の度合いに応じて情報を分類して情報クラスタを作成し、情報クラスタから興味の度合いに基づいて利用者グループを作成する利用者グループ作成手段(例えば、利用者グループ作成部102によって実現される)を備えることを特徴とする。   (2) The information providing apparatus inputs information represented by a character string, a feature element set of information, and user interest information representing the user's interest in the information feature element set, and classifies the user. An information providing apparatus that creates a user group and provides information to the user group, and the degree of interest in each piece of information for each user based on the information, the feature element set, and the user interest information ( For example, a user group creation means (for example, use) that estimates an interest level, classifies information according to the degree of interest, creates an information cluster, and creates a user group based on the degree of interest from the information cluster A person group creation unit 102).

(3)情報提供装置において、特徴要素は、情報中に出現する単語を次元とし、単語の出現頻度を値とする情報ベクトルであり、利用者興味情報は、利用者が閲覧した情報中の単語を次元とし、単語の利用者が閲覧した情報中の出現頻度を値とする利用者興味ベクトルであり、利用者グループ作成手段は、情報ベクトルと利用者興味ベクトルとに基づいて、各情報に対する利用者毎の興味の度合いを、情報ベクトルと利用者興味ベクトルとの類似性から推定し、各情報に対して、利用者を次元とし、興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成手段(例えば、情報興味ベクトル作成部103によって実現される)と、情報興味ベクトルを用いて情報をクラスタリングする情報クラスタ作成手段(例えば、情報クラスタ作成部104によって実現される)と、情報クラスタに対して、興味の度合いの高い利用者を、利用者グループを作成するために情報クラスタ中の情報ベクトルから抽出する利用者抽出手段(例えば、利用者抽出部105によって実現される)とを含むように構成されていてもよい。   (3) In the information providing device, the feature element is an information vector having a word appearing in the information as a dimension and the word appearance frequency as a value, and the user interest information is a word in the information viewed by the user Is a user interest vector whose value is the appearance frequency in the information viewed by the user of the word, and the user group creation means uses each information based on the information vector and the user interest vector. Information interest that estimates the degree of interest for each person from the similarity between the information vector and the user interest vector, and creates an information interest vector for each piece of information with the user as the dimension and the degree of interest as the value Vector creation means (for example, realized by the information interest vector creation unit 103) and information cluster creation means for clustering information using the information interest vector (for example, information cluster) And a user extraction means (for example, a user extraction means for extracting a user who is highly interested in an information cluster from an information vector in the information cluster in order to create a user group). (Implemented by the user extraction unit 105).

(4)情報提供装置において、利用者グループ作成手段は、特徴要素として用いる情報中に出現する単語を次元とし、単語の出現頻度を値とする情報ベクトルと、利用者興味情報として用いる利用者が閲覧した情報中の単語を次元とし、単語の利用者が閲覧した情報中の出現頻度を値とする利用者興味ベクトルとに基づいて、各情報に対する利用者毎の興味の度合いを、情報ベクトルと利用者興味ベクトルとの類似性から推定し、各情報に対して、利用者を次元とし、興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成手段(例えば、情報興味ベクトル作成部103によって実現される)と、情報興味ベクトルを用いて情報をクラスタリングする情報クラスタ作成手段(例えば、情報クラスタ作成部104によって実現される)と、作成した情報クラスタの特徴を表すデータを利用者に提示し、利用者の選択操作に従って、利用者に対応する情報クラスタを選択する利用者選択手段(例えば、利用者選択部107によって実現される)とを含むように構成されていてもよい。   (4) In the information providing apparatus, the user group creating means is configured such that a word appearing in information used as a feature element is a dimension, an information vector having a word appearance frequency as a value, and a user used as user interest information. Based on the user interest vector having the word in the browsed information as a dimension and the appearance frequency in the information browsed by the user of the word as a value, the degree of interest for each user for each information is expressed as an information vector. Information interest vector creation means (for example, an information interest vector creation unit) that creates an information interest vector that is estimated from the similarity to the user interest vector and takes the user as a dimension and the degree of interest as a value for each information 103) and information cluster creation means for clustering information using the information interest vector (for example, the information cluster creation unit 104 The user selection means (for example, the user selection unit 107) presents data representing the characteristics of the created information cluster to the user and selects an information cluster corresponding to the user according to the user's selection operation. May be included).

(5)情報提供装置において、作成した利用者グループに対応する情報クラスタに含まれる情報を表示装置に表示させるように制御する表示制御手段(例えば、情報出力部106によって実現される)を備えるように構成されていてもよい。   (5) The information providing apparatus includes display control means (for example, realized by the information output unit 106) that controls the display apparatus to display information included in the information cluster corresponding to the created user group. It may be configured.

本発明は、周囲の人と話しやすく、知らない人同士を知り合わせたり、知っている人をさらに仲良くさせたりする環境を提供する用途に適用できる。   INDUSTRIAL APPLICABILITY The present invention can be applied to an application that provides an environment that makes it easy to talk with people around and knows strangers and makes friends better.

1 利用者グループ作成手段
100 情報単語頻度記憶部
101 利用者興味記憶部
102 利用者グループ作成部
103 情報興味ベクトル作成部
104 情報クラスタ作成部
105 利用者抽出部
106 情報出力部
107 利用者選択部
DESCRIPTION OF SYMBOLS 1 User group creation means 100 Information word frequency memory | storage part 101 User interest memory | storage part 102 User group creation part 103 Information interest vector creation part 104 Information cluster creation part 105 User extraction part 106 Information output part 107 User selection part

Claims (8)

文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力とし、前記利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供装置であって、
前記各情報に対する前記利用者毎の興味の度合いを、前記情報ベクトルと前記利用者興味ベクトルとの類似性から推定し、前記各情報に対して、利用者を次元とし、前記興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成手段と、
前記情報興味ベクトルを用いて前記情報をクラスタリングする情報クラスタ作成手段と、
前記情報クラスタに対して、前記興味の度合いが高い利用者を、利用者グループを作成するために当該情報クラスタ中の情報ベクトルから抽出する利用者抽出手段とを備えた
ことを特徴とする情報提供装置。
An information vector representing the characteristics of the information represented by the character string and a user interest vector representing the characteristics of the information browsed by the user are input, classify the users, create a user group, An information providing device for providing information to a user group,
The degree of interest for each user with respect to each piece of information is estimated from the similarity between the information vector and the user interest vector, and for each piece of information, the user is taken as a dimension, and the degree of interest is a value. An information interest vector creating means for creating an information interest vector,
Information cluster creating means for clustering the information using the information interest vector;
User providing means for extracting users who are highly interested in the information cluster from information vectors in the information cluster in order to create a user group apparatus.
文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力とし、前記利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供装置であって、
前記各情報に対する前記利用者毎の興味の度合いを、前記情報ベクトルと前記利用者興味ベクトルとの類似性から推定し、前記各情報に対して、利用者を次元とし、前記興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成手段と、
前記情報興味ベクトルを用いて前記情報をクラスタリングする情報クラスタ作成手段と、
作成した前記情報クラスタの特徴を表すデータを前記利用者に提示し、前記利用者の選択操作に従って、前記利用者に対応する情報クラスタを選択する利用者選択手段とを備えた
ことを特徴とする情報提供装置。
An information vector representing the characteristics of the information represented by the character string and a user interest vector representing the characteristics of the information browsed by the user are input, classify the users, create a user group, An information providing device for providing information to a user group,
The degree of interest for each user with respect to each piece of information is estimated from the similarity between the information vector and the user interest vector, and for each piece of information, the user is taken as a dimension, and the degree of interest is a value. An information interest vector creating means for creating an information interest vector,
Information cluster creating means for clustering the information using the information interest vector;
It comprises user selection means for presenting data representing the characteristics of the created information cluster to the user and selecting an information cluster corresponding to the user in accordance with the selection operation of the user. Information providing device.
情報ベクトルは、情報中に出現する単語を次元とし、当該単語の出現頻度を値とするベクトルであり、The information vector is a vector having a word appearing in the information as a dimension and the appearance frequency of the word as a value,
利用者興味ベクトルは、利用者が閲覧した情報中の単語を次元とし、当該単語の前記利用者が閲覧した情報中の出現頻度を値とするベクトルであるThe user interest vector is a vector whose dimension is a word in the information viewed by the user and whose value is the appearance frequency of the word in the information browsed by the user.
請求項1または請求項2に記載の情報提供装置。The information providing apparatus according to claim 1 or 2.
作成した利用者グループに対応する情報クラスタに含まれる情報を表示装置に表示させるように制御する表示制御手段を備えた
請求項1から請求項3のうちのいずれか1項に記載の情報提供装置。
Provided with a display control means for controlling the display device to display information included in the information cluster corresponding to the created user group
The information providing apparatus according to any one of claims 1 to 3 .
コンピュータが、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力し、前記利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供方法であって、
前記コンピュータが、
前記各情報に対する前記利用者毎の興味の度合いを、前記情報ベクトルと前記利用者興味ベクトルとの類似性から推定し、前記各情報に対して、利用者を次元とし、前記興味の度合いを値とする情報興味ベクトルを作成し、
前記情報興味ベクトルを用いて前記情報をクラスタリングし、
前記情報クラスタに対して、前記興味の度合いが高い利用者を、利用者グループを作成するために当該情報クラスタ中の情報ベクトルから抽出する
ことを特徴とする情報提供方法。
The computer inputs an information vector representing the characteristics of the information represented by a character string and a user interest vector representing the characteristics of the information viewed by the user, classifies the users, and sets a user group. An information providing method for creating and providing information to a user group,
The computer is
The degree of interest for each user with respect to each piece of information is estimated from the similarity between the information vector and the user interest vector, and for each piece of information, the user is taken as a dimension, and the degree of interest is a value. Create an information interest vector
Clustering the information using the information interest vector;
A method for providing information , wherein a user who is highly interested in the information cluster is extracted from an information vector in the information cluster in order to create a user group .
コンピュータが、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力し、前記利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する情報提供方法であって、The computer inputs an information vector representing the characteristics of the information represented by a character string and a user interest vector representing the characteristics of the information viewed by the user, classifies the users, and sets a user group. An information providing method for creating and providing information to a user group,
前記コンピュータが、The computer is
前記各情報に対する前記利用者毎の興味の度合いを、前記情報ベクトルと前記利用者興味ベクトルとの類似性から推定し、前記各情報に対して、利用者を次元とし、前記興味の度合いを値とする情報興味ベクトルを作成し、The degree of interest for each user with respect to each piece of information is estimated from the similarity between the information vector and the user interest vector, and for each piece of information, the user is taken as a dimension, and the degree of interest is a value. Create an information interest vector
前記情報興味ベクトルを用いて前記情報をクラスタリングし、Clustering the information using the information interest vector;
作成した前記情報クラスタの特徴を表すデータを前記利用者に提示し、前記利用者の選択操作に従って、前記利用者に対応する情報クラスタを選択するThe data representing the characteristics of the created information cluster is presented to the user, and the information cluster corresponding to the user is selected according to the user's selection operation.
ことを特徴とする情報提供方法。An information providing method characterized by the above.
コンピュータに、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力し、前記利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する処理を実行させるための情報提供プログラムであって、
前記コンピュータに、
前記各情報に対する前記利用者毎の興味の度合いを、前記情報ベクトルと前記利用者興味ベクトルとの類似性から推定し、前記各情報に対して、利用者を次元とし、前記興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成処理と、
前記情報興味ベクトルを用いて前記情報をクラスタリングする情報クラスタ作成処理と、
前記情報クラスタに対して、前記興味の度合いが高い利用者を、利用者グループを作成するために当該情報クラスタ中の情報ベクトルから抽出する利用者抽出処理とを
実行させるための情報提供プログラム。
An information vector representing the characteristics of the information represented by the character string and a user interest vector representing the characteristics of the information browsed by the user are input to the computer, the users are classified, and a user group is defined. An information providing program for creating and executing a process for providing information to a user group,
In the computer,
The degree of interest for each user with respect to each piece of information is estimated from the similarity between the information vector and the user interest vector, and for each piece of information, the user is taken as a dimension, and the degree of interest is a value. An information interest vector creation process for creating an information interest vector,
An information cluster creation process for clustering the information using the information interest vector;
An information providing program for executing, on the information cluster, a user extraction process of extracting a user having a high degree of interest from an information vector in the information cluster in order to create a user group .
コンピュータに、文字列で表される情報の特徴を表す情報ベクトルと、利用者が閲覧した情報の特徴を表す利用者興味ベクトルと、を入力し、前記利用者を分類して、利用者グループを作成し、利用者グループに情報を提供する処理を実行させるための情報提供プログラムであって、An information vector representing the characteristics of the information represented by the character string and a user interest vector representing the characteristics of the information browsed by the user are input to the computer, the users are classified, and a user group is defined. An information providing program for creating and executing a process for providing information to a user group,
前記コンピュータに、In the computer,
前記各情報に対する前記利用者毎の興味の度合いを、前記情報ベクトルと前記利用者興味ベクトルとの類似性から推定し、前記各情報に対して、利用者を次元とし、前記興味の度合いを値とする情報興味ベクトルを作成する情報興味ベクトル作成処理と、The degree of interest for each user with respect to each piece of information is estimated from the similarity between the information vector and the user interest vector, and for each piece of information, the user is taken as a dimension, and the degree of interest is a value. An information interest vector creation process for creating an information interest vector,
前記情報興味ベクトルを用いて前記情報をクラスタリングする情報クラスタ作成処理と、An information cluster creation process for clustering the information using the information interest vector;
作成した前記情報クラスタの特徴を表すデータを前記利用者に提示し、前記利用者の選択操作に従って、前記利用者に対応する情報クラスタを選択する利用者選択処理とをUser selection processing for presenting data representing the characteristics of the created information cluster to the user, and selecting an information cluster corresponding to the user according to the user's selection operation.
実行させるための情報提供プログラム。An information provision program for execution.
JP2010248421A 2010-11-05 2010-11-05 Information providing apparatus, method and program Active JP5598265B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010248421A JP5598265B2 (en) 2010-11-05 2010-11-05 Information providing apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010248421A JP5598265B2 (en) 2010-11-05 2010-11-05 Information providing apparatus, method and program

Publications (2)

Publication Number Publication Date
JP2012099057A JP2012099057A (en) 2012-05-24
JP5598265B2 true JP5598265B2 (en) 2014-10-01

Family

ID=46390868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010248421A Active JP5598265B2 (en) 2010-11-05 2010-11-05 Information providing apparatus, method and program

Country Status (1)

Country Link
JP (1) JP5598265B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194725A (en) * 1998-12-25 2000-07-14 Just Syst Corp Similar group extractor and storage medium stored with similar group extraction program
JP2001075972A (en) * 1999-08-31 2001-03-23 Nippon Telegr & Teleph Corp <Ntt> Method and device for dynamically developing user group and recording medium recording dynamic user group generation program
JP2005070864A (en) * 2003-08-27 2005-03-17 Dainippon Printing Co Ltd Information recommendation device, information recommendation method, computer and recording medium
JP2010218353A (en) * 2009-03-18 2010-09-30 Oki Electric Ind Co Ltd Clustering device and clustering method

Also Published As

Publication number Publication date
JP2012099057A (en) 2012-05-24

Similar Documents

Publication Publication Date Title
JP6487201B2 (en) Method and apparatus for generating recommended pages
US20200401908A1 (en) Curated data platform
US8352396B2 (en) Systems and methods for improving web site user experience
US20150120713A1 (en) Systems and Methods for Determining Influencers in a Social Data Network
US20130254280A1 (en) Identifying influential users of a social networking service
An et al. Personas for content creators via decomposed aggregate audience statistics
CN104751354B (en) A kind of advertisement crowd screening technique
JP2010176327A (en) Learning device, learning method, information-processing device, data-selecting method, data-accumulating method, data-converting method, and program
JP2011175362A (en) Information processing apparatus, importance level calculation method, and program
WO2020224128A1 (en) News recommendation method and apparatus based on short-term interest of user, and electronic device and medium
Sisodia et al. Fast prediction of web user browsing behaviours using most interesting patterns
JP5318034B2 (en) Information providing apparatus, information providing method, and information providing program
JP6065907B2 (en) Information processing apparatus, information processing method, and program
JP2015018559A (en) Method for enriching multimedia content, and corresponding device
US9020863B2 (en) Information processing device, information processing method, and program
KR101931624B1 (en) Trend Analyzing Method for Fassion Field and Storage Medium Having the Same
JP6042790B2 (en) Trend analysis apparatus, trend analysis method, and trend analysis program
JP2013105257A (en) Keyword acquisition device, content provision system, keyword acquisition method, program, and content provision method
JP5292247B2 (en) Content tag collection method, content tag collection program, content tag collection system, and content search system
JP5598265B2 (en) Information providing apparatus, method and program
JP6373767B2 (en) Topic word ranking device, topic word ranking method, and program
Kadam et al. Big data analytics-recommendation system with Hadoop Framework
JP5802597B2 (en) Classification device, classification system, classification method, and classification program
Xue et al. Sequential correspondence hierarchical Dirichlet processes for video data analysis
JP2013214149A (en) Classification device, classification system, classification method, and classification program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140715

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140728

R150 Certificate of patent or registration of utility model

Ref document number: 5598265

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150