JP2009157764A - Community system, activity recording method for community system, and program for activity recording of community system - Google Patents

Community system, activity recording method for community system, and program for activity recording of community system Download PDF

Info

Publication number
JP2009157764A
JP2009157764A JP2007336919A JP2007336919A JP2009157764A JP 2009157764 A JP2009157764 A JP 2009157764A JP 2007336919 A JP2007336919 A JP 2007336919A JP 2007336919 A JP2007336919 A JP 2007336919A JP 2009157764 A JP2009157764 A JP 2009157764A
Authority
JP
Japan
Prior art keywords
activity
user
keyword
matrix
community
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007336919A
Other languages
Japanese (ja)
Other versions
JP5243783B2 (en
Inventor
Risa Nishiyama
莉紗 西山
Akiko Suzuki
明子 鈴木
Shiro Ando
史郎 安藤
Raymond Rudy
ルディー レイモンド
Hideyuki Mizuta
秀行 水田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2007336919A priority Critical patent/JP5243783B2/en
Priority to CN 200810178618 priority patent/CN101470754B/en
Publication of JP2009157764A publication Critical patent/JP2009157764A/en
Application granted granted Critical
Publication of JP5243783B2 publication Critical patent/JP5243783B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To handle indices of a plurality of activities, in a unified manner, such as writing of a blog, reading of a news, and reading of a massage in an online community such as an SNS. <P>SOLUTION: The actions of a single or a plurality of users online are accumulated together with text information used in accordance with the actions, to generate data used for extracting and matching taste. Thus, analyzing of action/taste of a user which has been performed based on one-dimensional information so far can be performed from two observation points, or action and taste, or from the observation point of integration of them, allowing analysis of action/taste with more information quantity. The data format by which the action of user along with text information are accumulated is called as action matrix for convenience. The action matrix is such a matrix as consists of action of a user and a keyword extracted from the text used with the action. In each element, a value based on the appearance frequency of keywords accumulated upto a certain time point is inputted. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

この発明は、ソーシャル・ネットワーキング・サービス(SNS)等のように、ネットワークを介して、複数のユーザが、自らのクライアント・コンピュータを用いて、サーバ・システムにログインし、サーバ上で互いにコミュニケーションを図る、オンライン・コミュニティ・システムに関するものである。   In the present invention, a plurality of users use their own client computers to log in to a server system and communicate with each other on the server via a network, such as a social networking service (SNS). , On online community systems.

Web2.0技術が浸透するにつれて、CGM(customer generated media = カスタマが生成したメディア)あるいは、ソーシャル・ネットワーキング・サービス(SNS)のようなオンライン・コミュニティにおいて、一般ユーザがブログ(日記)を書く、ニュースを読む、商品情報を検索する、などの様々な活動を活発に行っている。   As Web 2.0 technology permeates, general users write blogs (diaries) in online communities like CGM (customer generated media) or social networking services (SNS), news We are actively engaged in various activities such as reading product information and searching for product information.

そこで、このような活動のログから、個々のユーザがもつ興味や関心を抽出し、マーケティングなどの企業活動に活用することが検討されている。   Therefore, it has been studied to extract the interests and interests of individual users from such activity logs and to utilize them for corporate activities such as marketing.

例えば、特開2007−241753号公報は、サーバに、個人の興味情報が概念階層化されたパーソナルオントロジの雛形である雛形オントロジを保持し、パーソナルオントロジ抽出手段は、雛形オントロジのルートクラスから、そのクラスまたはインスタンスまでの直接的な子孫クラスおよびインスタンスをパーソナルオントロジとして抽出し、意外情報抽出手段は、近似度が所定値以上のパーソナルオントロジ間において、一方のパーソナルオントロジには含まれるが他方のパーソナルオントロジには含まれないクラスまたはインスタンスを意外情報として抽出し、意外情報提示手段は、意外情報抽出手段にて抽出された意外情報をその意外情報を持たないユーザに提示するようなシステムを開示する。   For example, Japanese Patent Application Laid-Open No. 2007-241753 holds, in a server, a model ontology that is a model of a personal ontology in which personal interest information is conceptually hierarchized. The direct descendant class and instance up to the class or instance are extracted as a personal ontology, and the unexpected information extraction means is included in one personal ontology between personal ontologies whose degree of approximation is a predetermined value or more, but the other personal ontology. A class or instance that is not included in is extracted as unexpected information, and the unexpected information presenting means discloses a system that presents the unexpected information extracted by the unexpected information extracting means to a user who does not have the unexpected information.

本出願人に係る特願2007−110559号明細書は、ウエブページ、ブログなどの読者が違和感をもつような広告の出現を抑制するため、記事中で言及されている企業・人物・製品等の事物のうちの該当するものに対して、「加害者」、「被害者」、「受益者」のうちのどれかの利害ラベルをシステム的に付与する技術を開示する。そして、このような利害ラベルに関連付けられた広告の出現が抑制されるように、広告選択機構が制御される。この目的で使用される広告選択機構は、記事と広告の親和性または関連性を数値として計算することでできるものであり、よって、広告の抑制は、その親和性の数値を減じることによって、達成される。なお、好適には、利害ラベルによる抑制度合いは、時間とともに次第に減衰するようになされる。この開示技術は、ウエブページにアクセスするユーザの心理状況をシステム的にモデリングする1つの試みである、ということもできる。   The specification of Japanese Patent Application No. 2007-110559 related to the present applicant is to prevent the appearance of advertisements such as web pages, blogs, etc. Disclose a technology that systematically assigns one of the interest labels of “perpetrator”, “victim”, and “beneficiary” to applicable items. Then, the advertisement selection mechanism is controlled so that the appearance of advertisements associated with such interest labels is suppressed. The ad selection mechanism used for this purpose can be calculated by calculating the affinity or relevance between the article and the advertisement as a numerical value, and therefore, suppression of the advertisement is achieved by reducing the numerical value of the affinity. Is done. Preferably, the degree of suppression by the interest label is gradually attenuated with time. This disclosed technique can be said to be one attempt to systematically model the psychological state of a user accessing a web page.

特に、特開2007−241753号公報の技術は、ユーザが書いたテキスト情報から興味を抽出しており、特願2007−110559号明細書に記載されている技術では、ユーザが読んだテキスト情報から興味を抽出している。このように、オンライン・コミュニティ上でユーザが取り得る行動または活動には様々な種類があり、このような複数の行動を統一的に取り扱う技術が要望される。   In particular, the technology disclosed in Japanese Patent Application Laid-Open No. 2007-241753 extracts interest from text information written by the user, and the technology described in Japanese Patent Application No. 2007-110559 is based on text information read by the user. Extracting interests. As described above, there are various types of actions or activities that a user can take on the online community, and a technique for uniformly handling such a plurality of actions is desired.

特開2005−327105号公報は、適切なコミュニティを見出すためのコミュニティ分析装置に関する。このコミュニティ分析装置は、少なくとも送信メールの発信者を識別する発信者識別記号と送信メールの受信者を識別する受信者識別記号とを含む情報を所定のメールサーバーから取得する取得部と、取得部が取得した情報から送受信者間に共通する興味度合いを表す共通興味度を計算する共通興味度分析部と、共通興味度分析部が求めた共通興味度から電子メール利用者が形成するコミュニティを分析する分析部を有する。分析部は、興味度行列を用いてコミュニティ間の関連度を計算することで電子メール利用者が形成するコミュニティを分析する。   JP-A-2005-327105 relates to a community analysis apparatus for finding an appropriate community. The community analyzer includes an acquisition unit that acquires information including at least a sender identification symbol for identifying a sender of a transmission mail and a receiver identification symbol for identifying a recipient of the transmission mail from a predetermined mail server; and an acquisition unit The common interest analysis unit that calculates the common interest level that represents the degree of interest common to the sender and receiver from the information acquired by the user, and the community formed by the e-mail user from the common interest level obtained by the common interest analysis unit Having an analysis unit. The analysis unit analyzes the community formed by the e-mail user by calculating the degree of association between the communities using the interest matrix.

特開2005−327105号公報は、行列を用いてコミュニティ間の関連度を計算するという点で、有用な技法を示唆する。しかし、送信メールからの解析という単一動作に関るものであり、依然として、複数の行動を統一的に取り扱う技術を教示するものではない。
特開2007−241753号公報 特願2007−110559号明細書 特開2005−327105号公報
Japanese Patent Laid-Open No. 2005-327105 suggests a useful technique in that the degree of association between communities is calculated using a matrix. However, it is related to a single operation of analysis from a sent mail, and still does not teach a technique for handling a plurality of actions in a unified manner.
JP 2007-241753 A Japanese Patent Application No. 2007-110559 JP 2005-327105 A

この発明の目的は、SNSのようなオンライン・コミュニティにおいて、ブログを書く、ニュースを読む、メッセージを読むなどの複数の行動の指標を統一的に扱うことを可能とする技術を提供することにある。   An object of the present invention is to provide a technology that makes it possible to uniformly handle a plurality of behavior indicators such as blog writing, reading news, reading messages, etc. in an online community such as SNS. .

この発明の他の目的は、オンライン・コミュニティにおいて、個人、グループまたはコミュニティにおいて計算された、複数の行動の指標を、個人間、グループまたはコミュニティ間、個人とグループまたはコミュニティの間で計算し、それによって有用な結果を与えるようにすることを可能とする技術を提供することにある。   Another object of the present invention is to calculate a plurality of behavioral indicators calculated between individuals, groups or communities, and between individuals and groups or communities in an online community. It is to provide a technique that makes it possible to give useful results.

本発明は、オンライン上における単一ユーザあるいは複数ユーザの行動を、その行動に伴って用いられるテキスト情報とともに蓄積し、嗜好の抽出やマッチングに用いるものである。これによって今まで行動あるいはテキストといった1次元的な情報に射影して行っていたユーザーの行動・嗜好の分析が、行動と嗜好の2つの観点あるいはそれを統合した観点で可能となり、より情報量の多い行動・嗜好分析を行うことを可能にする。ここで言う行動とは、これには限定されないが、ブログを書く/読む、メッセージを書く/読む、ニュースを読む、掲示板に書き込みをする/読む、商品を購入する、商品説明を読む、他ユーザのプロフィールを見る、などがある。   The present invention accumulates the actions of a single user or a plurality of users on the online together with text information used in accordance with the actions, and uses it for preference extraction and matching. This makes it possible to analyze the user's behavior and preferences that have been projected to one-dimensional information such as behavior or text, from the two viewpoints of behavior and preference, or from the viewpoint of integrating them. Enables a lot of behavior and preference analysis. The actions mentioned here are not limited to this, but write / read blogs, write / read messages, read news, write / read on bulletin boards, purchase products, read product descriptions, other users See their profile, etc.

本発明における、テキスト情報とともにユーザの行動を蓄積するために、保持されるデータ形式を、便宜上、行動マトリクスと呼ぶことにする。行動マトリクスのデータは、好適には、オンライン・コミュニティのサーバのハードディスク・ドライブなどに保持される。行動マトリクスは、ユーザーの行動と、その行動とともに用いられたテキスト中から抽出されたキーワードより構成される行列であり、各要素にはある時刻までに蓄積されたキーワードの出現頻度に基づいた値が入る。キーワード抽出の対象となる行動は、上記に例示したように複数あり、行動A={a1,a2,a3...}であるとする。行動マトリクスとは、ユーザーが行った行動aに伴うテキストdから抽出されるキーワードW={w1, w2, w3,...}を、行動aに対応させる形で蓄積したものである。ある行動ajにおいて伴われるテキストd中にキーワードwiが1回出現すると、行動マトリクスの要素ijに1(あるいはこれに重みを乗算した値)が入る。 In the present invention, in order to accumulate user actions together with text information, the data format held is referred to as an action matrix for convenience. The behavior matrix data is preferably held on a hard disk drive of an online community server or the like. The behavior matrix is a matrix composed of the user's behavior and keywords extracted from the text used together with the behavior, and each element has a value based on the appearance frequency of the keyword accumulated up to a certain time. enter. As illustrated above, there are a plurality of behaviors that are subject to keyword extraction, and behavior A = {a 1 , a 2 , a 3 . The behavior matrix is a storage of keywords W = {w 1 , w 2 , w 3 , ...} extracted from text d associated with the behavior a performed by the user in a form corresponding to the behavior a. . When the keyword w i appears once in the text d accompanied by a certain action a j , 1 (or a value obtained by multiplying this by a weight) is entered in the element ij of the action matrix.

また、この行動マトリクスは、好適には、過去の蓄積も反映する。本発明の1つの側面によれば、ある時刻Tiにおける行動マトリクスは、次の時刻Ti+1においてΔT=Ti+1-Tiの間の行動マトリクス(一時行動マトリクスと呼ぶ)を重み付けして混合する形で更新される。 The behavior matrix preferably also reflects past accumulation. According to one aspect of the present invention, an action matrix at a certain time T i is weighted with an action matrix (referred to as a temporary action matrix) between ΔT = T i + 1 -T i at the next time T i + 1 . And updated in a mixed form.

行動マトリクスは一人のユーザに一つ定義される。また、複数のユーザを一つの明示的コミュニティとする場合は、その行動を蓄積することによりコミュニティの行動マトリクスとして定義する。   One behavior matrix is defined for each user. Further, when a plurality of users are set as one explicit community, the behavior is accumulated and defined as a community behavior matrix.

このようにして作成された行動マトリクスを用いることにより、テキストの行動情報を伴った分析を行うことが可能である。例としては、二人のユーザを指定してその行動マトリクスを比較することにより、そのユーザーの行動、テキスト、また両方の観点からの重複している事象を発見するなどが挙げられる。   By using the action matrix created in this way, it is possible to perform analysis with text action information. Examples include specifying two users and comparing their behavior matrices to find duplicate events from both user behavior, text, and both perspectives.

本発明は、2つのシステムによって実現される。1つ目はユーザーの行動に伴うテキストからユーザーの一時行動マトリクスを生成し、その時点までに蓄積されている行動マトリクスと統合するシステムである。これはテキストからキーワードや嗜好情報などを抽出する言語処理部と、それらのテキストと行動から一時行動マトリクスを生成し、次に述べる行動マトリクス蓄積部に蓄積された行動マトリクスと統合する行動マトリクス生成部からなる。2つ目はそれらの行動マトリクスをユーザーごと、あるいは静的なコミュニティごとに蓄積し、分析や検索に用いるシステムである。このシステムは、行動マトリクスに対する様々な分析のためのインターフェース(API)を外部アプリケーション・プログラムに提供する。   The present invention is realized by two systems. The first is a system that generates a user's temporary action matrix from text associated with the user's action and integrates it with the action matrix accumulated up to that point. This is a language processing unit that extracts keywords and preference information from text, and a behavior matrix generation unit that generates a temporary behavior matrix from these texts and behaviors and integrates the behavior matrix stored in the behavior matrix storage unit described below. Consists of. The second is a system that accumulates these behavior matrices for each user or static community and uses them for analysis and search. This system provides an external application program with an interface (API) for various analyzes on the behavior matrix.

行動マトリクスの分析に必要な演算として、この行動マトリクスに特有な和・差・積と行・列の縮退が定義される。二つの行動マトリクスの和とは、それぞれの行動マトリクスを持つユーザ(あるいはコミュニティ)から、その2ユーザ(または2コミュニティ)を統合するような擬似的なユーザ(あるいはコミュニティ)の行動マトリクスを作成することに匹敵する。また、行動マトリクスの積によって、二つの行動マトリクスの行動・キーワードそして行動とキーワードがどのくらいの割合で相関を持っているかを求めることができる。また行の縮退、列の縮退はそれぞれその行動マトリクスの重み付キーワードベクトルないし重み付行動ベクトルを意味する。   As operations necessary for analyzing the behavior matrix, a sum / difference / product and a row / column degeneration specific to the behavior matrix are defined. The sum of two behavior matrices is to create a pseudo user (or community) behavior matrix that integrates the two users (or two communities) from the users (or communities) that have the respective behavior matrices. Comparable to In addition, by the product of the behavior matrix, the behavior / keywords of the two behavior matrices and the rate at which the behavior and the keyword are correlated can be obtained. Further, row reduction and column reduction mean weighted keyword vectors or weighted action vectors of the action matrix, respectively.

この発明によれば、SNSのようなオンライン・コミュニティにおいて、複数の行動と、複数のキーワードに跨る行動マトリクスを計算して、その結果を、コンピュータの記憶装置に保存し、ユーザまたはコミュニティ間で、行動マトリクスに対して、和、差、積、縮退などの様々な解析をコンピュータの演算によって行うことにより、従来知ることができなかった、複数の行動の中に隠れた統一的なユーザやコミュニティの傾向を明るみにすることができ、この結果は、マーケティング、セキュリティ、その他の目的で有効に使うことができるので、オンライン・コミュニティの価値自体も高まるのである。   According to the present invention, in an online community such as SNS, a plurality of actions and an action matrix across a plurality of keywords are calculated, and the result is stored in a storage device of a computer. By performing various computer analysis on the behavior matrix, such as sum, difference, product, and degeneracy, it is possible for the unified users and communities hidden in multiple behaviors that could not be known in the past. It can highlight trends, and the results can be used effectively for marketing, security, and other purposes, thus increasing the value of the online community itself.

以下、図面を参照して、本発明の実施例を説明する。特に断わらない限り、同一の参照番号は、図面を通して、同一の対象を指すものとする。また、以下で説明するのは、本発明の一実施形態であり、この発明を、この実施例で説明する内容に限定する意図はないことを理解されたい。   Embodiments of the present invention will be described below with reference to the drawings. Unless otherwise noted, the same reference numerals refer to the same objects throughout the drawings. Also, it is to be understood that what is described below is one embodiment of the present invention, and that the present invention is not intended to be limited to the contents described in this example.

図1において、オンライン・コミュニティ・サーバ102には、インターネット104を介して、複数のクライアント・コンピュータ106a、106b・・・106zが接続されている。図1のシステムにおいては、クライアント・コンピュータのユーザは、Webブラウザを通じて、インターネット104の回線を介して、オンライン・コミュニティ・サーバ102に、ログインする。具体的には、所定のURLをWebブラウザに打ち込んで、所定のページを表示する。なお、Webブラウザではなく、所定のクライアント・アプリケーション・プログラムを使ってログ・インするようにしてもよい。   1, a plurality of client computers 106a, 106b,... 106z are connected to the online community server 102 via the Internet 104. In the system of FIG. 1, a user of a client computer logs in to the online community server 102 through a line of the Internet 104 through a Web browser. Specifically, a predetermined URL is typed into a Web browser and a predetermined page is displayed. The log-in may be performed using a predetermined client application program instead of the Web browser.

ログインに当たっては、クライアント・コンピュータのユーザは、与えられたユーザIDと、それに関連付けられたパスワードを用いる。クライアント・コンピュータのユーザは、一旦ログインすると、オンライン・コミュニティ内で、日記を書いたり、アクセスを許可されている他人の日記を閲覧してコメントを書いたり、ニュースを見たり、気の合った仲間同士でグループを作成したり、チャットしたり、趣味のコミュニティを検索したり、などの活動を行う。   When logging in, the user of the client computer uses a given user ID and a password associated therewith. Once a client computer user logs in, he or she writes a diary in the online community, browses the diary of another person who is allowed access, writes a comment, sees the news, and is a good friend Activities such as creating groups with each other, chatting, and searching for hobby communities.

次に、図2を参照して、図1で参照番号106a、106b・・・106zのように示されているクライアント・コンピュータのハードウェア・ブロック図について、説明する。図2において、クライアント・コンピュータは、メイン・メモリ206、CPU204、IDEコントローラ208をもち、これらは、バス202に接続されている。バス202には更に、ディスプレイ・コントローラ214と、通信インターフェース218と、USBインターフェース220と、オーディオ・インターフェース222と、キーボード・マウス・コントローラ228が接続されている。IDEコントローラ208には、ハードディスク・ドライブ(HDD)210と、DVDドライブ212が接続されている。DVDドライブ212は、必要に応じて、CD−ROMやDVDから、プログラムを導入するために使用する。ディスプレイ・コントローラ214には、好適には、LCD画面をもつディスプレイ装置216が接続されている。ディスプレイ装置216には、Webブラウザを通じて、オンライン・コミュニティの画面が表示される。   Next, referring to FIG. 2, a hardware block diagram of the client computer indicated by reference numerals 106a, 106b... 106z in FIG. In FIG. 2, the client computer has a main memory 206, a CPU 204, and an IDE controller 208, which are connected to the bus 202. In addition, a display controller 214, a communication interface 218, a USB interface 220, an audio interface 222, and a keyboard / mouse controller 228 are connected to the bus 202. A hard disk drive (HDD) 210 and a DVD drive 212 are connected to the IDE controller 208. The DVD drive 212 is used for introducing a program from a CD-ROM or DVD as necessary. A display device 216 having an LCD screen is preferably connected to the display controller 214. The display device 216 displays an online community screen through a Web browser.

USBインターフェース220には、必要に応じて、専用コントローラ、加速度センサ・デバイスなどのデバイスを接続をすることができる。これらのデバイスは、オンライン・コミュニティ内での操作性を向上するために使用することができる。     Devices such as a dedicated controller and an acceleration sensor / device can be connected to the USB interface 220 as necessary. These devices can be used to improve operability within the online community.

オーディオ・インターフェース222には、スピーカ224と、マイク226が接続されている。このクライアント・コンピュータに、音声合成機能を備えることにより、オンライン・コミュニティ内で、相手とのチャット内容を、スピーカ224から音声化して出力することができる。また、さらに、音声認識機能を備えることにより、オンライン・コミュニティ内で、ユーザがマイク226に向かってしゃべった内容を、音声認識機能によってテキスト化し、相手に対して、チャットの内容として送出するようにすることができる。   A speaker 224 and a microphone 226 are connected to the audio interface 222. By providing the client computer with a speech synthesis function, the chat content with the other party can be voiced and output from the speaker 224 in the online community. Further, by providing a voice recognition function, the contents spoken by the user to the microphone 226 in the online community are converted into text by the voice recognition function and sent to the other party as chat contents. can do.

キーボード・マウス・コントローラ228には、キーボード230と、マウス232が接続されている。キーボード230は、典型的には、オンライン・コミュニティ内で、チャットのメッセージを書いたり、検索したいコミュニティ内容を記述したするために使用される。マウス232は、オンライン・コミュニティ内で、リンクをクリックしてニュースを読んだり、メニューから動作を選択し実行したり、読みたい日記を選んだりするために使用される。   A keyboard 230 and a mouse 232 are connected to the keyboard / mouse controller 228. The keyboard 230 is typically used in an online community to write a chat message or describe community content to be searched. The mouse 232 is used in the online community to click on a link to read news, select and execute an action from a menu, or select a diary to read.

CPU204は、例えば、32ビット・アーキテクチャまたは64ビット・アーキテクチャに基づく任意のものでよく、インテル社のPentium(インテル・コーポレーションの商標)4、AMD社のAthlon(商標)などを使用することができる。   The CPU 204 may be, for example, an arbitrary one based on a 32-bit architecture or a 64-bit architecture, and Intel Pentium (trademark of Intel Corporation) 4, AMD Athlon (trademark), or the like can be used.

ハードディスク・ドライブ210には、少なくとも、オペレーティング・システムと、オペレーティング・システム上で動作するWebブラウザ(図示しない)が格納されており、システムの起動時に、オペレーティング・システムは、メインメモリ206にロードされる。オペレーティング・システムは、Windows XP(マイクロソフト・コーポレーションの商標)、Windows Vista(マイクロソフト・コーポレーションの商標)、Linux(Linus Torvaldsの商標)などを使用することができる。   The hard disk drive 210 stores at least an operating system and a web browser (not shown) that runs on the operating system, and the operating system is loaded into the main memory 206 when the system starts up. . As the operating system, Windows XP (a trademark of Microsoft Corporation), Windows Vista (a trademark of Microsoft Corporation), Linux (a trademark of Linus Torvalds), or the like can be used.

通信インターフェース218は、オペレーティング・システムが提供するTCP/IP通信機能を利用して、イーサネット(商標)・プロトコルなどにより、オンライン・コミュニティ・サーバ102と、通信する。   The communication interface 218 uses the TCP / IP communication function provided by the operating system to communicate with the online community server 102 using the Ethernet (trademark) protocol or the like.

図3は、オンライン・コミュニティ・プロバイダ側のハードウェア構成の概要ブロック図である。図3に示すように、クライアント・コンピュータ106a、106b・・・106zは、インターネット104を経由して、オンライン・コミュニティ・サーバ102の通信インターフェース302に接続される。通信通信インターフェース302はさらに、バス304に接続され、バス304には、CPU306、主記憶(RAM)308、及びハードディスク・ドライブ(HDD)310が接続されている。   FIG. 3 is a schematic block diagram of a hardware configuration on the online community provider side. As shown in FIG. 3, client computers 106 a, 106 b... 106 z are connected to the communication interface 302 of the online community server 102 via the Internet 104. The communication interface 302 is further connected to a bus 304, and a CPU 306, a main memory (RAM) 308, and a hard disk drive (HDD) 310 are connected to the bus 304.

図示しないが、オンライン・コミュニティ・サーバ102にはさらに、キーボード、マウス、及びディスプレイが接続され、これらによって、オンライン・コミュニティ・サーバ102全体の管理やメンテナンス作業を行うようにしてもよい。   Although not shown, a keyboard, a mouse, and a display may be further connected to the online community server 102, and the entire online community server 102 may be managed and maintained by these.

オンライン・コミュニティ・サーバ102のハードディスク・ドライブ310には、オペレーティング・システム、クライアント・コンピュータクライアント・コンピュータ106a、106b・・・106zのログイン管理のための、ユーザIDとパスワードの対応テーブルが保存されている。ハードディスク・ドライブ310にはさらに、オンライン・コミュニティ・サーバ102をWebサーバとして機能させるためのApacheなどのソフトウェアが保存され、オンライン・コミュニティ・サーバ102の立ち上げ時に、主記憶308にロードされて、動作する。これによって、クライアント・コンピュータ106a、106b・・・106zが、TCP/IPのプロトコルで、オンライン・コミュニティ・サーバ102にアクセスすることが可能となる。   The hard disk drive 310 of the online community server 102 stores a correspondence table of user IDs and passwords for login management of operating systems, client computers, client computers 106a, 106b,... 106z. . The hard disk drive 310 further stores software such as Apache for causing the online community server 102 to function as a Web server, and is loaded into the main memory 308 when the online community server 102 is started up. To do. As a result, the client computers 106a, 106b,... 106z can access the online community server 102 using the TCP / IP protocol.

オンライン・コミュニティ・サーバ102のハードディスク・ドライブ310にはさらに、このオンライン・コミュニティ・サービスの各ユーザのメッセージ、日記またはブログ、掲示板などの情報と、オンライン・コミュニティ・サービスの情報が、好適には、HTMLファイルと、グラフィック・イメージ、動画ファイル、音楽ファイルなどのマルチメディア形式で、保存されている。   In addition, the hard disk drive 310 of the online community server 102 further includes information on messages, diaries or blogs, bulletin boards, etc. of each user of the online community service, and information on the online community service. An HTML file and a multimedia format such as a graphic image, a moving image file, and a music file are stored.

日記またはブログ、及び掲示板には、当該ユーザが書き込むことができ、他のユーザは、許された権限に応じて、ブログ、掲示板を読んだり、コメントを付けたりすることができる。   The user can write in the diary or the blog and the bulletin board, and other users can read the blog and the bulletin board and make comments according to the authorized authority.

後で詳しく説明するが、ハードディスク・ドライブ310には、本発明に係る行動マトリクスを計算するためのモジュール、計算された行動マトリクスから、さまざまな情報を取り出すために演算を施すモジュール、などが保存されている。   As will be described in detail later, the hard disk drive 310 stores a module for calculating an action matrix according to the present invention, a module for performing calculations to extract various information from the calculated action matrix, and the like. ing.

ブログ、掲示板などの構成と、それらに対するユーザのアクセス制御は、Perl、Ruby、PHP、Servlet、JSPのような周知のプログラミング言語のツールで実現することができる。あるいは、C、C++、C#、Java(サン・マイクロシステムズの商標)などを用いることもできる。   The configuration of blogs, bulletin boards, etc. and user access control for them can be realized with tools of well-known programming languages such as Perl, Ruby, PHP, Servlet, JSP. Alternatively, C, C ++, C #, Java (trademark of Sun Microsystems), etc. can be used.

さらに、HTMLファイル中に適宜、JavaScript(商標)を埋め込んで、Perl、Ruby、PHPなどと協働するようにシステムを構成することもできる。   Furthermore, it is possible to embed JavaScript (trademark) in the HTML file as appropriate and configure the system to cooperate with Perl, Ruby, PHP, etc.

ブログ、掲示板、ニュースなどのコンテンツは、コンテンツ管理データベース(CMDB)に格納して、一元的に管理することも可能である。   Content such as blogs, bulletin boards, news, etc. can be stored in a content management database (CMDB) and managed centrally.

尚、上記オンライン・コミュニティ・サーバ102として、インターナョナル・ビジネス・マシーンズ・コーポレーションから購入可能な、IBM(インターナョナル・ビジネス・マシーンズ・コーポレーションの商標)System X、System i、System pなどの機種のサーバを使うことができる。その際、使用可能なオペレーティング・システムは、AIX(インターナョナル・ビジネス・マシーンズ・コーポレーションの商標)、UNIX(The Open Groupの商標)、Linux(商標)、Windows(商標)2003 Serverなどがある。   As the online community server 102, models such as IBM (trademark of International Business Machines Corporation) System X, System i, System p, which can be purchased from International Business Machines Corporation. You can use any server. In this case, usable operating systems include AIX (trademark of International Business Machines Corporation), UNIX (trademark of The Open Group), Linux (trademark), Windows (trademark) 2003 Server, and the like.

次に、図4を参照して、本発明に係る行動マトリクスの基本概念について説明する。
図4において、ユーザ402は、このオンライン・コミュニティ・サービスにおいて、行動404として示した、「メッセージを書く」404a、「掲示板に書き込む」404b、「ブログを書く」404c・・・「メッセージを読む」404i、「掲示板を読む」404j、「ブログを読む」404k、「ニュースを読む」404l・・などの行動(活動)をとり得るとする。このような、ユーザがオンライン・コミュニティ・サービス内でとり得る行動の種類は、オンライン・コミュニティ・サーバ102のプロバイダが提供する機能によって、予め決まっている。
Next, the basic concept of the behavior matrix according to the present invention will be described with reference to FIG.
In FIG. 4, the user 402, in this online community service, shows “Write Message” 404a, “Write to Bulletin Board” 404b, “Write Blog” 404c... It is assumed that actions (activities) such as 404i, “read bulletin board” 404j, “read blog” 404k, “read news” 404l,. The types of actions that the user can take in the online community service are determined in advance by the functions provided by the provider of the online community server 102.

そこで、上述した活動の各々に対して、ある一定期間に、当該ユーザ402が、メッセージとして読み書きしたテキスト406a、掲示板に読み書きしたテキスト406b、ブログとして読み書きしたテキスト406c、ニュースとして読んだテキスト406d・・・を、テキスト情報406として、ハードディスク・ドライブ310(図3)に一旦保存する。このとき、メッセージとして読み書きしたテキスト406aのように一括して呼んでいるが、読んだテキストと書いたテキストは、別個に識別可能に保存されることに留意されたい。このことは、掲示板やプログについても、同様である。そこで、特開2001−84250、特開2002−251402、及び特開2004−246440等から周知の構文解析技術などにより、そこに出現するキーワードや特定表現の頻度を、ハードディスク・ドライブ310に格納されている解析計算モジュールで計算することによって、当該ユーザ402に対する行動マトリクス408が得られる。   Therefore, for each of the above-described activities, the user 402 reads / writes a text 406a read / written as a message, a text 406b read / written on a bulletin board, a text 406c read / written as a blog, and a text 406d read as news for a certain period of time. Is temporarily stored as text information 406 in the hard disk drive 310 (FIG. 3). At this time, it is called collectively as text 406a read and written as a message, but it should be noted that the read text and the written text are stored separately and identifiable. The same applies to bulletin boards and blogs. Therefore, the frequency of keywords and specific expressions appearing in the hard disk drive 310 is stored in the hard disk drive 310 by using a syntax analysis technique known from JP-A-2001-84250, JP-A-2002-251402, and JP-A-2004-246440. The behavior matrix 408 for the user 402 is obtained by calculating with the analysis calculation module.

説明を補足すると、本発明の行動マトリクス408は、行をキーワード、列を行動とする。従って、一般的には、行が数千行あり、列が数十程度の、かなり縦長の行列になる。行に現れるキーワードは、テキスト情報406として保存された全てのテキストから構文解析により抽出されたキーワードの全てを網羅する。   To supplement the explanation, the behavior matrix 408 of the present invention uses rows as keywords and columns as behaviors. Therefore, in general, the matrix is quite long with several thousand rows and several tens of columns. The keywords appearing on the line cover all the keywords extracted by parsing from all the text stored as the text information 406.

すると、あるキーワードの行における、ある行動の列の成分の値は、その行動に関連するテキストに含まれる、当該キーワードの出現頻度をあらわす。   Then, the value of the component of a certain action column in a certain keyword row indicates the appearance frequency of the keyword included in the text related to the action.

このように作成された行動マトリクスの値は、ユーザ毎に、個別のファイルとして、ハードディスク・ドライブ310に保存される。このとき、保存する形式は、例えば、CSV、HTML、XMLなど、行と列の値として、C、C++、C#、Java(商標)、Perl、Ruby、PHPなどのプログラミング・ツールによって識別可能な任意の形式でよい。   The values of the action matrix created in this way are stored in the hard disk drive 310 as individual files for each user. At this time, the format to be stored can be identified by programming tools such as C, C ++, C #, Java (trademark), Perl, Ruby, and PHP as row and column values such as CSV, HTML, and XML. It can be in any format.

図5は、図4に説明した様式で作成した行動マトリクスのデータを格納する、行動マトリクスDB502を示す図である。実際は、行動マトリクスDB502は、好適には、CMDBの形式であって、ハードディスク・ドライブ310に保存されている。上述のように、行動マトリクスDB502には、各ユーザ毎の行動マトリクスのデータ504a、504b、504c・・・が、保存されている。   FIG. 5 is a diagram showing an action matrix DB 502 that stores action matrix data created in the format described in FIG. Actually, the behavior matrix DB 502 is preferably in a CMDB format and is stored in the hard disk drive 310. As described above, behavior matrix data 504a, 504b, 504c,... For each user is stored in the behavior matrix DB 502.

行動マトリクスDB502にはさらに、ユーザ・コミュニティの行動マトリクスのデータ506a、506b、506c・・・が、保存されていてる。ユーザ・コミュニティの行動マトリクスのデータは、そのユーザ・コミュニティに所属するユーザの行動マトリクスのデータに対して、本発明の実施例で定義された演算を施すことによって計算される。この計算のアルゴリズムは、後で詳細に説明する。   The behavior matrix DB 502 further stores user community behavior matrix data 506a, 506b, 506c,. The user community behavior matrix data is calculated by performing the operation defined in the embodiment of the present invention on the behavior matrix data of the users belonging to the user community. This calculation algorithm will be described in detail later.

さて、このように単一のユーザ各々の行動マトリクスのデータ504a、504b、504c・・・と、個々のユーザ・コミュニティの行動マトリクスのデータ506a、506b、506c・・・とが揃っていると、本発明の実施例で定義されたAPI508の演算を用いて、参照番号510で示す、あるユーザの興味の抽出、参照番号512で示す、あるユーザと類似した興味をもつユーザの抽出、参照番号514で示す、あるユーザと類似した興味をもつコミュニティの抽出、参照番号516で示す、あるコミュニティと類似した興味をもつコミュニティの抽出、などの処理を行うことができる。なお、本実施例で可能な処理は、図5に図示されているもので尽きる訳ではなく、これらは一例に過ぎないことを理解されたい。これらを実行する処理、あるいはここに記載する以外の処理について、後で詳細に説明する。   In this way, when the action matrix data 504a, 504b, 504c,... For each single user and the action matrix data 506a, 506b, 506c,. Using the operation of the API 508 defined in the embodiment of the present invention, extraction of an interest of a user indicated by reference numeral 510, extraction of a user having an interest similar to that of a user indicated by reference numeral 512, reference numeral 514 Extraction of a community having an interest similar to a certain user, and extraction of a community having an interest similar to a certain community indicated by reference numeral 516 can be performed. It should be understood that the processing possible in this embodiment is not limited to that illustrated in FIG. 5, but is merely an example. Processing for executing these or processing other than those described here will be described in detail later.

図6は、行動マトリクスの生成処理を、別の観点から説明するための図である。図6において、テキストデータ602は、ユーザが書き込み、あるいはアクセスしたコンテンツのテキスト・ファイルであり、図4にテキスト情報406と示されているのと同じものである。言語処理部604は、その処理モジュールは、ハードディスク・ドライブ310に保存され、必要に応じてCPU306によって、主記憶308に呼び出され実行される。   FIG. 6 is a diagram for explaining the action matrix generation processing from another viewpoint. In FIG. 6, text data 602 is a text file of content written or accessed by the user, and is the same as the text information 406 shown in FIG. The processing module of the language processing unit 604 is stored in the hard disk drive 310 and is called and executed by the CPU 306 in the main memory 308 as necessary.

基本的に、言語依存の処理は全て、言語処理部604で行われる。具体的には、形態素解析、構文解析、キーワード抽出、固有名詞抽出、評判表現抽出などの処理を行う。また、言語処理部604は、必要に応じて、辞書や外部知識データベースを参照する。このため、ハードディスク・ドライブ310には、同義語辞書等の辞書(図示しない)が格納されている。外部知識データベースは、辞書と同様にハードディスク・ドライブ310に格納してもよいし、Webサービス的に、ネットワークを介して参照するようにしてもよい。   Basically, all language-dependent processing is performed by the language processing unit 604. Specifically, morphological analysis, syntax analysis, keyword extraction, proper noun extraction, reputation expression extraction, and the like are performed. The language processing unit 604 refers to a dictionary or an external knowledge database as necessary. For this reason, the hard disk drive 310 stores a dictionary (not shown) such as a synonym dictionary. The external knowledge database may be stored in the hard disk drive 310 in the same manner as the dictionary, or may be referred to via a network as a Web service.

このあたりの処理は、特開2001−84250、特開2002−251402、及び特開2004−246440などで周知であるので、これ以上の詳しい説明を省略する。   Since this process is well known in Japanese Patent Laid-Open No. 2001-84250, Japanese Patent Laid-Open No. 2002-251402, Japanese Patent Laid-Open No. 2004-246440, and the like, detailed description thereof is omitted.

行動マトリクス生成部606は、言語処理部604で抽出されたキーワードを、メッセージを書く、掲示板に書き込む、ブログを書く、メッセージを読む、掲示板を読む、ブログを読む、ニュースを読むなどの行動(活動)毎に整理し、重み付けし、行動マトリクスを生成する。   The behavior matrix generation unit 606 writes the keywords extracted by the language processing unit 604, writes a message, writes it on a bulletin board, writes a blog, reads a message, reads a bulletin board, reads a blog, reads news, etc. ) Organize and weight each time to generate an action matrix.

行動マトリクス生成部606は、そのようにして生成した行動マトリクスのデータを、行動マトリクスDB502に蓄積する。行動マトリクスDB502に格納されているデータは、図5に示すとおりである。   The behavior matrix generation unit 606 accumulates the behavior matrix data thus generated in the behavior matrix DB 502. Data stored in the behavior matrix DB 502 is as shown in FIG.

API508は、行動マトリクスDB502に蓄積されている行動マトリクスのデータを用いて、様々な複数のアプリケーション612a、612b、612c・・・を計算する。   The API 508 calculates various applications 612a, 612b, 612c,... Using the behavior matrix data stored in the behavior matrix DB 502.

図7は、行動マトリクス生成部606の処理をさらに詳細に説明するための模式図である。図7において、テキスト情報ブロック406は、図4に示すものと同じである。テキスト情報ブロック406には、特定のユーザが書いたブログ記事のテキスト702a、702b、当該特定のユーザが読んだブログ記事704a、704b・・・、当該特定のユーザが書いたメッセージ706a、706b・・・、当該特定のユーザが読んだメッセージ708aが格納されている。   FIG. 7 is a schematic diagram for explaining the processing of the behavior matrix generation unit 606 in more detail. In FIG. 7, the text information block 406 is the same as that shown in FIG. The text information block 406 includes text 702a, 702b of a blog article written by a specific user, blog articles 704a, 704b,... Read by the specific user, and messages 706a, 706b,. A message 708a read by the specific user is stored.

行動マトリクス生成部606は、書いたブログ記事のテキスト702a、702bから、キーワード列702xと、それらのキーワードが使われた回数の列702yを取り出す。   The behavior matrix generation unit 606 extracts a keyword column 702x and a column 702y of the number of times these keywords are used from the texts 702a and 702b of the written blog article.

また、行動マトリクス生成部606は、読んだブログ記事のテキスト704a、704b・・・から、キーワード列704xと、それらのキーワードが使われた回数の列704yを取り出す。   Further, the behavior matrix generation unit 606 extracts a keyword column 704x and a column 704y of the number of times the keywords are used from the texts 704a, 704b,.

さらに、行動マトリクス生成部606は、書いたメッセージのテキスト706a、706b・・・から、キーワード列706xと、それらのキーワードが使われた回数の列706yを取り出す。   Further, the behavior matrix generation unit 606 extracts a keyword column 706x and a column 706y of the number of times these keywords are used from the texts 706a, 706b,.

さらに、行動マトリクス生成部606は、読んだメッセージのテキスト708aから、キーワード列708xと、それらのキーワードが使われた回数の列708yを取り出す。   Further, the behavior matrix generation unit 606 extracts a keyword column 708x and a column 708y of the number of times these keywords are used from the text 708a of the read message.

行動マトリクス生成部606は、こうして得られた、行動毎のキーワード列702x、704x、706x、708xと、それらのキーワードが使われた回数の列702y、704y、706y、708yとから、行動マトリクス710を生成する。   The behavior matrix generation unit 606 obtains the behavior matrix 710 from the keyword columns 702x, 704x, 706x, and 708x for each behavior and the columns 702y, 704y, 706y, and 708y of the number of times these keywords are used. Generate.

すなわち、原則的には、対応する行動の、キーワードが使われた回数の列を、その行動に対応する列ベクトルとして配置する。このような列ベクトルが並ぶことで、マトリクスが形成される。但し、この実施例では、好適には、キーワードが使われた回数は、関連して見たり書いたりした文書数で割ることによって、正規化される。この結果、行動マトリクス710の「ブログを読む」の列と、「メッセージを書く」の列には、小数が入っている。   That is, in principle, the column of the number of times the keyword is used for the corresponding action is arranged as a column vector corresponding to the action. A matrix is formed by arranging such column vectors. However, in this embodiment, preferably the number of times a keyword is used is normalized by dividing by the number of documents viewed or written in relation. As a result, the “Read Blog” column and the “Write Message” column of the behavior matrix 710 contain decimal numbers.

また、図7に示す行動マトリクスは、図式的に簡易的に示すもので、実際は、行数は、テキスト中に使用されるキーワードに依存しは数千行に達することもあり、また、列は、定義する行動の数に依存するため、量数とも、図示されているよりは多くなることに留意されたい。   In addition, the behavior matrix shown in FIG. 7 is schematically shown. In practice, the number of lines may reach several thousand lines depending on the keywords used in the text. Note that the quantity number is larger than shown because it depends on the number of actions to be defined.

次に、図8のフローチャートを使用して、行動マトリクス作成のための処理を説明する。この説明の前提として、行動ベクトル a ≡ {a1, a2, ... am}と定義する。ここで、a1, a2, ... amは、このコミュニティ・システム中で想定される行動であり、例えば、ブログを書く/読む、メッセージを書く/読む、ニュースを読む、掲示板に書き込みする/読む、商品を購入する、商品説明を読む、他ユーザのプロフィールを見る、などの行動を含む。 Next, processing for creating a behavior matrix will be described using the flowchart of FIG. As a premise of this explanation, we define action vector a ≡ {a 1 , a 2 , ... a m }. Where a 1 , a 2 , ... a m are the behaviors assumed in this community system, for example, writing / reading a blog, writing / reading a message, reading news, writing on a bulletin board This includes actions such as performing / reading, purchasing a product, reading a product description, and viewing other users' profiles.

図8のフローチャートでは、ステップ802とステップ816の間で、このような各々の行動ai( i = 1...m)につき、以下で説明する処理を行う。すなわち、ステップ804では、一定時間に行動aiで生成された文書セットDiが抽出される。ここでいう文書セットとは、例えば図7では、テキスト情報406において、書いたブログ記事702a、702bと示されているものである。これが、「ブログを書く」という行動に対する文書セットである。文書セットには、1つ乃至複数の文書が含まれる。図7のテキスト情報406では、「ブログを書く」に対応する文書セットに含まれる文書は、文書702a及び文書702bである。このような文書セットDi中の各文書dij (j = 1 .. n )について、以下に示す処理を行う。 In the flowchart of FIG. 8, between the steps 802 and 816, the processing described below is performed for each such action a i (i = 1 ... m). That is, in step 804, the document set D i generated by the action a i at a certain time is extracted. For example, in FIG. 7, the document set referred to here is the written blog articles 702 a and 702 b in the text information 406. This is the document set for the action of “writing a blog”. The document set includes one or more documents. In the text information 406 of FIG. 7, the documents included in the document set corresponding to “write blog” are the document 702a and the document 702b. For each document d ij in such a document set D i (j = 1 .. n ), perform the following processing.

すなわち、ステップ808では、文書dijに対して、形態素解析、構文解析が適用され、文書dij中のキーワードと、それらの出現頻度が抽出される。 That is, in step 808, the document d ij, morphological analysis, syntax analysis is applied, and keywords in the document d ij, their occurrence frequency is extracted.

ステップ810では、こうして抽出されたキーワードと、その出現頻度が各々、WiとXiにそれぞれストアされる。WiとXiは、実際は、ベクトルである。なお、ステップ810の段階で、Xi中の数値を、文書セットDi中の文書の数で割ることにより、正規化してもよい。 In step 810, the keywords thus extracted and their appearance frequencies are stored in W i and X i , respectively. W i and X i are actually vectors. In step 810, normalization may be performed by dividing the numerical value in X i by the number of documents in the document set D i .

ステップ812で文書dij (j = 1 .. n )についての繰り返しが完了すると、ステップ814では、1つの行動aiに対応するWiとXiが、完成される。 Repeated completion of the document d ij (j = 1 .. n ) in step 812, in step 814, W i and X i corresponding to one of the actions a i is completed.

こうして、ステップ816で、すべての行動aiについて、WiとXiが揃う。ステップ818では、すべてのWiに含まれるキーワードのラベルを縦に並べる処理がまず行われ、次に、ステップ820で、行動ai毎に、そのWi内のキーワードに対応する行位置に、Xi中の対応する頻度を入れる処理が行われる。こうして、一時行動マトリクスが生成される。ここで、「一時」と呼ぶのは、後述の行動マトリクスの時間推移の計算に使われるものだからである。 Thus, in step 816, W i and X i are obtained for all actions a i . In step 818, the process of arranging the label of keywords included in all W i vertically is performed first, then, in step 820, for each action a i, the row position corresponding to the keyword in that W i, A process of entering the corresponding frequency in X i is performed. Thus, a temporary action matrix is generated. Here, the term “temporary” is used because it is used for calculating the time transition of the behavior matrix described later.

図9は、図8のステップ804及び806で、具体的に文書にアクセスする方法を説明する図である。図3に示すコミュニティ・サーバ・システムは、そのハードディスク・ドライブ310に、アクセス・ログ902を記録する。アクセス・ログ902は、日付902a、時間902b、処理902c、ユーザID902d、文書ID902eを含む。   FIG. 9 is a diagram for explaining a specific method for accessing a document in steps 804 and 806 of FIG. The community server system shown in FIG. 3 records an access log 902 in the hard disk drive 310. The access log 902 includes a date 902a, a time 902b, a process 902c, a user ID 902d, and a document ID 902e.

例えば、014623というユーザIDをもつユーザが、画面904でブログのメッセージを書き、保存ボタン906をクリックすると、そのことは、PostBlogという処理を示すレコード902fとして、アクセス・ログ902に記録される。そして、レコード902fの文書IDから、書かれたブログの内容を突き止め、そのテキストを、ファイル908として、ハードディスク・ドライブ310に保存する。同様にして、メッセージに関連するテキストファイル910も、ハードディスク・ドライブ310に保存される。   For example, when a user having a user ID of 014623 writes a blog message on the screen 904 and clicks the save button 906, this is recorded in the access log 902 as a record 902f indicating a process called PostBlog. Then, the content of the written blog is determined from the document ID of the record 902f, and the text is stored in the hard disk drive 310 as a file 908. Similarly, a text file 910 associated with the message is also stored on the hard disk drive 310.

このようにして作成されたテキストファイル908、910は、図4及び図7に示すテキスト情報406として、一時行動マトリクスの作成に使用される。   The text files 908 and 910 created in this way are used to create a temporary action matrix as the text information 406 shown in FIGS.

次に、本実施例における、行動マトリクスの時間推移による更新について説明する。
この実施例では、時間推移は、次のように計算される。
t+Δt = Wkt+TΔt
ここで、Atは、時間tにおける行動マトリクスであり、Wkは、キーワード毎の重み付け係数であり、Wは、行動毎の忘却係数であり、TΔtは、時間t+Δtにおける一時行動マトリクスである。一時行動マトリクスの生成方法は、図7〜図9を参照して説明したとおりである。
Next, the update by the time transition of an action matrix in a present Example is demonstrated.
In this embodiment, the time transition is calculated as follows.
A t + Δt = W k A t W a + T Δt
Here, A t is the action matrix at time t, W k is a weighting factor for each keyword, W a is a forgetting coefficient for each action, T Δt is a temporary action at time t + Δt Matrix. The method for generating the temporary behavior matrix is as described with reference to FIGS.

kと、Wの具体例を、図10に示す。示されているように、Wkは、キーワード・ラベルの数をNとすると、N×Nの正方行列である。最も簡易には、対角成分のみが非零の正の数で、それ以外の成分はゼロでよい。例えば、固有名詞のキーワードに対応する成分は、1.0またはそれに近い値にし、普通名詞あるいは、ありきたりなキーワードに対応する成分は、1.0よりかなり小さい値を選ぶ。こうすることにより、固有名詞のキーワードに対応する数値があまり減衰しないで残り、普通名詞のキーワードに対応する数値が速やかに減衰する。 Specific examples of W k and W a are shown in FIG. As shown, W k is an N × N square matrix, where N is the number of keyword labels. In the simplest case, only the diagonal component may be a non-zero positive number and the other components may be zero. For example, the component corresponding to the keyword of the proper noun is set to 1.0 or a value close thereto, and the component corresponding to the common noun or the ordinary keyword is selected to have a value considerably smaller than 1.0. By doing so, the numerical value corresponding to the keyword of the proper noun is not attenuated so much, and the numerical value corresponding to the keyword of the common noun is rapidly attenuated.

は、行動の種別数をMとすると、M×Mの正方行列である。最も簡易には、対角成分のみが非零の正の数で、それ以外の成分はゼロでよい。例えば、自分がブログに書くなど、比較的印象が強い行動に対応する成分は、1.0またはそれに近い値にし、ニュースを読むなど、比較的印象が弱い行動に対応する成分は、1.0よりかなり小さい値を選ぶ。 W a is an M × M square matrix, where M is the number of action types. In the simplest case, only the diagonal component may be a non-zero positive number and the other components may be zero. For example, the component corresponding to a relatively strong impression such as writing on a blog is set to 1.0 or a value close thereto, and the component corresponding to a relatively weak impression such as reading news is a value considerably smaller than 1.0. Select.

ktの演算は、通常の行列の掛け算でよいが、
kt+TΔtの足し算は、必ずしも通常の行列の足し算が使えない。というのは、Tt+Δtの生成で、今まで出会った新しいキーワードが見つかることにより、AtとTΔtで、必ずしもキーワードの行ラベルが一致するとは限らないからである。
Calculation of W k A t W a can but a multiplication of normal matrix
Addition of W k A t W a + T Δt is, not necessarily can use the addition of a normal matrix. This is because, in the generation of T t + Δt, by which you find the new keywords that ever met, in the A t and T Δt, because not always the line label of keywords match.

そこで、一般的に、At + T = At+1として、拡張された行列の和を、次のように定義する。
行列At ≡ {an,m}とする。an,mは、行列のn,m成分である。
また、そのキーワード・ラベルを、w = {w1,w2,...,wn}とする。
同様に、T ≡ {tn',m}
そのキーワード・ラベル w = {w'1,w'2,...,w'n'}
At+1≡ {an'',m}
そのキーワード・ラベル w = {w''1,w''2,...,w''n''}
Therefore, in general, as A t + T = A t + 1, the sum of the extended matrices, defined as follows.
Matrix A t ≡ {a n, m } and. a n, m is the n, m component of the matrix.
Further, the keyword / label is set as w = {w 1 , w 2 ,..., W n }.
Similarly, T ≡ {t n ', m }
Its keyword label w = {w ' 1 , w' 2 , ..., w 'n' }
A t + 1 ≡ {a n`` , m }
Its keyword label w = {w '' 1 , w '' 2 , ..., w '' n '' }

このように定義しておき、以下のように場合分けする。
・Atにあって、Tにないキーワードwi(以前に使われたが今回は使われなかった語)の場合の、w''iとa'ijの決定:
w''i = wi ( 1 <= i <= n )
a'ij = aij ( 1 <= j <= m)
・AtにもTにもあるキーワードwi(以前に使われたが今回は使われなかった語)の場合の、w''iとa'ijの決定:
w''i = wi ( 1 <= i <= n )
a'ij = aij + tkj
(wi = w'k, 1 <= j <= m, i <= k <= n')
・Atになく、Tにあるキーワードw'k(以前は使わなかったが、今回は使われた語)の場合の、w''iとa'ijの決定:
w''i = w'k (n + 1 <= i <= n'' )
a'ij = tkj (1 <= j <= m)
The definition is made in this way, and the cases are divided as follows.
· A In the t, in the case of a keyword is not in the T w i (word was previously used did not this time is used), w '' i and a 'ij of the decision:
w '' i = w i (1 <= i <= n)
a ' ij = a ij (1 <= j <= m)
· A keyword t to also be in T w i in the case of (the word was previously used did not this time is used), w '' i and a 'ij of the decision:
w '' i = w i (1 <= i <= n)
a ' ij = a ij + t kj
(w i = w ' k , 1 <= j <= m, i <= k <= n')
· A not in t, '(but did not use the past, this time used the word) k in the case of a, w' keyword w in the T 'i and a' ij of the decision:
w '' i = w ' k (n + 1 <= i <= n'')
a ' ij = t kj (1 <= j <= m)

このような拡張した和の演算により、
t+Δt = Wkt+TΔtの式に基づき、行動マトリクスAtを時間の推移に従い、更新する。このような計算は、予め作成されたコンピュータ・プログラムにより自動計算される。当該分野の熟練した当業者なら、C++、C#、Javaなどの任意のプログラミング言語で、そのようなコンピュータ・プログラムを作成することが可能であることが理解されよう。以下で定義される全ての演算も、同様にプログラミング言語で作成され、実行可能に保持されて、適時呼び出される。
With this extended sum operation,
Based on the formula of A t + Δt = W k A t W a + T Δt, in accordance with the transition of the action matrix A t the time, to update. Such a calculation is automatically calculated by a computer program prepared in advance. Those skilled in the art will appreciate that such computer programs can be created in any programming language such as C ++, C #, Java, and the like. All operations defined below are similarly created in a programming language, kept executable and called in a timely manner.

なお、行動マトリクスの更新頻度は、典型的には、一日に一度であるが、一日に二度、週に一度など、コミュニティの活動の頻度に応じて、適宜選ぶことができる。   The update frequency of the behavior matrix is typically once a day, but can be appropriately selected according to the frequency of community activities, such as twice a day or once a week.

このように作成され時間とともに更新される行動マトリクスを使って、様々な有意義なアプリケーションへの適用をすることができる。以下、アプリケーションを説明する。   By using the behavior matrix created and updated with time, it can be applied to various meaningful applications. The application will be described below.

[行動マトリクスの絶対値]
行動マトリクスAの絶対値を、下記の式で定義する。aijは、行動マトリクスAのij成分である。

Figure 2009157764
この絶対値自体を単独で使用することはあまりなく、その主要な用途は、他の計算における、値の正規化である。 [Absolute value of behavior matrix]
The absolute value of the behavior matrix A is defined by the following formula. a ij is an ij component of the behavior matrix A.
Figure 2009157764
The absolute value itself is rarely used alone, and its primary use is for value normalization in other calculations.

[2つの行動マトリクスの和]
2つの行動マトリクスAkとAlの和は、下記の式で定義する。ここに出てくる行列の絶対値は、上記で定義したものである。下記の計算をする前に、キーワード・ラベルを揃える処理を行う。すなわち、AkとAlのキーワード・ラベルに和集合をとる演算を行い、その結果のキーワード・ラベルに基づき、AkとAlの行を拡張してから、すなわち、もともとなかったキーワードの行には、全て0を入れてから、下記の式を実行する。

Figure 2009157764
このような行動マトリクスの和を、あるコミュニティ全体に属するユーザの行動マトリクス全体に適用することにより、コミュニティの行動マトリクスが得られる。 [Sum of two action matrices]
The sum of the two behavior matrices A k and A l is defined by the following equation. The absolute values of the matrix appearing here are those defined above. Before performing the following calculation, the process of aligning keywords and labels is performed. That is, an operation that takes the union of the keyword labels of A k and A l is performed, and the rows of Ak and A l are expanded based on the resulting keyword labels, that is, the original keyword rows After all 0s are entered, the following formula is executed.
Figure 2009157764
By applying the sum of such behavior matrices to the whole behavior matrix of users belonging to a certain community, a community behavior matrix can be obtained.

図11に、2つの行動マトリクスA、Bの和の例を示す。この例から見て取れるように、行動マトリクスA、Bの和には、適切に正規化された値で、値の和が得られる。   FIG. 11 shows an example of the sum of two behavior matrices A and B. As can be seen from this example, the sum of the behavior matrices A and B is obtained by appropriately normalizing the values.

[2つの行動マトリクスの差]
2つの行動マトリクスAkとAlの差は、下記の式で定義する。ここに出てくる行列の絶対値は、上記で定義したものである。下記の計算をする前に、キーワード・ラベルを揃える処理を行う。すなわち、AkとAlのキーワード・ラベルに和集合をとる演算を行い、その結果のキーワード・ラベルに基づき、AkとAlの行を拡張してから、すなわち、もともとなかったキーワードの行には、全て0を入れてから、下記の式を実行する。

Figure 2009157764
このような行動マトリクスの差は、ユーザ間、ユーザとコミュニティ間、あるいはコミュニティ間の活動の差を求めるために使用することができる。なお、ここでの右辺の一番外側の絶対値は、単に行列の要素を全て正の値にする、という意味で、上記で定義した、マトリクスの絶対値でないことに留意されたい。 [Difference between two behavior matrices]
The difference between the two behavior matrices A k and A l is defined by the following equation. The absolute values of the matrix appearing here are those defined above. Before performing the following calculation, the process of aligning keywords and labels is performed. That is, an operation that takes the union of the keyword labels of A k and A l is performed, and the rows of Ak and A l are expanded based on the resulting keyword labels, that is, the original keyword rows After all 0s are entered, the following formula is executed.
Figure 2009157764
Such behavior matrix differences can be used to determine activity differences between users, between users and communities, or between communities. It should be noted that the absolute value on the outermost side of the right side here is not the absolute value of the matrix defined above in the sense that all the elements of the matrix are simply positive values.

図12に、2つの行動マトリクスA、Bの差の例を示す。この例から見て取れるように、行動マトリクスA、Bの和には、適切に正規化された値で、値の差が得られる。   FIG. 12 shows an example of the difference between the two behavior matrices A and B. As can be seen from this example, the sum of the behavior matrices A and B is a value that is appropriately normalized and a difference in value is obtained.

[2つの行動マトリクスの積]
ここでは、行動マトリクスの積として、行動キーワード相関、行動相関、キーワード相関、の3種類を考える。なお、これらのどの計算においても、計算をする前に、キーワード・ラベルを揃える処理を行う。すなわち、AkとAlのキーワード・ラベルに和集合をとる演算を行い、その結果のキーワード・ラベルに基づき、AkとAlの行を拡張してから、すなわち、もともとなかったキーワードの行には、全て0を入れてから、下記の式を実行する。
[Product of two behavior matrices]
Here, three types of behavior keyword correlation, behavior correlation, and keyword correlation are considered as products of behavior matrices. In any of these calculations, a process for aligning the keywords and labels is performed before the calculation. That is, an operation that takes the union of the keyword labels of A k and A l is performed, and the rows of Ak and A l are expanded based on the resulting keyword labels, that is, the original keyword rows After all 0s are entered, the following formula is executed.

行動キーワード相関は、下記のような数式で定義する。

Figure 2009157764
その具体的な計算は、下記のとおりである。
Figure 2009157764
この計算は、2つの行動マトリクスが示す興味と行動の共通項を出力する。これによって、興味と行動の両方の側面で関連する項目を抽出することができる。
ここで、ak ij、al ijは、それぞれ、マトリクスAk、Alのij成分である。 The behavior keyword correlation is defined by the following mathematical formula.
Figure 2009157764
The specific calculation is as follows.
Figure 2009157764
This calculation outputs a common term of interest and behavior indicated by the two behavior matrices. This makes it possible to extract items related to both interest and behavior.
Here, a k ij and a l ij are ij components of the matrices A k and A l , respectively.

図13に、2つの行動マトリクスA、Bの行動キーワード相関行列の計算の例を示す。   FIG. 13 shows an example of calculation of behavior keyword correlation matrices of two behavior matrices A and B.

行動相関は、下記のような数式で定義する。ATは、転置行列である。演算は、通常の行列の掛け算である。行動マトリクスを、m×nの行列とすると、結果は、n×nの行列となる。

Figure 2009157764
この計算は、2つの行動マトリクスが示す行動の共通項を出力する。これによって、どのような行動について共通のキーワードを用いているかを知ることができる。 The behavior correlation is defined by the following mathematical formula. A T is a transposed matrix. The operation is a normal matrix multiplication. If the behavior matrix is an m × n matrix, the result is an n × n matrix.
Figure 2009157764
This calculation outputs a common term of actions indicated by the two action matrices. As a result, it is possible to know what kind of behavior the common keyword is used.

図14に、2つの行動マトリクスA、Bのキーワード相関行列の計算の例を示す。   FIG. 14 shows an example of calculating the keyword correlation matrix of the two behavior matrices A and B.

キーワード相関は、下記のような数式で定義する。BTは、転置行列である。演算は、通常の行列の掛け算である。行動マトリクスを、m×nの行列とすると、結果は、m×mの行列となる。 Keyword correlation is defined by the following mathematical formula. B T is a transposed matrix. The operation is a normal matrix multiplication. If the behavior matrix is an m × n matrix, the result is an m × m matrix.

Figure 2009157764
この計算は、2つの行動マトリクスが示すキーワードの共通項を出力する。これによって、どのようなキーワードについて共通の行動をとっているかを知ることができる。
図15に、2つの行動マトリクスA、Bの行動相関行列の計算の例を示す。
Figure 2009157764
This calculation outputs a common term of keywords indicated by the two behavior matrices. As a result, it is possible to know what keywords are used in common.
FIG. 15 shows an example of calculating the behavior correlation matrix of the two behavior matrices A and B.

[行動マトリクスの縮退]
行動マトリクスの縮退には、行方向の縮退と、列方向の縮退がある。行方向の縮退は、興味キーワード・リストとも呼ぶことができ、下記のような式で与えられる。
word = AWact T
ここで、Aは行動マトリクスであり、Wactは、行動重みベクトル、Wact Tは、その転置ベクトルである。Wactの次元数は、行動の種類の数と等しく、その成分は原則として、0から1までの間の数である。その値は、重視される行動により大きい値(重み)を付与するように決める。例えば、ブログを書くことには、ブログを読むよりも大きい重みを与える。こうして、ある個人またはコミュニティに関連する、重み付きのキーワードの列を得ることができる。
[Degeneration of behavior matrix]
Degeneration of the behavior matrix includes degeneration in the row direction and degeneration in the column direction. Degeneration in the row direction can also be called an interest keyword list, and is given by the following formula.
V word = AW act T
Here, A is an action matrix, W act is an action weight vector, and W act T is its transposed vector. The number of dimensions of W act is equal to the number of types of actions, and its component is a number between 0 and 1 in principle. The value is determined so as to give a larger value (weight) to the action to be emphasized. For example, writing a blog gives more weight than reading a blog. In this way, a weighted keyword sequence associated with an individual or community can be obtained.

図16に、行動マトリクスAの行方向の縮退、すなわち、興味キーワード・リストを求める例を示す。   FIG. 16 shows an example in which the behavior matrix A is degenerated in the row direction, that is, an interest keyword list is obtained.

列方向の縮退は、行動パターン・リストとも呼ぶことができ、下記のような式で与えられる。
act = Wword T
ここで、Aは行動マトリクスであり、Wwordは、キーワード重みベクトル、Wword Tは、その転置ベクトルである。Wwordの次元数は、抽出されたキーワードの数と等しく、その成分は原則として、0から1までの間の数である。その値は、特に注目したいキーワードに、より大きい値(重み)を付与するように決める。
Degeneration in the column direction can also be called an action pattern list, and is given by the following equation.
V act = W word T A
Here, A is an action matrix, W word is a keyword weight vector, and W word T is its transposed vector. The number of dimensions of W word is equal to the number of extracted keywords, and its component is a number between 0 and 1 in principle. The value is determined so that a larger value (weight) is given to a keyword to be particularly focused.

図17に、行動マトリクスAの列方向の縮退、すなわち、行動パターン・リストを求める例を示す。   FIG. 17 shows an example in which the behavior matrix A is degenerated in the column direction, that is, the behavior pattern list is obtained.

以下、発明の理解を助けるために、典型的ないくつかの応用例について述べる。
[応用例1]
あるユーザが、コミュニティ・システムで、自分の興味と近いコミュニティを探したいとする。このような目的を達成するために、コミュニティ・システムは、そのユーザの行動マトリクスと、ハードディスク・ドライブ310に保存されている、既存のコミュニティの行動マトリクスとの間で、キーワード相関を求める演算を行う。コミュニティ・システムは、得られたキーワード相関マトリクスのうち、ある値以上の成分をもつキーワードだけを、適当なGUIで、当該ユーザに提示する。その結果、当該ユーザは、自分が今まであまり興味をもっておらず、しかし今後取り組んでみたいキーワードに特徴付けられたコミュニティを探すことができる。
Several typical applications will be described below to assist in understanding the invention.
[Application Example 1]
A user wants to find a community close to his / her interest in the community system. In order to achieve such an object, the community system performs an operation for obtaining a keyword correlation between the user's action matrix and the existing community action matrix stored in the hard disk drive 310. . The community system presents only a keyword having a component greater than a certain value in the obtained keyword correlation matrix to the user with an appropriate GUI. As a result, the user can search for a community characterized by keywords that he / she has not been interested in so far but wants to work on in the future.

[応用例2]
あるコミュニティ・システムでは、スパムの書き込みに苦しめられていた。しかし、システム全体で、誰がスパマーか、自明な方法では、判別が難しい。そこで、システム管理者は、本発明の機能を使って、各ユーザの行動マトリクスの列方向の縮退をとることによって、行動パターン・リストを作成してみた。これにより、ブログに対するコメントの書き込みだけが異常に多い行動パターン・リストをもつユーザを、潜在的なスパマーと想定することができた。
[Application Example 2]
One community system suffered from spam writing. However, it is difficult to identify who is a spammer in the system as a whole. Therefore, the system administrator tried to create an action pattern list by using the function of the present invention to degenerate each user's action matrix in the column direction. As a result, it was possible to assume that a user who has an action pattern list that has an unusually large number of comments written on a blog is a potential spammer.

[応用例3]
コミュニティ・システムでは、主要な収入源の1つに広告収入がある。しかし、どのような広告が、コミュニティに有効か、従来の方法では、判別が難しい。ところが、この実施例によれば、個人の行動マトリクスを生成し、それに基づいてさらに、コミュニティの行動マトリクスを生成することができる。すると、そのコミュニティで行方向の縮退、すなわち、興味キーワード・リストを生成することにより、重み付きキーワード・リストが得られるので、既存のキーワード依存広告スキームを使って、有効な広告を、そのコミュニティの画面に表示することができる。
[Application Example 3]
In the community system, one of the main revenue sources is advertising revenue. However, it is difficult to determine what kind of advertisement is effective for the community by the conventional method. However, according to this embodiment, it is possible to generate an individual behavior matrix, and further generate a community behavior matrix based on the matrix. Then, by degenerate in the direction of the community, that is, by generating the keyword list of interest, a weighted keyword list can be obtained. Can be displayed on the screen.

尚、上記実施例で示した、行列の和、差、積などの演算は、本発明を実施するための一例であって、これらの具体的な式に限定されるものではないことを理解されたい。例えば、和及び差の演算は、実際の行列の和及び差の演算と、演算の結果生じる値を、妥当な範囲で正規化する演算を含むなら、任意のアルゴリズムを選ぶことができる。   It should be understood that the operations such as matrix sum, difference, and product shown in the above embodiments are examples for carrying out the present invention and are not limited to these specific expressions. I want. For example, the calculation of the sum and difference may be any algorithm as long as it includes the calculation of the actual matrix sum and difference and the calculation of normalizing the values resulting from the calculation within a reasonable range.

オンライン・コミュニティ・サーバに、インターネットを介して、クライアント・コンピュータが接続されることを示す図である。It is a figure which shows that a client computer is connected to an online community server via the internet. クライアント・コンピュータのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of a client computer. オンライン・コミュニティ・サーバのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of an online community server. 行動マトリクス生成を概念的に示す図である。It is a figure which shows action matrix production | generation conceptually. 行動マトリクスDBと、そのデータを利用したAPIの機能を示す図である。It is a figure which shows the function of API using the action matrix DB and its data. 行動マトリクス生成処理の機能ブロック図である。It is a functional block diagram of action matrix generation processing. 行動マトリクス生成処理を具体的に示す図である。It is a figure which shows an action matrix production | generation process concretely. 行動マトリクス生成の処理を示すフローチャートである。It is a flowchart which shows the process of action matrix production | generation. アクセスログを用いた、文書へのアクセスを示す図である。It is a figure which shows access to a document using an access log. 行動マトリクスの時間推移の処理の例を示す図である。It is a figure which shows the example of the process of time transition of an action matrix. 行動マトリクスの和の実例を示す図である。It is a figure which shows the example of the sum of action matrix. 行動マトリクスの差の実例を示す図である。It is a figure which shows the example of the difference of action matrix. 行動キーワード相関行列の計算の実例を示す図である。It is a figure which shows the example of calculation of an action keyword correlation matrix. キーワード相関行列の計算の実例を示す図である。It is a figure which shows the actual example of calculation of a keyword correlation matrix. 行動相関行列の計算の実例を示す図である。It is a figure which shows the example of calculation of an action correlation matrix. 興味キーワード・リストの計算の実例を示す図である。It is a figure which shows the example of calculation of an interest keyword list. 行動パターン・リストの計算の実例を示す図である。It is a figure which shows the example of calculation of an action pattern list | wrist.

Claims (20)

複数のユーザが各々、個別のクライアント・コンピュータを介して接続し、文書の読み書き等の活動によりコミュニケーションを図るためのコミュニティ・サーバ・システムであって、
前記システムによりデータを読み書き可能な記憶装置と、
個々のユーザの活動と、その活動に関連する文書を、個々のユーザのIDと活動内容とともに、前記記憶装置にログとして記憶する手段と、
前記ログに基づき、個々のユーザの活動毎に読み書きした文書を解析して、個々のユーザの活動毎に文書中のキーワードとその出現頻度を求めて、前記記憶装置に書き出す手段とを有する、
コミュニティ・サーバ・システム。
A community server system in which a plurality of users are connected via individual client computers and communicate through activities such as reading and writing documents.
A storage device capable of reading and writing data by the system;
Means for storing each user's activity and a document related to the activity as a log in the storage device together with the individual user's ID and activity content;
Analyzing a document read and written for each user's activity based on the log, obtaining a keyword in the document for each individual user's activity and its appearance frequency, and writing to the storage device,
Community server system.
前記ユーザの活動毎に読み書きした文書の解析結果は、第1の方向にキーワードがラベルされ、該第1の方向と直交する第2の方向に行動がラベルされ、ラベルが指し示す交点には、キーワードの出現頻度が格納される、マトリックス構造のデータとして、前記記憶装置に保存される、請求項1のシステム。   The analysis result of the document read / written for each activity of the user includes the keyword in the first direction, the action in the second direction perpendicular to the first direction, and the intersection pointed by the label at the keyword. The system of claim 1, stored in the storage device as matrix-structured data in which the frequency of occurrence is stored. 前記活動は、コミュニティ・サーバ内でのブログの書き込み、ブログの読み取り、メッセージの書き込み、及びメッセージの読み取りを含む、請求項1のシステム。   The system of claim 1, wherein the activities include writing a blog, reading a blog, writing a message, and reading a message within a community server. 前記活動に関連する文書数で、前記キーワードの出現頻度を割ることによって正規化する手段をさらに有する、請求項1のシステム。   The system of claim 1, further comprising means for normalizing by dividing the frequency of occurrence of the keyword by the number of documents associated with the activity. コミュニティ内のユーザの前記マトリックス構造のデータの和を計算することにより、該コミュニティ内のユーザに関連するマトリックス構造のデータを得る手段をさらに有する、請求項2のシステム。   The system of claim 2, further comprising means for obtaining matrix structure data associated with users in the community by calculating a sum of the matrix structure data of users in the community. 前記コミュニティのマトリックス構造のデータと、特定のユーザのマトリックス構造のデータとの差を計算する手段をさらに有する、請求項5のシステム。   6. The system of claim 5, further comprising means for calculating a difference between the community matrix structure data and a particular user matrix structure data. 前記マトリクス構造のデータに、減衰させるパラメータを掛ける手段と、該減衰させるパラメータを掛けた該マトリクス構造のデータに、新たに計算されたマトリクス構造のデータを加える手段をさらに有する、請求項2のシステム。   3. The system according to claim 2, further comprising: means for multiplying the matrix structure data by a parameter to be attenuated; and means for adding newly calculated matrix structure data to the matrix structure data multiplied by the attenuation parameter. . 複数のユーザが各々、個別のクライアント・コンピュータを介して接続し、文書の読み書き等の活動によりコミュニケーションを図るためのコミュニティ・サーバ・システムの活動記録方法であって、
個々のユーザの活動と、その活動に関連する文書を、個々のユーザのIDと活動内容とともに、前記コミュニティ・サーバ・システムの記憶装置にログとして記憶するステップと、
前記ログに基づき、個々のユーザの活動毎に読み書きした文書を解析して、個々のユーザの活動毎に文書中のキーワードとその出現頻度を求めて、前記記憶装置に書き出すステップとを有する、
コミュニティ・サーバ・システムの活動記録方法。
An activity recording method for a community server system in which a plurality of users are connected via individual client computers and communicate with each other through activities such as reading and writing documents.
Storing each user's activity and a document related to the activity as a log in the storage device of the community server system together with the individual user's ID and activity contents;
Analyzing a document read and written for each activity of each user based on the log, obtaining a keyword in the document for each activity of each user and its appearance frequency, and writing to the storage device,
Activity recording method for community server system.
前記ユーザの活動毎に読み書きした文書の解析結果は、第1の方向にキーワードがラベルされ、該第1の方向と直交する第2の方向に行動がラベルされ、ラベルが指し示す交点には、キーワードの出現頻度が格納される、マトリクス構造のデータとして、前記記憶装置に保存される、請求項8の方法。   The analysis result of the document read / written for each activity of the user includes the keyword in the first direction, the action in the second direction perpendicular to the first direction, and the intersection pointed by the label at the keyword. 9. The method of claim 8, wherein the frequency of occurrence is stored in the storage device as matrix structured data. 前記活動は、コミュニティ・サーバ内でのブログの書き込み、ブログの読み取り、メッセージの書き込み、及びメッセージの読み取りを含む、請求項8の方法。   9. The method of claim 8, wherein the activities include writing a blog, reading a blog, writing a message, and reading a message within a community server. 前記活動に関連する文書数で、前記キーワードの出現頻度を割ることによって正規化するステップをさらに有する、請求項8の方法。   The method of claim 8, further comprising normalizing by dividing the frequency of occurrence of the keyword by the number of documents associated with the activity. コミュニティ内のユーザの前記マトリクス構造のデータの和を計算することにより、該コミュニティ内のユーザに関連するマトリクス構造のデータを得るステップをさらに有する、請求項9の方法。   10. The method of claim 9, further comprising obtaining matrix structure data associated with users in the community by calculating a sum of the matrix structure data of users in the community. 前記コミュニティのマトリクス構造のデータと、特定のユーザのマトリクス構造のデータとの差を計算するステップをさらに有する、請求項12の方法。   13. The method of claim 12, further comprising the step of calculating a difference between the community matrix structure data and a particular user matrix structure data. 前記マトリクス構造のデータに、減衰させるパラメータを掛けるステップと、該減衰させるパラメータを掛けた該マトリクス構造のデータに、新たに計算されたマトリクス構造のデータを加えるステップをさらに有する、請求項9の方法。   10. The method of claim 9, further comprising: multiplying the matrix structure data by a parameter to be attenuated; and adding the newly calculated matrix structure data to the matrix structure data multiplied by the parameter to be attenuated. . 複数のユーザが各々、個別のクライアント・コンピュータを介して接続し、文書の読み書き等の活動によりコミュニケーションを図るためのコミュニティ・サーバ・システムにおいて、活動を記録するプログラムであって、
前記コミュニティ・サーバ・システムをして、
個々のユーザの活動と、その活動に関連する文書を、個々のユーザのIDと活動内容とともに、前記コミュニティ・サーバ・システムの記憶装置にログとして記憶するステップと、
前記ログに基づき、個々のユーザの活動毎に読み書きした文書を解析して、個々のユーザの活動毎に文書中のキーワードとその出現頻度を求めて、前記記憶装置に書き出すステップとを実行させる、
プログラム。
A program for recording activities in a community server system in which a plurality of users are connected via individual client computers and communicate by activities such as reading and writing documents,
The community server system,
Storing each user's activity and a document related to the activity as a log in the storage device of the community server system together with the individual user's ID and activity contents;
Analyzing a document read and written for each individual user activity based on the log, obtaining a keyword in the document for each individual user activity and its appearance frequency, and executing the step of writing to the storage device,
program.
前記ユーザの活動毎に読み書きした文書の解析結果は、第1の方向にキーワードがラベルされ、第1の方向と直交する第2の方向に行動がラベルされ、ラベルが指し示す交点には、キーワードの出現頻度が格納される、マトリクス構造のデータとして、前記記憶装置に保存される、請求項15のプログラム。   The analysis result of the document read / written for each activity of the user is that the keyword is labeled in the first direction, the action is labeled in the second direction orthogonal to the first direction, and the intersection of the keyword indicates the keyword The program according to claim 15, wherein the program is stored in the storage device as data having a matrix structure in which appearance frequencies are stored. 前記活動は、コミュニティ・サーバ内でのブログの書き込み、ブログの読み取り、メッセージの書き込み、及びメッセージの読み取りを含む、請求項15のプログラム。   16. The program of claim 15, wherein the activities include writing a blog, reading a blog, writing a message, and reading a message within a community server. 前記活動に関連する文書数で、前記キーワードの出現頻度を割ることによって正規化するステップをさらに有する、請求項15のプログラム。   The program according to claim 15, further comprising the step of normalizing by dividing the appearance frequency of the keyword by the number of documents related to the activity. コミュニティ内のユーザの前記マトリクス構造のデータの和を計算することにより、該コミュニティ内のユーザに関連するマトリクス構造のデータを得るステップをさらに有する、請求項16のプログラム。   The program according to claim 16, further comprising: obtaining matrix structure data related to users in the community by calculating a sum of data of the matrix structure of users in the community. 前記マトリクス構造のデータに、減衰させるパラメータを掛けるステップと、該減衰させるパラメータを掛けた該マトリクス構造のデータに、新たに計算されたマトリクス構造のデータを加えるステップをさらに有する、請求項16のプログラム。   The program according to claim 16, further comprising: multiplying the matrix structure data by a parameter to be attenuated; and adding the newly calculated matrix structure data to the matrix structure data multiplied by the attenuation parameter. .
JP2007336919A 2007-12-27 2007-12-27 Community system, community system activity recording method, and community system activity recording program Expired - Fee Related JP5243783B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007336919A JP5243783B2 (en) 2007-12-27 2007-12-27 Community system, community system activity recording method, and community system activity recording program
CN 200810178618 CN101470754B (en) 2007-12-27 2008-11-21 Community server system and activity recording method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007336919A JP5243783B2 (en) 2007-12-27 2007-12-27 Community system, community system activity recording method, and community system activity recording program

Publications (2)

Publication Number Publication Date
JP2009157764A true JP2009157764A (en) 2009-07-16
JP5243783B2 JP5243783B2 (en) 2013-07-24

Family

ID=40828230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007336919A Expired - Fee Related JP5243783B2 (en) 2007-12-27 2007-12-27 Community system, community system activity recording method, and community system activity recording program

Country Status (2)

Country Link
JP (1) JP5243783B2 (en)
CN (1) CN101470754B (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011059802A (en) * 2009-09-07 2011-03-24 Chuo Univ Intention analysis server, intention analysis method, program, and intention analysis system
JP2011150390A (en) * 2010-01-19 2011-08-04 Kddi Corp Character estimation device and program
KR101248193B1 (en) * 2011-05-27 2013-03-27 주식회사 솔트룩스 System for providing expoerts list
JP2013068997A (en) * 2011-09-20 2013-04-18 Dainippon Printing Co Ltd Interchange supporting server device, interchange supporting system, and interchange supporting server program
JP2013528851A (en) * 2010-04-13 2013-07-11 エンヴィ インタラクティブ エルエルシー System and method for providing a visual display of a user's personality in a virtual environment
JP2015509626A (en) * 2012-02-22 2015-03-30 ノキア コーポレイション Access to predictive services
JP2015509627A (en) * 2012-02-22 2015-03-30 ノキア コーポレイション Adaptive system
US9195735B2 (en) 2012-12-28 2015-11-24 Kabushiki Kaisha Toshiba Information extracting server, information extracting client, information extracting method, and information extracting program
WO2017170454A1 (en) * 2016-03-30 2017-10-05 株式会社Personal AI Artificial intelligence device for providing assistance based on values and for providing assistance in obtaining analysis results, by understanding, accumulating, inferring, and predicting values or sense of values of individuals or organizations/groups to which individuals belong

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5872183B2 (en) * 2011-04-08 2016-03-01 株式会社ユニバーサルエンターテインメント Information processing system, preference visualization system, censorship system, and preference visualization method
CN107943978B (en) * 2017-11-29 2020-11-24 北京金堤科技有限公司 Storage method and device for user access records
CN111427967B (en) * 2018-12-24 2023-06-09 顺丰科技有限公司 Entity relationship query method and device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250702A (en) * 2004-03-02 2005-09-15 Fuji Xerox Co Ltd Information visualization system, method and program
JP2007206876A (en) * 2006-01-31 2007-08-16 Nifty Corp Advertisement distribution system in network service

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100477593C (en) * 2006-10-13 2009-04-08 百度在线网络技术(北京)有限公司 Method and device for selecting correlative discussion zone in network community

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250702A (en) * 2004-03-02 2005-09-15 Fuji Xerox Co Ltd Information visualization system, method and program
JP2007206876A (en) * 2006-01-31 2007-08-16 Nifty Corp Advertisement distribution system in network service

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011059802A (en) * 2009-09-07 2011-03-24 Chuo Univ Intention analysis server, intention analysis method, program, and intention analysis system
JP2011150390A (en) * 2010-01-19 2011-08-04 Kddi Corp Character estimation device and program
JP2013528851A (en) * 2010-04-13 2013-07-11 エンヴィ インタラクティブ エルエルシー System and method for providing a visual display of a user's personality in a virtual environment
KR101248193B1 (en) * 2011-05-27 2013-03-27 주식회사 솔트룩스 System for providing expoerts list
JP2013068997A (en) * 2011-09-20 2013-04-18 Dainippon Printing Co Ltd Interchange supporting server device, interchange supporting system, and interchange supporting server program
JP2015509626A (en) * 2012-02-22 2015-03-30 ノキア コーポレイション Access to predictive services
JP2015509627A (en) * 2012-02-22 2015-03-30 ノキア コーポレイション Adaptive system
US9811585B2 (en) 2012-02-22 2017-11-07 Nokia Technologies Oy Adaptive system
US10324916B2 (en) 2012-02-22 2019-06-18 Nokia Technologies Oy Predictive service access
US9195735B2 (en) 2012-12-28 2015-11-24 Kabushiki Kaisha Toshiba Information extracting server, information extracting client, information extracting method, and information extracting program
WO2017170454A1 (en) * 2016-03-30 2017-10-05 株式会社Personal AI Artificial intelligence device for providing assistance based on values and for providing assistance in obtaining analysis results, by understanding, accumulating, inferring, and predicting values or sense of values of individuals or organizations/groups to which individuals belong
JP2017182483A (en) * 2016-03-30 2017-10-05 株式会社Personal AI Artificial intelligence device for giving value-based assistance and assisting analysis realization by understanding, accumulating, estimating and predicting values/value of individual or organization/group to which individual belongs

Also Published As

Publication number Publication date
CN101470754B (en) 2012-04-11
JP5243783B2 (en) 2013-07-24
CN101470754A (en) 2009-07-01

Similar Documents

Publication Publication Date Title
JP5243783B2 (en) Community system, community system activity recording method, and community system activity recording program
CN102779114B (en) It is supported using the unstructured data of automatically rule generation
RU2406129C2 (en) Association of information with electronic document
US20100064040A1 (en) Content recommendations based on browsing information
Lytvyn et al. The method of formation of the status of personality understanding based on the content analysis
US9646037B2 (en) Content creation
JPWO2009025193A1 (en) Information sharing system, information sharing method, and information sharing program
US9224152B2 (en) System and method for intent mining
Bemmann et al. LanguageLogger: A mobile keyboard application for studying language use in everyday text communication in the wild
Al-Rabeeah et al. Social network privacy models
CN110020132A (en) Keyword recommendation method, calculates equipment and storage medium at device
Gallagher et al. “What is, becomes what is right”: A conceptual framework of newcomer legitimacy for online discussion communities
Maximenko et al. Linguosemiotic organization of heterogeneous texts (case study of media and internet texts)
Arolas et al. Uses of explicit and implicit tags in social bookmarking
Joseph et al. Analysis of EZproxy server logs to visualise research activity in Curtin’s online library
Campos et al. Tweet2Story: a web app to extract narratives from twitter
KR20090126862A (en) System and method for analyzing emotional information from natural language sentence, and medium for storaging program for the same
Singh et al. A Content-based eResource Recommender System to augment eBook-based Learning
Tonkin A day at work (with text): A brief introduction
US11106746B2 (en) Determining sentiment of content and selecting content items for transmission to devices
Hashim et al. Social Network Privacy Models: A systematic literature review and directions for further research
Day Mobile information literacy curriculum
Golbeck et al. Socialbrowsing: integrating social networks and web browsing
Pronoza et al. Extraction of typical client requests from bank chat logs
Datar et al. A novel approach for polarity determination using emoticons: emoticon-graph

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121016

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130405

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees