JP2005235118A - Information extracting method and device - Google Patents

Information extracting method and device Download PDF

Info

Publication number
JP2005235118A
JP2005235118A JP2004046850A JP2004046850A JP2005235118A JP 2005235118 A JP2005235118 A JP 2005235118A JP 2004046850 A JP2004046850 A JP 2004046850A JP 2004046850 A JP2004046850 A JP 2004046850A JP 2005235118 A JP2005235118 A JP 2005235118A
Authority
JP
Japan
Prior art keywords
information
user
communication
users
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004046850A
Other languages
Japanese (ja)
Inventor
Eri Sano
恵理 佐野
Takeshi Asakura
剛 浅倉
Yoshio Nakamura
美穂 中村
Hideaki Suzuki
英明 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004046850A priority Critical patent/JP2005235118A/en
Publication of JP2005235118A publication Critical patent/JP2005235118A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To extract a user who contributes the activation of communications on a network or a user who provides a trigger. <P>SOLUTION: In a communication providing device (10) on a network such as a message board, a mailing list, a chat or a blog, extracted user information (25), communication history information (27) and a parameter for extraction of information (29) are created from registered user information (16) and communication information (18) between users. From these pieces of information, there are extracted user properties including beginning users, high-rank users, important users, users who provide a trigger, follow users and similar users in the communication providing device (10) and the degree of association between users. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、ネットワーク上で提供されるコミュニケーションに関する。より詳細には、ネットワーク上で提供されるユーザ間のコミュニケーションにおいて、ユーザの特性を抽出する情報抽出方法およびその装置に関する。   The present invention relates to communication provided over a network. More specifically, the present invention relates to an information extraction method and apparatus for extracting user characteristics in communication between users provided on a network.

近年、インターネットの発展に伴い、ネットワークを介したコミュニケーションが普及し、一般に広く浸透している。特に、メーリングリストや掲示板、チャット、ブログなどでは、ユーザ同士が既知であるか未知であるかを問わず、ネットワーク上でコミュニティを形成し、活発なコミュニケーションや、情報交換が行われている。   In recent years, with the development of the Internet, communication via a network has become widespread and has spread widely. In particular, in mailing lists, bulletin boards, chats, blogs, etc., regardless of whether users are known or unknown, a community is formed on the network, and active communication and information exchange are performed.

このような状況を反映し、企業がネットワーク上に直接もしくは間接的にコミュニティを設置して、自らの商品、サービスなどの評判や消費者ニーズの収集、宣伝活動などに利用することが注目されている。また、ユーザにおいては、ネットワーク上のコミュニティを趣味や興味のある事柄に関する情報交換や情報収集、新しい人との出会いの場などとして活用している。   Reflecting this situation, it is attracting attention that companies set up a community directly or indirectly on the network and use it to collect reputation and consumer needs for their products and services, and to promote their activities. Yes. In addition, users use the community on the network as a place for exchanging information, collecting information, and meeting new people.

このようなコミュニティは、本来、ユーザの自発的な参加に基づいている。安定的かつ活発なコミュニティには、通常、コミュニティの発展に寄与するキーパーソンがいて、話題の提供、情報交換の円滑化、初心者ユーザに対するサポートなどの役割を担っている。このようなキーパーソンは、本質的に、多くのユーザとコミュニケーションを持ち、多くのユーザから信頼され、それゆえコミュニティに対する影響力が大きく、また、情報も集中することになる。そのため、企業にとって、情報収集および宣伝活動を行う上で、このようなキーパーソンに重点をおいた交渉活動が効果的であり、また、ユーザにとっては、居心地がよく、安定したコミュニティを維持する上で、活発かつ持続的なコミュニケーションを支援しているキーパーソンやそのような人のいる環境を発見できることが重要である。   Such communities are essentially based on voluntary user participation. A stable and active community usually has a key person who contributes to the development of the community, and plays a role of providing topics, facilitating information exchange, and supporting novice users. Such a key person essentially communicates with many users, is trusted by many users, and thus has a great influence on the community, and also concentrates information. For this reason, negotiation activities focusing on such key persons are effective for companies in collecting and advertising information, and for users to maintain a comfortable and stable community. Therefore, it is important to be able to discover key persons and active environments that support active and sustainable communication.

他方、ユーザ間のコミュニケーションを活性化させる環境を持たないコミュニティでは、コミュニティのメンバが固定的となり、コミュニケーションの量が多い場合でも必ずしも活発なコミュニティとはいえない場合も多い。また、コミュニティのジャンル、話題は多岐にわたり、多数存在するために、ユーザが参加しやすいと感じられる環境を見つけ出すために時間を要し、また見ず知らずの相手とのコミュニケーションに不安を感じることで、新規のユーザが参加しづらいという問題がある。   On the other hand, in a community that does not have an environment that activates communication between users, the members of the community are fixed, and even when the amount of communication is large, it is not always an active community. In addition, since there are many genres and topics in the community, it takes time to find an environment where users can feel easy to participate, and it is new to feel uneasy about communication with strangers. There is a problem that it is difficult for users to participate.

こうした問題に対して、現在では、コミュニティの主催者側が、コミュニティにおけるコミュニケーションの履歴から話題毎の参加人数や、アクセス数、書き込み数などから作成したランキング結果、評価結果、ユーザのプロフィール情報を表示するなどして、コミュニケーションの環境に関する情報を提供し、コミュニケーションの話題、コミュニケーションを行う相手の発見を容易にする工夫を行っている。   In response to these problems, the community organizer now displays ranking results, evaluation results, and user profile information created from the number of participants per topic, number of accesses, number of writes, etc., from the communication history in the community. In this way, we provide information about the communication environment, and make efforts to make it easier to find communication topics and partners.

特許文献1に開示された装置では、ユーザの特徴をプロフィール情報だけで表示するのではなく、そのプロフィール情報の解析を行い、ユーザが現在興味をもっていると考えられるコンテンツ(ニュース、映像、音楽、(背景)画像、広告など)を自動で収集する。そして、その収集したコンテンツで構成したユーザの情報をコミュニケーションを行う相手に提供することで、より個人の興味を考慮した情報の提供や、相手とのコミュニケーションにおける話題の提供を可能にしている。   The apparatus disclosed in Patent Document 1 does not display the user's characteristics only by profile information, but analyzes the profile information, and the contents (news, video, music, ( Background) images, advertisements, etc.) automatically. Then, by providing the user information composed of the collected contents to the communication partner, it is possible to provide information in consideration of personal interest and to provide a topic in communication with the partner.

また、コミュニティを活性化するために、コミュニティの活動をランキングする方法も知られている。例えば、TeaCupの掲示板では、アクセス数や書き込み数が一定の基準を超えていること、アクセス数や書き込み数が限度を超えておらず参加しやすいこと、幅広いユーザからの書き込みがあることを基準にランキングを表示している(非特許文献1参照)。価格.comの口コミ掲示板では、盛り上がり度の表示、返信数の多いスレッド、役に立っているスレッド、書き込み数の多い人をランキングしている(非特許文献2参照)。また、Slashdot Japanの掲示板では、モデレータが他のユーザのコメント(書き込み)内容を評価して、結果を公表している。この評価は、有益なコメントを発掘して、他の人の目に触れさせることを目的とするため、モデレータの個人的な趣味や考えでは行わないことが原則となっている(非特許文献3参照)。   In addition, in order to revitalize a community, a method of ranking community activities is also known. For example, on the TeaCup bulletin board, the number of accesses and writes exceeds a certain standard, the number of accesses and the number of writes does not exceed the limit, it is easy to participate, and there are writings from a wide range of users The ranking is displayed (see Non-Patent Document 1). The review board of price.com ranks the display of the degree of excitement, threads with many replies, useful threads, and people with many writes (see Non-Patent Document 2). On the Slashdot Japan bulletin board, the moderator evaluates other users' comments (writes) and publishes the results. The purpose of this evaluation is to discover useful comments and make them visible to other people, so it is a principle that this evaluation is not performed by the personal hobbies and thoughts of the moderator (Non-Patent Document 3). reference).

特開2003−223406号公報(第4頁、課題を解決する手段参照)JP 2003-223406 A (refer to page 4, means for solving the problem) 株式会社ティーカップ・コミュニケーション、“「みんなの掲示板」ランキングについて”、[on−line]、[平成16年2月6日検索]、インターネット<URL: http://bbs.teacup.com/help/rank_guide.html>Teacup Communication Co., Ltd., “About everyone's bulletin board ranking”, [on-line], [Search February 6, 2004], Internet <URL: http://bbs.teacup.com/help/rank_guide .html> 株式会社カカクコム、“書き込みランキング”、[on−line]、[平成16年2月6日検索]、インターネット<URL: http://www.kakaku.com/help/bbs_rank.htm>Kakaku.com, Inc., “Write Ranking”, [on-line], [Search February 6, 2004], Internet <URL: http://www.kakaku.com/help/bbs_rank.htm> Open Source Development Network Japan、“コメントとモデレーション”、[on−line]、[平成16年2月6日検索]、インターネット<URL: http://slashdot.jp/faq/com-mod.shtml>Open Source Development Network Japan, “Comments and Moderation”, [on-line], [Search February 6, 2004], Internet <URL: http://slashdot.jp/faq/com-mod.shtml>

このように、従来のコミュニケーションの履歴などから抽出され、ユーザがコミュニティについて知るために提供される情報は、参加人数(または登録数)、アクセス数、書き込み数の多いジャンルやスレッド、書き込み回数の多いユーザ、評価の高い書き込みについてである。しかしながら、こうした情報のみでは、以下に記す課題が残る。   As described above, information extracted from the history of conventional communication and provided for the user to know about the community includes the number of participants (or the number of registrations), the number of accesses, the genre and thread with a large number of writes, and the number of writes. It is about user and high evaluation writing. However, with such information alone, the following problems remain.

コミュニケーションに参加したいと欲している初心者ユーザが、コミュニケーションの相手を見つけるときに、発信数の多いユーザという情報だけではなく、特定のユーザとの間で発信が多いのか、様々なユーザとの間で発信が多いのかを知りたい場合がある。また、特定のジャンルやスレッドにおいて、特定のユーザとの間で発信が多いユーザか、様々なユーザとの間で発信が多いユーザか、返信が期待できるユーザかを知りたい場合がある。また、企業が情報収集や宣伝活動を行う上で多くのユーザとの間でコミュニケーションを持つキーパーソンを特定する場合においても、同様である。   When a novice user who wants to participate in communication finds a communication partner, not only the information that the number of outgoing users is high, but also whether there are many outgoing calls with a specific user or between various users You may want to know if there are many outgoing calls. In addition, there are cases where it is desired to know whether a user makes a lot of calls with a specific user, a user who makes a lot of calls with various users, or a user who can expect a reply in a specific genre or thread. The same applies to a case where a key person who communicates with many users is identified when a company collects information or conducts advertising activities.

また、初心者ユーザ以外のユーザにおいては、単に発信数や書き込み数だけでなく、自身のコミュニティに対する貢献の度合いや他のユーザとのつながりを把握することによりコミュニティに対する帰属心を高め、さらに積極的にコミュニティに参加する動機付けとなる。換言すれば、話題へのアクセス数や、書き込み数による盛り上がり度のみでは、アクセス数や書き込み数の多い話題に対する個々のユーザの貢献度合い、またはコミュニティ全体に対する個々のユーザの貢献度合いを知ることができない。また、ユーザの書き込み内容の評価では、個々の書き込み内容の評価について知ることはできても、特定のジャンルやコミュニティ全体に対する総合的な貢献度合いを知ることができない。   In addition to the number of outgoing calls and writes, users other than novice users can increase their belonging to the community by grasping their degree of contribution to the community and their connection with other users. Motivate to join the community. In other words, it is not possible to know the degree of contribution of individual users to topics with a high number of accesses or writing, or the degree of contribution of individual users to the entire community only by the number of accesses to the topic or the degree of excitement due to the number of writing. . In addition, in the evaluation of the written content of the user, although it is possible to know about the evaluation of each written content, it is not possible to know the total contribution degree to a specific genre or the entire community.

このように、従来から提供されている情報では、コミュニティに参加しているユーザの特性、すなわち、参加してまだ日の浅いおよび/または発信回数の少ない初心者ユーザであるか、多くのユーザとの間でコミュニケーションを取っているユーザであるか、特定のジャンルやスレッドについて多くのユーザとの間でコミュニケーションを取っているユーザであるか、初心者に対して発言のきっかけを与えたり、初心者の発言をフォローしたりしているユーザであるか、各ユーザ間のコミュニケーションの度合いなどといった情報は考慮されていない。   As described above, in the information provided in the past, characteristics of users participating in the community, i.e., beginner users who have joined the community and / or the number of outgoing calls is low, or with many users. Users who are communicating with each other, users who are communicating with many users about a specific genre or thread, giving the beginners the opportunity to speak, Information such as whether the user is following or the degree of communication between each user is not considered.

本発明は、このような問題に鑑みてなされたもので、その目的とするところは、コミュニティ全体、またはジャンルやスレッド毎に、ユーザの特性を抽出することによって、コミュニティに興味を持つ人が、コミュニティまたは興味のある話題について中心的な人物を見つけたり、コミュニケーションを行う相手を見つけたりすることを容易にし、また、コミュニティのユーザが、自信のコミュニティにおける貢献度合いや他のユーザとのコミュニケーションの度合いや他のユーザとのつながり度合いを知ることができるようにすることである。   The present invention has been made in view of such a problem, and the purpose of the present invention is to extract a user's characteristics for the entire community, or for each genre or thread, so that a person interested in the community can Easier to find a central person on a community or topic of interest, or to find someone to communicate with, and to help community users contribute to their community or communicate with others And the degree of connection with other users.

本発明によれば、このような目的を達成するために、請求項1に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーション提供装置に登録されたユーザ情報と、ユーザ間のコミュニケーションの履歴情報から、コミュニケーションの成立した次数に基づいて、活発なコミュニケーションを行っている上位ユーザグループを抽出するステップを備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置における上位ユーザについて知ることができる。   According to the present invention, in order to achieve such an object, according to the first aspect of the present invention, in the communication providing apparatus on the network, the user information registered in the communication providing apparatus and the history of communication between users It is an information extraction method characterized by including a step of extracting a higher-level user group performing active communication from information based on the established degree of communication. According to this method, it is possible to know the upper user in the communication providing apparatus.

請求項2に記載の発明は、ネットワーク上のコミュニケーション提供装置において、多くのジャンルについて、活発なコミュニケーションを行っており、他の多くのユーザから返信を受けている重要ユーザグループを抽出するステップをさらに備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置における重要ユーザについて知ることができる。   According to the second aspect of the present invention, the communication providing apparatus on the network further includes a step of extracting an important user group that performs active communication for many genres and receives replies from many other users. It is the information extraction method characterized by providing. According to this method, it is possible to know important users in the communication providing apparatus.

請求項3に記載の発明は、ネットワーク上のコミュニケーション提供装置において、ある特定のジャンルについて、活発なコミュニケーションを行っているジャンル別上位ユーザグループを抽出するステップをさらに備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置におけるジャンル別上位ユーザについて知ることができる。   According to a third aspect of the present invention, the information providing method further comprises the step of extracting, by a communication providing apparatus on a network, an upper user group classified by genre that is actively communicating for a specific genre. It is. According to this method, it is possible to know the top users by genre in the communication providing apparatus.

請求項4に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーション提供装置に登録されたユーザ情報と、ユーザ間のコミュニケーションの履歴情報から、初心者ユーザグループを抽出するステップを備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置における初心者ユーザについて知ることができる。   According to a fourth aspect of the present invention, the communication providing device on the network includes a step of extracting a beginner user group from user information registered in the communication providing device and history information of communication between users. Information extraction method. According to this method, it is possible to know a novice user in the communication providing apparatus.

請求項5に記載の発明は、ネットワーク上のコミュニケーション提供装置において、多くの初心者ユーザから返信を受けているきっかけ提供ユーザグループを抽出するステップをさらに備えることを特徴とする情報抽出装置である。この方法によれば、コミュニケーション提供装置におけるきっかけ提供ユーザについて知ることができる。   According to a fifth aspect of the present invention, there is provided the information extracting apparatus further comprising a step of extracting a trigger providing user group receiving replies from many beginner users in the communication providing apparatus on the network. According to this method, it is possible to know the opportunity providing user in the communication providing apparatus.

請求項6に記載の発明は、ネットワーク上のコミュニケーション提供装置において、多くの初心者ユーザからの返信に対して返信を行っているフォローユーザグループを抽出するステップをさらに備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置におけるフォローユーザについて知ることができる。   The invention according to claim 6 further comprises the step of extracting a follow user group that is replying to replies from many beginner users in the communication providing apparatus on the network. It is. According to this method, it is possible to know the follow user in the communication providing apparatus.

請求項7に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーション提供装置に登録されたユーザ情報と、ユーザ間のコミュニケーションの履歴情報から、各ユーザ間のコミュニケーションの成立した回数に基づいて、各ユーザ間のつながり度合いを抽出するステップを備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置におけるコミュニケーションの成立に基づくユーザ間のつながり度合いについて知ることができる。   The invention according to claim 7 is the communication providing device on the network, based on the user information registered in the communication providing device and the communication history information between the users, based on the number of times communication between the users is established, It is an information extraction method characterized by including the step which extracts the connection degree between each user. According to this method, it is possible to know the degree of connection between users based on the establishment of communication in the communication providing apparatus.

請求項8に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーション提供装置に登録されたユーザ情報と、ユーザ間のコミュニケーションの履歴情報から、各ユーザの組が各ジャンル、各スレッド、または各ブランチにおいて共存した回数に基づいて、各ユーザ間のつながり度合いを抽出するステップを備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置における共通のスレッドまたはブランチでの共存に基づくユーザ間のつながり度合いについて知ることができる。   The invention according to claim 8 is a communication providing apparatus on a network, wherein each user set is classified into each genre, each thread, or each of the user information registered in the communication providing apparatus and the history information of communication between users. An information extraction method comprising a step of extracting a degree of connection between users based on the number of times the branch coexists. According to this method, it is possible to know the degree of connection between users based on coexistence in a common thread or branch in the communication providing apparatus.

請求項9に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーション提供装置に登録されたユーザ情報と、ユーザ間のコミュニケーションの履歴情報から、各ユーザのメッセージについて、多くのユーザから閲覧されている被閲覧上位ユーザグループを抽出するステップを備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置における被閲覧上位ユーザについて知ることができる。   According to the ninth aspect of the present invention, in the communication providing apparatus on the network, each user's message is viewed by many users from the user information registered in the communication providing apparatus and the communication history information between users. It is the information extraction method characterized by including the step which extracts the to-be-viewed high-order user group. According to this method, it is possible to know about the browsing upper user in the communication providing apparatus.

請求項10に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーション提供装置に登録されたユーザ情報と、ユーザ間のコミュニケーションの履歴情報から、各ユーザのメッセージについて、他のユーザから高く評価されている評点上位ユーザグループを抽出するステップを備えることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置における評点上位ユーザについて知ることができる。   In the communication providing device on the network, the message of each user is highly evaluated by other users from the user information registered in the communication providing device and the history information of communication between users. It is the information extraction method characterized by including the step which extracts the high-ranking user group which has it. According to this method, it is possible to know the high-ranking user in the communication providing apparatus.

請求項11に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーションの成立した次数を対象となるユーザの総数に対する割合とすることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置におけるユーザの諸特性を次数の割合に基づいて知ることができる。   The invention according to claim 11 is the information extraction method characterized in that, in the communication providing apparatus on the network, the established degree of communication is set as a ratio to the total number of users. According to this method, various characteristics of the user in the communication providing apparatus can be known based on the order ratio.

請求項12に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーションの成立を一連の送受信を伴う直接的な双方向のメッセージのやりとりとすることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置におけるユーザの諸特性を直接的な双方向のコミュニケーションに基づいて知ることができる。   According to a twelfth aspect of the present invention, in the communication providing apparatus on the network, the establishment of the communication is a direct bidirectional message exchange accompanied with a series of transmission / reception. According to this method, various characteristics of the user in the communication providing apparatus can be known based on direct bidirectional communication.

請求項13に記載の発明は、ネットワーク上のコミュニケーション提供装置において、コミュニケーションの成立を各ジャンル、各スレッド、または各ブランチ内における送受信に伴って行われる間接的な送受信のメッセージのやりとりとすることを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置におけるユーザの諸特性を間接的な双方向のコミュニケーションに基づいて知ることができる。   In the communication providing apparatus on the network according to the thirteenth aspect of the present invention, the establishment of communication is an indirect transmission / reception message exchange accompanying transmission / reception in each genre, each thread, or each branch. This is a characteristic information extraction method. According to this method, various characteristics of the user in the communication providing apparatus can be known based on indirect bidirectional communication.

請求項14に記載の発明は、ネットワーク上のコミュニケーション提供装置において、所定の期間のユーザ情報またはコミュニケーションの履歴情報に基づくことを特徴とする情報抽出方法である。この方法によれば、コミュニケーション提供装置におけるユーザの諸特性を所定の期間について知ることができる。   The invention according to claim 14 is an information extraction method characterized in that the communication providing apparatus on the network is based on user information or communication history information for a predetermined period. According to this method, various characteristics of the user in the communication providing apparatus can be known for a predetermined period.

請求項15に記載の発明は、ネットワークを介してユーザ間のコミュニケーションを提供するコミュニケーション提供装置において、履歴情報収集部と、抽出ユーザ情報データベースと、コミュニケーション履歴情報データベースと、情報抽出用パラメータデータベースと、情報抽出部とを備えたことを特徴とする情報抽出装置である。本発明によれば、コミュニケーション提供装置と共に使用して、ユーザの諸特性に関する情報の抽出が可能となる。   The invention according to claim 15 is a communication providing apparatus for providing communication between users via a network, a history information collection unit, an extracted user information database, a communication history information database, an information extraction parameter database, An information extraction apparatus including an information extraction unit. ADVANTAGE OF THE INVENTION According to this invention, it becomes possible to extract the information regarding a user's various characteristics using with a communication provision apparatus.

以下、図面を参照しながら本発明の実施形態について詳細に説明する。図1は、本発明の一実施形態における全体構成を示す機能ブロック図である。コミュニケーション提供装置10と、情報抽出装置20と、ユーザ端末40a、40b、40nとは、ネットワーク30を介して相互に通信可能に接続されている。コミュニケーション提供装置10は、ネットワーク30上で、ユーザ端末40a、40b、40nのユーザ間のコミュニケーションのための環境を提供している。通例、コミュニケーション提供装置10を介したコミュニケーションは次のように行われる。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a functional block diagram showing the overall configuration of an embodiment of the present invention. The communication providing device 10, the information extracting device 20, and the user terminals 40 a, 40 b, and 40 n are connected via a network 30 so that they can communicate with each other. The communication providing apparatus 10 provides an environment for communication between users of the user terminals 40a, 40b, and 40n on the network 30. Usually, communication via the communication providing apparatus 10 is performed as follows.

先ず、コミュニケーション提供装置10に、コミュニケーションの核となる少なくとも1つのコンテンツが提供される。このようなコンテンツは、テキスト、オーディオやビデオを含むマルチメディアの形態で提供され、特定の話題、プロジェクト、オンラインゲームなどで構成することができる。こうしたコンテンツに興味を持つ人々がユーザ端末40a、40b、40nからネットワーク30を介してコミュニケーション提供装置10にアクセスすることになる。この時、コミュニケーション提供装置10で提供されるサービスによっては、ユーザの登録を要求するものもあれば、要求しないものもある。ユーザの登録が要求される場合、ユーザはネットワーク30を介して下記で詳細に説明するユーザ情報をコミュニケーション提供装置10に登録することになる。   First, at least one content serving as the core of communication is provided to the communication providing apparatus 10. Such content is provided in the form of multimedia including text, audio and video, and can be composed of specific topics, projects, online games and the like. People who are interested in such content access the communication providing apparatus 10 via the network 30 from the user terminals 40a, 40b, and 40n. At this time, depending on the service provided by the communication providing apparatus 10, there may be a request for user registration, or a request not required. When user registration is requested, the user registers user information described in detail below in the communication providing apparatus 10 via the network 30.

コミュニケーション提供装置10には、アクセスしたユーザが他のユーザに対してメッセージ(コンテンツを含む)を公開する機構が含まれる。例えば、掲示板、メーリングリスト、チャット、ブログなどでは、ユーザ端末40a、40b、40nからテキストやHTML形式などのメッセージをコミュニケーション提供装置10に伝送する。伝送されたメッセージは、掲示板、チャット、およびブログの場合は、コミュニケーション提供装置10上で公開され、他のユーザが閲覧することができる。メーリングリストの場合は、宛先となる電子メールアドレスを登録したユーザに対して電子メールの形態でメッセージが配信される。サービスに参加するすべてのユーザが、新たにメッセージを公開したり、既に公開されたメッセージに対してメッセージを公開したり、公開されたメッセージを閲覧したりすることができる。このようなコミュニケーションの活動およびその内容は、登録したユーザ情報を含め(ユーザ登録が必要な場合)、コミュニケーション提供装置において記録することができる。このように、ネットワーク30上で複数のユーザがコミュニケーション提供装置10を介してメッセージの交換を行うことによってコミュニケーションが成立する。   The communication providing apparatus 10 includes a mechanism in which a user who accesses accesses a message (including content) to other users. For example, in a bulletin board, mailing list, chat, blog, etc., a message such as text or HTML format is transmitted from the user terminals 40a, 40b, 40n to the communication providing apparatus 10. In the case of bulletin boards, chats, and blogs, the transmitted message is released on the communication providing device 10 and can be viewed by other users. In the case of a mailing list, a message is delivered in the form of an e-mail to a user who has registered an e-mail address as a destination. All users participating in the service can publish a new message, publish a message to a previously published message, or view a published message. Such communication activities and their contents can be recorded in the communication providing apparatus including the registered user information (when user registration is required). In this way, communication is established when a plurality of users exchange messages via the communication providing device 10 on the network 30.

本発明の一実施形態においては、コミュニケーション提供装置10は、コミュニケーションを提供するためのユーザの基本情報(ユーザ管理ID、アドレス情報、パスワード、加入年月日など)およびユーザの属性情報(年齢、職業など)を含むユーザ情報データベース16と、ユーザ間のコミュニケーションの内容(タイトル、内容)および関連情報(ジャンル/スレッドID、コミュニケーションID、発信元アドレス、コミュニケーション時刻、コミュニケーション種別、返信先コミュニケーションIDなど)を含むコミュニケーション情報データベース18と、ユーザ端末40a、40b、40nからのアクセスおよびコミュニケーション提供装置10内の制御を行うコミュニケーション制御部12と、情報抽出装置20とのインタフェースを担うコミュニケーション情報通知部14とを備える。このコミュニケーション提供装置10は、通例、クライアントサーバ環境におけるサーバとして提供されるが、これに限定されるものではない。   In one embodiment of the present invention, the communication providing apparatus 10 includes basic user information (user management ID, address information, password, date of subscription, etc.) and user attribute information (age, occupation, etc.) for providing communication. Etc.) and information (title, content) and related information (genre / thread ID, communication ID, source address, communication time, communication type, reply destination communication ID, etc.) of communication between users. Including the communication information database 18, the communication control unit 12 that performs access from the user terminals 40 a, 40 b, and 40 n and controls the communication providing device 10, and the information extraction device 20. And a communication information notification unit 14 responsible for Esu. The communication providing apparatus 10 is usually provided as a server in a client server environment, but is not limited thereto.

情報抽出装置20は、本発明の一実施形態においては、履歴情報収集部22と、情報抽出部24と、抽出ユーザ情報データベース25と、コミュニケーション履歴情報データベース27と、情報抽出用パラメータデータベース29とを備える。下記でより詳細に説明するように、履歴情報収集部22は、コミュニケーション情報通知部14からのユーザ情報およびコミュニケーション情報に基づいて、ユーザを特定する情報を抽出ユーザ情報データベース25に照会および/または登録し、コミュニケーション情報を処理してコミュニケーション履歴情報データベース27に登録し、ユーザ情報およびコミュニケーション情報から情報抽出用パラメータデータベース29に関連する情報を記録する。情報抽出部24は、コミュニケーション情報通知部14の指示に基づき、抽出ユーザ情報データベース25、コミュニケーション履歴情報データベース27、および情報抽出用パラメータデータベース29に格納された情報から、初心者ユーザや重要ユーザなどのユーザ特性、ユーザ特性の類似するユーザ、ユーザ間のコミュニケーションの頻度によるつながり度合いなどを抽出する。   In one embodiment of the present invention, the information extraction device 20 includes a history information collection unit 22, an information extraction unit 24, an extraction user information database 25, a communication history information database 27, and an information extraction parameter database 29. Prepare. As will be described in more detail below, the history information collection unit 22 inquires and / or registers information identifying the user in the extracted user information database 25 based on the user information and communication information from the communication information notification unit 14. Then, the communication information is processed and registered in the communication history information database 27, and information related to the information extraction parameter database 29 is recorded from the user information and the communication information. Based on instructions from the communication information notification unit 14, the information extraction unit 24 uses the information stored in the extracted user information database 25, the communication history information database 27, and the information extraction parameter database 29, such as beginner users and important users. Characteristics, users with similar user characteristics, and the degree of connection depending on the frequency of communication between users are extracted.

コミュニケーション提供装置10および情報抽出装置20のそれぞれの機能は、ソフトウェア、ハードウェア、またはこれらの組み合わせにより実装することができる。また、これらの機能は、1つの場所に集約して設置することもできるし、例えばネットワーク30または他のネットワークを介して、複数の場所に分散して設置することもできる。ネットワーク30は、例えば、公衆電話網、携帯電話網、専用線などで利用されるインターネット、イントラネット、VPN、LAN、WANなどの双方向のオープンまたはクローズドなネットワークとすることができる。ユーザ端末の例としては、有線か無線かを問わずネットワーク30と物理的に接続され、コミュニケーション提供装置10と論理的に通信することのできる、パーソナルコンピュータ、デジタル情報端末、携帯電話、セットトップボックス、オンラインゲーム端末、その他の端末とすることができる。   The functions of the communication providing device 10 and the information extracting device 20 can be implemented by software, hardware, or a combination thereof. Also, these functions can be installed in one place, or can be installed in a plurality of places via the network 30 or another network, for example. The network 30 may be, for example, a bidirectional open or closed network such as the Internet, an intranet, a VPN, a LAN, and a WAN that are used on a public telephone network, a mobile phone network, a dedicated line, and the like. Examples of user terminals include personal computers, digital information terminals, mobile phones, and set-top boxes that are physically connected to the network 30 regardless of whether they are wired or wireless and can logically communicate with the communication providing device 10. , Online game terminals, and other terminals.

本発明の実施形態にかかる方法および装置は、例示として、ネットワーク30上で提供される掲示板、メーリングリスト、チャット、ブログについて主に説明するが、当業者であれば、ネットワーク上で提供されるその他多くの形態のコミュニケーションについても適用できることが理解されるであろう。   The method and apparatus according to the embodiment of the present invention will be mainly described with respect to bulletin boards, mailing lists, chats, and blogs provided on the network 30 by way of example, but those skilled in the art will appreciate many others provided on the network. It will be understood that the present invention can also be applied to other forms of communication.

図2に、ユーザ情報データベース16のデータベース構造の実施例を示す。図2(a)は掲示板、チャット、ブログなどにおける例示的なデータベース構造200aであり、図2(b)はメーリングリストなどにおける例示的なデータベース構造200bである。ユーザ情報データベース16には、ユーザ管理IDフィールド202a、202bと、アドレス情報フィールド204a、204bと、パスワードフィールド206a、206bと、加入年月日フィールド208a、208bと、ユーザ属性情報フィールド210a、210bが含まれる。   FIG. 2 shows an embodiment of the database structure of the user information database 16. FIG. 2A shows an exemplary database structure 200a for a bulletin board, chat, blog, etc., and FIG. 2B shows an exemplary database structure 200b for a mailing list or the like. The user information database 16 includes user management ID fields 202a and 202b, address information fields 204a and 204b, password fields 206a and 206b, subscription date fields 208a and 208b, and user attribute information fields 210a and 210b. It is.

ユーザ管理IDフィールド202a、202bは、コミュニケーション提供装置10においてユーザを一意に特定する識別子であり、例えば、ユーザ登録時または初回のアクセス時にコミュニケーション提供装置において設定される。掲示板、チャット、ブログなどの場合、アドレス情報フィールド204aは、コミュニケーション提供装置10におけるユーザのアドレスであり、ユーザによって設定されるようにしても、コミュニケーション提供装置によって設定されるようにしてもよい。メーリングリストなどの場合、アドレス情報フィールド204bは、ネットワーク30上におけるユーザのアドレスであり、通例は、電子メールアドレスが設定される。パスワードフィールド206a、206bは、アドレス情報204a、204bと対応して、ユーザあるいはコミュニケーション提供装置によって設定される認証用のパスワードが格納される。しかし、コミュニケーション提供装置10によって提供されるサービスによっては、パスワード認証を必要としない場合もある。   The user management ID fields 202a and 202b are identifiers that uniquely identify the user in the communication providing apparatus 10, and are set in the communication providing apparatus at the time of user registration or first access, for example. In the case of a bulletin board, a chat, a blog, etc., the address information field 204a is the user's address in the communication providing device 10, and may be set by the user or the communication providing device. In the case of a mailing list or the like, the address information field 204b is an address of a user on the network 30, and usually an e-mail address is set. Password fields 206a and 206b store passwords for authentication set by the user or the communication providing device in correspondence with the address information 204a and 204b. However, depending on the service provided by the communication providing apparatus 10, password authentication may not be required.

加入年月日フィールド208a、208bは、ユーザがコミュニケーションに初めて参加または登録した日付が記録され、設定される。ユーザ属性情報フィールド210a、210bは、例えばユーザがコミュニケーションに初めて参加または登録する際にユーザが提供したユーザの属性情報を格納する。ユーザ属性情報フィールド210a、210bにはそれぞれ、例えば年齢フィールド212a、212b、職業フィールド214a、214bなどが含まれるが、これらに限られるものではない。以下、これらユーザ情報データベース16に格納されるデータを「ユーザ情報」と称する。   In the subscription date fields 208a and 208b, the date when the user first participates or registers in the communication is recorded and set. The user attribute information fields 210a and 210b store, for example, user attribute information provided by the user when the user first participates or registers in the communication. The user attribute information fields 210a and 210b include, for example, age fields 212a and 212b, occupation fields 214a and 214b, but are not limited thereto. Hereinafter, the data stored in the user information database 16 is referred to as “user information”.

図3に、コミュニケーション情報データベース18のデータベース構造の実施例を示す。図3(a)は掲示板、チャット、ブログなどにおける例示的なデータベース構造300aであり、図3(b)はメーリングリストにおける例示的なデータベース構造300bである。コミュニケーション情報データベース18には、ジャンル/スレッドIDフィールド302a、302bと、コミュニケーションIDフィールド304a、304bと、発信元アドレスフィールド306a、306bと、コミュニケーション時刻フィールド308a、308bと、タイトルフィールド310a、310bと、内容フィールド312a、312bと、コミュニケーション種別フィールド314a、314bと、返信先コミュニケーションIDフィールド316a、316bとが含まれる。   FIG. 3 shows an embodiment of the database structure of the communication information database 18. 3A shows an exemplary database structure 300a in a bulletin board, chat, blog, etc., and FIG. 3B shows an exemplary database structure 300b in a mailing list. The communication information database 18 includes genre / thread ID fields 302a and 302b, communication ID fields 304a and 304b, source address fields 306a and 306b, communication time fields 308a and 308b, title fields 310a and 310b, and contents. Fields 312a and 312b, communication type fields 314a and 314b, and reply destination communication ID fields 316a and 316b are included.

ジャンル/スレッドIDフィールド302a、302bは、コミュニケーションのジャンルおよび/またはスレッドを特定する識別子であり、ユーザのコミュニケーションが対象とするジャンルおよび/またはスレッドに基づいて設定される。ジャンルとは、コミュニケーション提供装置10において、ユーザあるいはサービスを提供している主催者によって、設定されるコミュニケーション内容の分類であり、これによって、ユーザはコミュニケーションのための興味の対象を絞り込むことができる。ジャンルID(図3の「J003」)は、新たなジャンルが設定された時点で、コミュニケーション提供装置10によって設定することができる。また、スレッドは、1つのメッセージから派生して連なる複数のコミュニケーションの集合である。そのため、1つのスレッド内では元のメッセージに起因する話題がコミュニケーションの対象となっている場合が多く、ユーザはより詳細なコミュニケーションの興味の対象としてスレッドを選択することができる。スレッドID(図3の「T008」)は、新規のメッセージが設定された時点で、コミュニケーション提供装置10によって設定することができる。   The genre / thread ID fields 302a and 302b are identifiers that identify the genre and / or thread of communication, and are set based on the genre and / or thread targeted by the user's communication. The genre is a classification of communication contents set by the user or an organizer who provides a service in the communication providing apparatus 10, and the user can narrow down an object of interest for communication. The genre ID (“J003” in FIG. 3) can be set by the communication providing apparatus 10 when a new genre is set. A thread is a set of a plurality of communications derived from one message and connected. Therefore, in many cases, a topic caused by the original message is a target of communication within one thread, and the user can select a thread as a target of more detailed communication interest. The thread ID (“T008” in FIG. 3) can be set by the communication providing apparatus 10 when a new message is set.

さらに、図9に示すように、コミュニケーションID「0005」に起源を有する1つのスレッド100が、分岐点102、104を持つ場合がある。このようなツリー状のスレッドにおいては、スレッドよりもさらに小さな単位としてブランチを定義することができる。図9の例では、「0005」−「0006」−「0009」、「0005」−「0007」−「0008」−「0011」、および「0005」−「0007」−「0010」の3つのブランチが示されている。このように、コミュニケーションをスレッドよりもさらに詳細な単位であるブランチに分類することができる。このブランチは、下記で説明するコミュニケーション履歴情報データベース27に格納されたデータから、要求に応じて、そのつど導出することができる。   Furthermore, as shown in FIG. 9, one thread 100 that originates from the communication ID “0005” may have branch points 102 and 104. In such a tree-like thread, a branch can be defined as a smaller unit than the thread. In the example of FIG. 9, there are three branches “0005”-“0006”-“0009”, “0005”-“0007”-“0008”-“0011”, and “0005”-“0007”-“0010”. It is shown. In this way, communication can be classified into branches that are more detailed units than threads. This branch can be derived from the data stored in the communication history information database 27 described below in response to a request.

コミュニケーションIDフィールド304a、304bは、個々のコミュニケーション(新規発信、返信および閲覧を含む)を識別する識別子であり、各コミュニケーションに対してコミュニケーション提供装置10により一意的に設定される。発信元アドレスフィールド306a、306bは、コミュニケーション提供装置10によりコミュニケーションを行ったユーザのアドレス情報204a、204bが格納される。コミュニケーション時刻フィールド308a、308bは、コミュニケーション提供装置10によりコミュニケーションが行われた時刻を記録し、設定する。タイトルフィールド310a、310bは、特定のコミュニケーションからコミュニケーションのタイトルがコミュニケーション提供装置10により抽出され、格納される(閲覧の場合は、「ヌル」)。内容フィールド312a、312bは、特定のコミュニケーションからコミュニケーションの内容がコミュニケーション提供装置10により抽出され、格納される(閲覧の場合は、「ヌル」)。   The communication ID fields 304a and 304b are identifiers for identifying individual communications (including new transmission, reply, and browsing), and are uniquely set by the communication providing apparatus 10 for each communication. In the sender address fields 306a and 306b, address information 204a and 204b of the user who communicated with the communication providing apparatus 10 is stored. The communication time fields 308a and 308b record and set the time when communication is performed by the communication providing apparatus 10. In the title fields 310a and 310b, the communication title is extracted from the specific communication by the communication providing apparatus 10 and stored (in the case of browsing, “null”). In the content fields 312a and 312b, the communication content is extracted from the specific communication by the communication providing apparatus 10 and stored (in the case of browsing, “null”).

コミュニケーション種別フィールド314a、314bは、行われたコミュニケーションが、新規の発信であるか(図3の「新規」)、他のメッセージに対する返信であるか(図3の「返信」)、メッセージの閲覧であるか(図示せず)をコミュニケーション提供装置10により判定し、設定する。返信先コミュニケーションIDフィールド316a、316bは、行われたコミュニケーションが、新規の発信の場合は「ヌル」を設定し、返信の場合は返信の対象となるコミュニケーションIDを取得し、設定し、閲覧の場合は閲覧の対象となるコミュニケーションIDを取得し、設定する。以下、これらのコミュニケーション情報データベース18に格納されるデータを「コミュニケーション情報」と称する。   The communication type fields 314a and 314b indicate whether the communication performed is a new call (“new” in FIG. 3) or a reply to another message (“reply” in FIG. 3). Whether or not there is (not shown) is determined and set by the communication providing apparatus 10. The reply destination communication ID fields 316a and 316b are set to “null” when the communication that has been performed is a new call, and when the reply is a reply, the communication ID that is the object of the reply is acquired, set, and viewed Acquires and sets a communication ID to be browsed. Hereinafter, data stored in the communication information database 18 is referred to as “communication information”.

図4に、抽出ユーザ情報データベース25のデータベース構造の実施例を示す。図4(a)は掲示板、チャット、ブログなどにおける例示的なデータベース構造400aであり、図4(b)はメーリングリストなどにおける例示的なデータベース構造400bである。抽出ユーザ情報データベース25には、ユーザ管理IDフィールド202a、202bから抽出されたデータが格納される抽出ユーザ管理IDフィールド402a、402bと、アドレス情報フィールド204a、204bから抽出されたデータが格納される抽出アドレス情報フィールド404a、404bと、加入年月日フィールド208a、208bから抽出されたデータが格納される抽出加入年月日フィールド406a、406bと、ユーザ属性情報フィールド210a、210bから抽出されたデータが格納される抽出ユーザ属性情報408a、408bとが含まれる。抽出ユーザ属性情報フィールド408a、408bには、年齢フィールド212a、212bから抽出されたデータが格納される抽出年齢フィールド410a、410bと、職業フィールド214a、214bから抽出されたデータが格納される抽出職業フィールド412a、412bとが含まれるが、これらに限られるものではない。本発明の一実施形態においては、これらのフィールドに格納されるデータは、コミュニケーション情報通知部14からのユーザ情報に基づいて、履歴情報収集部22により抽出され、格納される。ユーザ情報は、コミュニケーション情報通知部14から、履歴情報収集部22へ、コミュニケーションの発生ごとに伝送されてもよいし、更新のために定期的に伝送されてもよい。また、別の実施形態では、ユーザ情報は、履歴情報収集部からのリクエストに応じて、コミュニケーション情報通知部14からオンディマンドで伝送されるようにしてもよい。   FIG. 4 shows an embodiment of the database structure of the extracted user information database 25. FIG. 4A shows an exemplary database structure 400a for a bulletin board, chat, blog, etc., and FIG. 4B shows an exemplary database structure 400b for a mailing list or the like. The extracted user information database 25 stores the extracted user management ID fields 402a and 402b that store data extracted from the user management ID fields 202a and 202b, and the data that is extracted from the address information fields 204a and 204b. Address information fields 404a and 404b, extraction date fields 406a and 406b in which data extracted from the subscription date fields 208a and 208b are stored, and data extracted from the user attribute information fields 210a and 210b are stored. Extracted user attribute information 408a and 408b. In extracted user attribute information fields 408a and 408b, extracted age fields 410a and 410b in which data extracted from age fields 212a and 212b are stored, and extracted occupation fields in which data extracted from occupation fields 214a and 214b are stored. 412a and 412b are included, but not limited thereto. In one embodiment of the present invention, data stored in these fields is extracted and stored by the history information collection unit 22 based on user information from the communication information notification unit 14. The user information may be transmitted from the communication information notification unit 14 to the history information collection unit 22 every time a communication occurs or may be transmitted periodically for updating. In another embodiment, user information may be transmitted on demand from the communication information notification unit 14 in response to a request from the history information collection unit.

図5に、コミュニケーション履歴情報データベース27のデータベース構造の実施例を示す。図5(a)は掲示板、チャット、ブログなどにおける例示的なデータベース構造500aであり、図5(b)はメーリングリストなどにおける例示的なデータベース構造500bである。コミュニケーション履歴情報データベース27には、発信元ユーザ管理IDフィールド502a、502bと、返信先ユーザ管理IDフィールド504a、504bと、ジャンル/スレッドIDフィールド506a、506bと、コミュニケーション時刻フィールド508a、508bと、コミュニケーションIDフィールド510a、510bと、返信先コミュニケーションIDフィールド512a、512bと、コミュニケーション種別フィールド514a、514bとが含まれる。   FIG. 5 shows an embodiment of the database structure of the communication history information database 27. FIG. 5A shows an exemplary database structure 500a in a bulletin board, chat, blog, etc., and FIG. 5B shows an exemplary database structure 500b in a mailing list or the like. The communication history information database 27 includes source user management ID fields 502a and 502b, reply destination user management ID fields 504a and 504b, genre / thread ID fields 506a and 506b, communication time fields 508a and 508b, and a communication ID. Fields 510a and 510b, reply destination communication ID fields 512a and 512b, and communication type fields 514a and 514b are included.

これらのフィールドに格納されるデータは、履歴情報収集部22によってコミュニケーション情報およびユーザ情報から抽出され、格納される。具体的には、発信元ユーザ管理IDフィールド502a、502bには、ユーザ情報からコミュニケーションを行ったユーザのユーザ管理ID202a、202bを抽出し、格納する。返信先ユーザ管理IDフィールド504a、504bには、ユーザ情報からコミュニケーションの対象となったユーザのユーザ管理ID202a、202bを抽出し、格納する。ジャンル/スレッドIDフィールド506a、506b、コミュニケーション時刻フィールド508a、508b、コミュニケーションIDフィールド510a、510b、返信先コミュニケーションIDフィールド512a、512b、およびコミュニケーション種別フィールド514a、514bには、コミュニケーション情報からコミュニケーションのジャンル/スレッドID300a、300b、コミュニケーション時刻308a、308b、コミュニケーションID304a、304b、返信先コミュニケーションID316a、316b、およびコミュニケーション種別314a、314bをそれぞれ抽出し、格納する。以下、これらのコミュニケーション履歴情報データベース27に格納されるデータを「コミュニケーション履歴情報」と称する。   Data stored in these fields is extracted from the communication information and user information by the history information collection unit 22 and stored. Specifically, the user management IDs 202a and 202b of the user who performed communication from the user information are extracted and stored in the transmission source user management ID fields 502a and 502b. In the reply-destination user management ID fields 504a and 504b, user management IDs 202a and 202b of users who are communication targets are extracted from the user information and stored. Genre / thread ID fields 506a and 506b, communication time fields 508a and 508b, communication ID fields 510a and 510b, return destination communication ID fields 512a and 512b, and communication type fields 514a and 514b include a genre / thread of communication from communication information. IDs 300a and 300b, communication times 308a and 308b, communication IDs 304a and 304b, reply destination communication IDs 316a and 316b, and communication types 314a and 314b are extracted and stored, respectively. Hereinafter, the data stored in the communication history information database 27 is referred to as “communication history information”.

図6に、情報抽出用パラメータデータベース29のデータベース構造の実施例を示す。図6(a)は掲示板、チャット、ブログなどにおける例示的なデータベース構造600aであり、図6(b)はメーリングリストなどにおける例示的なデータベース構造600bである。情報抽出用パラメータデータベース29には、ユーザ管理IDフィールド602a、602bと、ジャンル/スレッドIDフィールド604a、604bと、更新日フィールド606a、606bと、コミュニケーション種別フィールド608a、608bが含まれる。コミュニケーション種別フィールド608a、608bには、新規発信数610a、610bと、返信数612a、612bと、閲覧数614aとが含まれるが、これらの項目はコミュニケーション種別514a、514bの分類に応じて増減し、これらに限られるものではない。これらのフィールドに格納されるデータは、履歴情報収集部22によって次のように抽出され、格納される。ユーザ管理IDフィールド602a、602bは、ユーザ情報から、ジャンル/スレッドIDフィールド604a、604bは、コミュニケーション情報からそれぞれ取得される。次いで、更新日606a、606bは、コミュニケーション情報のコミュニケーション時刻308a、308bに基づいて更新され、新規発信数610a、610b、返信数612a、612b、および閲覧数614a、614bは、コミュニケーション情報のコミュニケーション種別から集計され、記録される。以下、これらの情報抽出用パラメータデータベース29に格納されるデータを「情報抽出用パラメータ」と称する。   FIG. 6 shows an embodiment of the database structure of the information extraction parameter database 29. 6A shows an exemplary database structure 600a in a bulletin board, chat, blog, etc., and FIG. 6B shows an exemplary database structure 600b in a mailing list or the like. The information extraction parameter database 29 includes user management ID fields 602a and 602b, genre / thread ID fields 604a and 604b, update date fields 606a and 606b, and communication type fields 608a and 608b. The communication type fields 608a and 608b include the number of new calls 610a and 610b, the number of replies 612a and 612b, and the number of views 614a. These items increase or decrease according to the classification of the communication types 514a and 514b However, it is not limited to these. Data stored in these fields is extracted and stored by the history information collection unit 22 as follows. User management ID fields 602a and 602b are acquired from user information, and genre / thread ID fields 604a and 604b are acquired from communication information. Next, the update dates 606a and 606b are updated based on the communication times 308a and 308b of the communication information, and the new outgoing numbers 610a and 610b, the reply numbers 612a and 612b, and the browse numbers 614a and 614b Aggregated and recorded. Hereinafter, the data stored in the information extraction parameter database 29 will be referred to as “information extraction parameters”.

次に、図7を参照して、本発明に係わる一実施例として、掲示板、チャット、ブログなどにおける情報抽出の処理の流れについて説明する。以下の説明は、図2(b)〜図6(b)を参照して、メーリングリストにおける処理のついても同様に当てはまることに留意されたい。また、当業者には、ネットワーク上で提供されるその他のコミュニケーションにも本発明が適用できることは明らかであろう。   Next, with reference to FIG. 7, the flow of information extraction processing in a bulletin board, chat, blog, etc. will be described as one embodiment according to the present invention. It should be noted that the following description applies similarly to the processing in the mailing list with reference to FIGS. 2 (b) to 6 (b). It will also be apparent to those skilled in the art that the present invention is applicable to other communications provided over a network.

図7は、コミュニケーション提供装置10に対してユーザ端末40aからコミュニケーションイベントが発生した場合の処理の流れである。図に示すように、ユーザ端末40aからの返信により(処理1)、コミュニケーションイベントがコミュニケーション制御部12において受信される。コミュニケーション制御部12は、このコミュニケーションイベントに含まれるユーザ端末40aのユーザのアドレス情報およびパスワードを、ユーザ情報データベース16に格納されたアドレス情報204aおよびパスワード206aと照合し、認証する(処理2)。さらに、コミュニケーションイベントに含まれるコミュニケーションの内容および関連情報から得られるコミュニケーション情報をコミュニケーション情報データベース18に登録する(処理3)。コミュニケーション制御部12は、コミュニケーションの結果として公開されるコミュニケーションの内容および関連情報をユーザ端末40aに表示する(処理4)。   FIG. 7 is a flow of processing when a communication event occurs from the user terminal 40a to the communication providing apparatus 10. As shown in the figure, a communication event is received by the communication control unit 12 by a reply from the user terminal 40a (processing 1). The communication control unit 12 compares the address information and password of the user of the user terminal 40a included in this communication event with the address information 204a and password 206a stored in the user information database 16 and authenticates them (Process 2). Furthermore, the communication information included in the communication event and the communication information obtained from the related information are registered in the communication information database 18 (process 3). The communication control unit 12 displays the contents of communication and related information disclosed as a result of communication on the user terminal 40a (process 4).

コミュニケーション制御部12は、コミュニケーション情報通知部14にコミュニケーションの発生を、コミュニケーション情報および該当するユーザ情報とともに、通知する(処理5)。その後、コミュニケーション情報通知部102は、受け取ったコミュニケーション情報および該当するユーザ情報を履歴情報収集部22に通知する(処理6)。履歴情報収集部22では、該当するユーザ情報のユーザ管理ID202aを基に抽出ユーザ情報データベース25と照合し、新規ユーザの場合は抽出ユーザ情報400aを登録する(処理7)。履歴情報収集部22は、さらに、ユーザ情報およびコミュニケーション情報を処理して(処理8)、コミュニケーション履歴情報データベース27にデータを登録する(処理9)。また、履歴情報収集部22は、ユーザ情報およびコミュニケーション履歴情報から情報抽出用パラメータデータベース29にデータの登録、更新を行う(処理10)。この処理10では、コミュニケーションを行ったユーザの該当するユーザ管理ID602aに対して、そのコミュニケーションが対象とするジャンル/スレッドID604a毎に該当するコミュニケーション種別608aの項目(例えば、新規発信数など)をインクリメントし、更新日606aを更新する。   The communication control unit 12 notifies the communication information notification unit 14 of the occurrence of communication together with the communication information and the corresponding user information (Process 5). Thereafter, the communication information notification unit 102 notifies the history information collection unit 22 of the received communication information and corresponding user information (processing 6). The history information collection unit 22 collates with the extracted user information database 25 based on the user management ID 202a of the corresponding user information, and registers the extracted user information 400a for a new user (processing 7). The history information collection unit 22 further processes user information and communication information (process 8), and registers data in the communication history information database 27 (process 9). Further, the history information collection unit 22 registers and updates data in the information extraction parameter database 29 from the user information and communication history information (processing 10). In this process 10, the item (for example, the number of new calls) corresponding to each genre / thread ID 604a targeted by the communication is incremented with respect to the corresponding user management ID 602a of the user who performed the communication. The update date 606a is updated.

図8は、本発明に係わる一実施例として、情報抽出装置20において情報の抽出および提供を行う処理の流れである。図に示すように、コミュニケーション情報通知部14から情報抽出部24に対して行われる情報抽出イベントにより(処理11)、情報抽出部24では、抽出ユーザ情報データベース25および情報抽出用パラメータデータベース29から、初心者ユーザの抽出を行う(処理12)。   FIG. 8 shows a flow of processing for extracting and providing information in the information extracting apparatus 20 as an embodiment according to the present invention. As shown in the figure, according to the information extraction event performed from the communication information notification unit 14 to the information extraction unit 24 (Process 11), the information extraction unit 24 uses the extracted user information database 25 and the information extraction parameter database 29 from A beginner user is extracted (process 12).

この処理12では、例えば、抽出加入年月日406aと現在の日付との日数差が所定値よりも小さい場合に初心者ユーザと判定する。あるいは、抽出加入年月日406aと現在の日付との日数差は所定値以上であるが、すべてのジャンル/スレッドID604aにわたってまたはある特定のジャンル/スレッドIDに対して、コミュニケーション種別608aが所定の基準値(例えば、新規発信数または返信数が3回未満で、閲覧数が10回未満など)に満たない場合に初心者ユーザと判定することもできる。また、情報抽出用パラメータデータベース29に、他のユーザからの評点、コミュニケーション提供装置10の管理者からの認定などの項目を追加して、これらの基準を用いて、初心者ユーザを判定することもできる。さらに、上記の基準の複数を組み合わせて、初心者ユーザを判定することもできる。   In this process 12, for example, when the difference in the number of days between the extracted subscription date 406a and the current date is smaller than a predetermined value, it is determined that the user is a novice user. Alternatively, the difference in the number of days between the extracted subscription date 406a and the current date is greater than or equal to a predetermined value, but the communication type 608a is a predetermined standard over all genres / thread IDs 604a or for a specific genre / thread ID. It can also be determined that the user is a novice user when the value (for example, the number of new outgoing calls or the number of replies is less than 3 times and the number of browsing times is less than 10). In addition, items such as scores from other users and certification from the administrator of the communication providing device 10 can be added to the information extraction parameter database 29, and a novice user can be determined using these criteria. . Furthermore, a novice user can also be determined by combining a plurality of the above criteria.

さらに、情報抽出部24では、抽出ユーザ情報400aおよびコミュニケーション履歴情報500aから、上位ユーザ、重要ユーザ、特定重要ユーザなどのユーザ特性に基づくユーザおよびユーザグループの抽出を行う(処理13)。例えば、次式を用いて、Cd(i)が最も高い最上位ユーザと、Cd(i)が最も高い値を基準として、所定の差分内に含まれるユーザを上位ユーザグループとみなす。

Cd(i)=d(i)/(g−1) (式1)

ここで、Cd(i)は、ユーザiの次数に基づく中心性を標準化した値であり、本式における次数とは、コミュニケーションの成立した相異なるユーザの数である。d(i)はユーザiの次数、gはユーザの総数(即ち、g−1が一人のユーザが持ちうる最大の次数となる)である。したがって、本式によるCd(i)は、各ユーザについて、最小値0から最大値1の間の値となる。ここで、コミュニケーションの成立とは、以下の場合を言う。
Further, the information extraction unit 24 extracts users and user groups based on user characteristics such as a higher-order user, important user, and specific important user from the extracted user information 400a and communication history information 500a (process 13). For example, using the following equation, the highest user with the highest Cd (i) and the user with the highest Cd (i) are regarded as the upper user group based on the highest value.

Cd (i) = d (i) / (g-1) (Formula 1)

Here, Cd (i) is a value obtained by standardizing the centrality based on the order of the user i, and the order in this expression is the number of different users who have established communication. d (i) is the order of user i, and g is the total number of users (that is, g-1 is the maximum order that one user can have). Therefore, Cd (i) according to this equation is a value between the minimum value 0 and the maximum value 1 for each user. Here, establishment of communication means the following cases.

片方向のコミュニケーションとして、新規の発信、返信、受信(返信を受けた場合)、閲覧(閲覧した場合)、および/または被閲覧(閲覧された場合)をそれぞれコミュニケーションの成立とみなすことができる。また、直接的双方向のコミュニケーションとして、あるユーザから自身のメッセージに対して返信を受け、その返信メッセージに対して返信を行った場合、またはあるメッセージに対して返信し、その返信メッセージに対して返信を受けた場合、それぞれコミュニケーションの成立とみなすこともできる。また、間接的双方向コミュニケーションとして、各ジャンル内、各スレッド内、または各ブランチ内において、自身の複数のメッセージ(新規の発信、返信、または受信)の間に1人または複数のユーザが存在する場合、こうした1人または複数のユーザとの間でコミュニケーションが成立し、またはあるユーザの複数のメッセージの間に自身のメッセージが存在する場合、このユーザとの間でコミュニケーションが成立したとみなすことができる。また、間接的コミュニケーションとして、各ジャンル、各スレッド、または各ブランチ内において複数のユーザのメッセージが共存した場合、これら複数のユーザ間でコミュニケーションが成立したとみなすこともできる。加えて、上記すべてのケースにおいて、他のユーザとのコミュニケーションの成立回数に閾値を設けて、この閾値を超えた場合をコミュニケーションの成立としてカウントすることもできる。   As one-way communication, new transmission, reply, reception (when a reply is received), browsing (when viewed), and / or viewed (when viewed) can be regarded as establishment of communication. Also, as a direct two-way communication, when a reply is received from a user to his / her message and a reply is made to the reply message, or a reply is made to a message and the reply message is When a reply is received, it can also be regarded as establishment of communication. In addition, as indirect two-way communication, one or a plurality of users exist between a plurality of messages (new transmission, reply, or reception) within each genre, within each thread, or within each branch. If communication is established with one or a plurality of users, or if a message is present among a plurality of messages of a certain user, communication with the user may be regarded as established. it can. Further, as indirect communication, when messages of a plurality of users coexist in each genre, each thread, or each branch, it can be considered that communication is established between the plurality of users. In addition, in all the cases described above, a threshold can be provided for the number of established communications with other users, and the case where the threshold is exceeded can be counted as established communications.

さらに、式1により特定された上位ユーザグループにおいて、コミュニケーション履歴情報500aから、所定値以上の回数の発信および/または受信612bを行ったジャンル/スレッドID604aの数が所定値以上のユーザの中で、返信を受けたユーザ数が最も多いユーザを最重要ユーザ、また、返信を受けたユーザ数が多い順に上位から所定人数以内もしくは所定の割合以内、または所定値以上のユーザを重要ユーザグループとする。また、上位ユーザグループにおいて、コミュニケーション履歴情報500aから、ある特定のジャンル/スレッドIDに対して、送信および/または受信を行ったユーザ数が最も多いユーザを特定最重要ユーザ、また、当該送信および/または受信を行ったユーザ数が多い順に上位から所定人数以内もしくは所定の割合以内、または所定値以上のユーザを特定重要ユーザグループとする。   Furthermore, in the upper user group specified by Expression 1, from the communication history information 500a, among the users whose number of genre / thread IDs 604a that have made and / or received 612b a number of times greater than or equal to a predetermined value, A user having the largest number of users who have received a reply is designated as the most important user, and a user within a predetermined number or a predetermined ratio from the top in the descending order of the number of users who have received a reply, or a user having a predetermined value or more as an important user group. In the upper user group, the user having the largest number of users who have transmitted and / or received for a specific genre / thread ID from the communication history information 500a is identified as the most important user, and the transmission and / or Alternatively, a user within a predetermined number or within a predetermined ratio from the top, or a user having a predetermined value or more is set as a specific important user group in descending order of the number of received users.

上位ユーザグループにおいて、上記の重要ユーザグループ(最重要ユーザを含む)および特定重要ユーザグループ(特定最重要ユーザを含む)を除き、コミュニケーション履歴情報500aから、所定値以上の回数の送信および/または受信を行ったジャンル/スレッドIDの数が所定値以上であり、当該所定値以上の送信および/または受信を行ったジャンル/スレッドIDにおける送信および/または受信の数が多い順に上位から所定人数以内もしくは所定の割合以内、または所定値以上のユーザを準重要ユーザグループとして抽出する。   In the upper user group, except for the important user group (including the most important user) and the specific important user group (including the specified most important user), transmission and / or reception of the number of times greater than or equal to a predetermined value from the communication history information 500a. The number of genres / thread IDs that have been transmitted is equal to or greater than a predetermined value, and within a predetermined number of people from the top in descending order of the number of transmissions and / or receptions in the genre / thread ID that has performed transmission and / or reception greater than the predetermined value, or Users within a predetermined ratio or more than a predetermined value are extracted as quasi-important user groups.

また、コミュニケーション履歴情報500aから、初心者ユーザが所定の回数までに行った返信を受けたユーザであって、当該返信を受けたユーザ数が最も多いユーザをきっかけ提供ユーザ、また、当該返信を受けたユーザ数が多い順に上位から所定人数以内もしくは所定の割合以内、または所定値以上のユーザをきっかけ提供ユーザグループとして抽出する。さらに、コミュニケーション履歴情報500aから、二つ以上のジャンル、スレッドまたはブランチに返信を行った初心者ユーザについて、当該初心者ユーザによる最初の返信に対する返信の数が多い順に上位から所定人数以内もしくは所定の割合以内、または所定値以上のユーザをフォローユーザグループとする。   In addition, a user who has received a reply from the communication history information 500a up to a predetermined number of times and who has received the largest number of users who have received the reply has received the reply. Users with a predetermined number of users or within a predetermined ratio from the top in the descending order of the number of users, or users with a predetermined value or more are extracted as a provision user group. Furthermore, for a novice user who has replied to two or more genres, threads or branches from the communication history information 500a, within a predetermined number or within a predetermined ratio from the top in descending order of the number of replies to the initial reply by the novice user Or, a user having a predetermined value or more is set as a follow user group.

また、初心者ユーザグループおよび上位ユーザグループ以外のユーザにおいて、上記重要ユーザグループ、特定重要ユーザグループ、準重要ユーザグループ、きっかけ提供ユーザグループ、フォローユーザグループそれぞれの条件に合致するユーザ特性の類似したユーザをそれぞれの類似ユーザグループとして抽出する(処理14)。また、コミュニケーション履歴情報500aから、各ユーザ間のコミュニケーションの成立した回数を集計して各ユーザ間のつながり度合いを抽出する(処理15)。この各ユーザ間のつながり度合いは、ジャンル単位、スレッド単位またはブランチ単位である特定のユーザと共存した回数に基づいて、集計することもできる。情報抽出部は、上述したユーザ特性、つながり度合いをコミュニケーション情報通知部14に通知する(処理16)。このような処理により、ユーザ特性、ユーザ特性の類似、つながり度合いを抽出することができる。   Moreover, in users other than the beginner user group and the upper user group, users having similar user characteristics that match the conditions of the important user group, the specific important user group, the semi-important user group, the opportunity providing user group, and the follow user group are selected. It extracts as each similar user group (process 14). Further, the communication history information 500a is used to count the number of established communications between the users and extract the degree of connection between the users (process 15). The degree of connection between the users can also be totaled based on the number of times of coexistence with a specific user in genre units, thread units, or branch units. The information extraction unit notifies the communication information notification unit 14 of the above-described user characteristics and connection degree (process 16). Through such processing, user characteristics, similarity of user characteristics, and degree of connection can be extracted.

また、本発明の一実施形態によれば、ある期間を設定して、その期間内において上記のユーザ特性、ユーザ特性の類似、つながり度合いを抽出することもできる。例えば、過去のある期間におけるユーザの諸特性を抽出することもできるし、現在を基準に過去1週間、過去1月、過去半年、過去1年といった期間を設定することもできる。これによって、ユーザ特性の時間的変化を検討することができる。   In addition, according to an embodiment of the present invention, it is possible to set a certain period and extract the user characteristics, the similarity of user characteristics, and the degree of connection within the period. For example, it is possible to extract various characteristics of the user in a certain past period, or to set periods such as the past week, the past January, the past half year, and the past year based on the present. Thereby, the temporal change of the user characteristics can be examined.

さらに、本発明の一実施形態によれば、コミュニケーション履歴情報500aから、被閲覧数が最も多いユーザを被閲覧数最上位ユーザ、被閲覧数が最も高い値を基準として、所定の差分内に含まれるユーザを被閲覧数上位ユーザグループとすることができる。また、本発明の一実施形態によれば、コミュニケーション種別として、投票を追加し、投票による評価値が最も高かったユーザを投票最上位ユーザ、投票による評価値が最も高い値を基準として、所定の差分内に含まれるユーザを投票上位ユーザグループとすることができる。   Furthermore, according to an embodiment of the present invention, the communication history information 500a includes a user with the largest number of browses within a predetermined difference with reference to the highest number of browsed users and the value with the highest number of browses. The users who are to be viewed can be set as the upper-viewed user group. Further, according to an embodiment of the present invention, as a communication type, a vote is added, a user who has the highest evaluation value by voting is the highest voting user, and a value having the highest evaluation value by voting is used as a reference. Users included in the difference can be set as a voting upper user group.

本発明の原理を適用できる多くの可能な実施形態に鑑みて、図面との関係でここに記載する実施形態および実施例は、単に説明のために過ぎず、本発明の範囲を限定するものとして解釈すべきでないことを認識されたい。たとえば、当業者には理解されるように、ここに例示した実施形態は本発明の精神から逸脱することなく構成と詳細を変更することができる。さらに、説明のためのステップは、本発明から逸脱することなく変更、補足、および/または順序を変えてもよい。したがって、本明細書に記載する本発明は、添付の特許請求の範囲およびその均等物に該当するそのようなすべての実施形態が企図されている。   In view of the many possible embodiments to which the principles of the present invention may be applied, the embodiments and examples described herein in connection with the drawings are merely illustrative and are intended to limit the scope of the invention. It should be recognized that it should not be interpreted. For example, as will be appreciated by those skilled in the art, the embodiments illustrated herein may be modified in configuration and detail without departing from the spirit of the invention. Moreover, the illustrative steps may be changed, supplemented, and / or reordered without departing from the invention. Accordingly, the invention described herein is contemplated by all such embodiments that fall within the scope of the appended claims and their equivalents.

本発明による情報抽出方法の一実施例における全体構成を示す機能ブロック図である。It is a functional block diagram which shows the whole structure in one Example of the information extraction method by this invention. 本発明による例示的なユーザ情報のデータ構造を示す図であり、(a)は掲示板、チャット、またはブログの場合の図であり、(b)はメーリングリストの場合の図である。It is a figure which shows the data structure of the exemplary user information by this invention, (a) is a figure in the case of a bulletin board, a chat, or a blog, (b) is a figure in the case of a mailing list. 本発明による例示的なコミュニケーション情報のデータ構造を示す図であり、(a)は掲示板、チャット、またはブログの場合の図であり、(b)はメーリングリストの場合の図である。2A and 2B are diagrams illustrating a data structure of exemplary communication information according to the present invention, in which FIG. 1A is a diagram for a bulletin board, chat, or blog, and FIG. 2B is a diagram for a mailing list. 本発明による例示的な抽出ユーザ情報のデータ構造を示す図であり、(a)は掲示板、チャット、またはブログの場合の図であり、(b)はメーリングリストの場合の図である。It is a figure which shows the data structure of the example extraction user information by this invention, (a) is a figure in the case of a bulletin board, a chat, or a blog, (b) is a figure in the case of a mailing list. 本発明による例示的なコミュニケーション履歴情報のデータ構造を示す図であり、(a)は掲示板、チャット、またはブログの場合の図であり、(b)はメーリングリストの場合の図である。It is a figure which shows the data structure of the exemplary communication history information by this invention, (a) is a figure in the case of a bulletin board, a chat, or a blog, (b) is a figure in the case of a mailing list. 本発明による例示的な情報抽出用パラメータのデータ構造を示す図であり、(a)は掲示板、チャット、またはブログの場合の図であり、(b)はメーリングリストの場合の図である。It is a figure which shows the data structure of the parameter for an exemplary information extraction by this invention, (a) is a figure in the case of a bulletin board, a chat, or a blog, (b) is a figure in the case of a mailing list. 本発明による一実施例においてコミュニケーションイベントの発生から各種情報を格納するまでの処理の流れを示す図である。It is a figure which shows the flow of a process from generation | occurrence | production of a communication event to storing various information in one Example by this invention. 本発明による一実施例において格納された図7の各種情報から所定の情報を抽出するまでの処理の流れを示す図である。It is a figure which shows the flow of a process until it extracts predetermined information from the various information of FIG. 7 stored in one Example by this invention. コミュニケーション提供装置における3つのブランチを有するツリー状のスレッド例を示す図である。It is a figure which shows the example of a tree-like thread | sled which has three branches in a communication provision apparatus.

符号の説明Explanation of symbols

10 コミュニケーション提供装置
12 コミュニケーション制御部
14 コミュニケーション情報通知部
16 ユーザ情報データベース
18 コミュニケーション情報データベース
20 情報抽出装置
22 履歴情報収集部
24 情報抽出部
25 抽出ユーザ情報データベース
27 コミュニケーション履歴情報データベース
29 情報抽出用パラメータデータベース
30 ネットワーク
40a、40b、40n ユーザ端末
42a、42b、42n 送受信部
100 スレッド
102、104 分岐点
DESCRIPTION OF SYMBOLS 10 Communication provision apparatus 12 Communication control part 14 Communication information notification part 16 User information database 18 Communication information database 20 Information extraction apparatus 22 History information collection part 24 Information extraction part 25 Extraction user information database 27 Communication history information database 29 Parameter database for information extraction 30 Network 40a, 40b, 40n User terminal 42a, 42b, 42n Transceiver 100 Thread 102, 104 Branch point

Claims (15)

ネットワークを介してユーザ間のコミュニケーションを提供するコミュニケーション提供装置において、前記コミュニケーション提供装置に登録されたユーザ情報と、前記ユーザ間のコミュニケーションの履歴情報からユーザの特性を抽出する情報抽出装置における情報抽出方法であって、前記情報抽出装置は、
前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、コミュニケーションの成立した相異なるユーザ数を次数として求めるステップと、
前記次数が所定の基準を満たすユーザを上位ユーザグループとして抽出するステップと
を備えることを特徴とする情報抽出方法。
An information extracting method in an information extracting device for extracting user characteristics from user information registered in the communication providing device and history information of communication between the users in a communication providing device for providing communication between users via a network And the information extraction device comprises:
Obtaining the number of different users with whom communication has been established as an order based on at least one of the user information and the history information of the communication;
Extracting the users whose orders satisfy a predetermined criterion as a higher-level user group.
前記情報抽出装置は、前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、前記コミュニケーションの次数が所定の基準を満たすジャンルの数が所定数以上あり、かつ返信を受けたユーザ数が所定の基準を満たすユーザを重要ユーザグループとして抽出するステップを備えることを特徴とする請求項1に記載の情報抽出方法。   The information extracting device has a number of genres in which the order of the communication satisfies a predetermined criterion based on at least one of the user information and the communication history information, and the number of users who have received a reply is The information extracting method according to claim 1, further comprising: extracting a user satisfying a predetermined criterion as an important user group. 前記情報抽出装置は、前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、ある特定のジャンルにおける前記コミュニケーションの次数が所定の基準を満たすユーザをジャンル別上位ユーザグループとして抽出するステップを備えることを特徴とする請求項1に記載の情報抽出方法。   The information extraction device extracts, as a higher-level user group by genre, users who satisfy the predetermined standard for the order of the communication in a specific genre based on at least one of the user information and the communication history information. The information extraction method according to claim 1, further comprising: ネットワークを介してユーザ間のコミュニケーションを提供するコミュニケーション提供装置において、前記コミュニケーション提供装置に登録されたユーザ情報と、前記ユーザ間のコミュニケーションの履歴情報からユーザの特性を抽出する情報抽出装置における情報抽出方法であって、前記情報抽出装置は、
前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、所定の基準を満たないユーザを初心者ユーザグループとして抽出するステップ
を備えることを特徴とする記載の情報抽出方法。
An information extracting method in an information extracting device for extracting user characteristics from user information registered in the communication providing device and history information of communication between the users in a communication providing device for providing communication between users via a network And the information extraction device comprises:
The information extracting method according to claim 1, further comprising: extracting a user who does not satisfy a predetermined criterion as a beginner user group based on at least one of the user information and the communication history information.
前記情報抽出装置は、前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、前記初心者ユーザグループのユーザから返信を受けたユーザ数が所定の基準を満たすユーザをきっかけ提供ユーザグループとして抽出するステップを備えることを特徴とする請求項4に記載の情報抽出装置。   The information extraction device extracts, as a trigger providing user group, a user whose number of users who have received a reply from the user of the beginner user group satisfies a predetermined criterion based on at least one of the user information and the communication history information The information extracting apparatus according to claim 4, further comprising a step of: 前記情報抽出装置は、前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、前記初心者ユーザグループのユーザの返信に対して返信を行ったユーザ数が所定の基準を満たすユーザをフォローユーザグループとして抽出するステップを備えることを特徴とする請求項4に記載の情報抽出方法。   The information extraction device is a user who follows a user whose number of users who have replied to a reply from a user in the beginner user group satisfies a predetermined criterion based on at least one of the user information and the history information of the communication The information extracting method according to claim 4, further comprising a step of extracting as a group. ネットワークを介してユーザ間のコミュニケーションを提供するコミュニケーション提供装置において、前記コミュニケーション提供装置に登録されたユーザ情報と、前記ユーザ間のコミュニケーションの履歴情報からユーザの特性を抽出する情報抽出装置における情報抽出方法であって、前記情報抽出装置は、
前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、各ユーザ間について、コミュニケーションの成立した回数を計数することにより、各ユーザ間のつながり度合いを抽出するステップ
を備えることを特徴とする情報抽出方法。
An information extracting method in an information extracting device for extracting user characteristics from user information registered in the communication providing device and history information of communication between the users in a communication providing device for providing communication between users via a network And the information extraction device comprises:
Extracting the degree of connection between users by counting the number of times communication has been established for each user based on at least one of the user information and the communication history information. Information extraction method.
ネットワークを介してユーザ間のコミュニケーションを提供するコミュニケーション提供装置において、前記コミュニケーション提供装置に登録されたユーザ情報と、前記ユーザ間のコミュニケーションの履歴情報からユーザの特性を抽出する情報抽出装置における情報抽出方法であって、前記情報抽出装置は、
前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、各ユーザ間について、各ユーザの組が各ジャンル、各スレッド、または各ブランチにおいて共存した回数を計数することにより、各ユーザ間のつながり度合いを抽出するステップ
を備えることを特徴とする情報抽出方法。
An information extracting method in an information extracting device for extracting user characteristics from user information registered in the communication providing device and history information of communication between the users in a communication providing device for providing communication between users via a network And the information extraction device comprises:
Based on at least one of the user information and the communication history information, for each user, by counting the number of times each set of users coexisted in each genre, each thread, or each branch, between each user An information extraction method comprising a step of extracting a degree of connection.
ネットワークを介してユーザ間のコミュニケーションを提供するコミュニケーション提供装置において、前記コミュニケーション提供装置に登録されたユーザ情報と、前記ユーザ間のコミュニケーションの履歴情報からユーザの特性を抽出する情報抽出装置における情報抽出方法であって、前記情報抽出装置は、
前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、各ユーザのメッセージについて、他のユーザから閲覧されたユーザ数が所定の基準を満たすユーザを被閲覧数上位ユーザグループとして抽出するステップ
を備えることを特徴とする情報抽出方法。
An information extracting method in an information extracting device for extracting user characteristics from user information registered in the communication providing device and history information of communication between the users in a communication providing device for providing communication between users via a network And the information extraction device comprises:
A step of extracting, as a higher-viewed-number user group, a user whose number of users viewed from other users satisfies a predetermined criterion for each user's message based on at least one of the user information and the communication history information An information extraction method comprising:
ネットワークを介してユーザ間のコミュニケーションを提供するコミュニケーション提供装置において、前記コミュニケーション提供装置に登録されたユーザ情報と、前記ユーザ間のコミュニケーションの履歴情報からユーザの特性を抽出する情報抽出装置における情報抽出方法であって、前記情報抽出装置は、
前記ユーザ情報および前記コミュニケーションの履歴情報の少なくとも1つに基づいて、各ユーザのメッセージについて、他のユーザから投票された評点が所定の基準を満たすユーザを評点上位ユーザグループとして抽出するステップ
をさらに備えることを特徴とする情報抽出方法。
An information extracting method in an information extracting device for extracting user characteristics from user information registered in the communication providing device and history information of communication between the users in a communication providing device for providing communication between users via a network And the information extraction device comprises:
Based on at least one of the user information and the history information of the communication, a step of extracting, as a higher-ranking user group, a user whose score voted by another user satisfies a predetermined criterion for each user's message An information extraction method characterized by that.
前記情報抽出装置において、前記次数は、前記コミュニケーションの成立した相異なるユーザ数と、前記コミュニケーションの履歴情報において抽出の対象となるユーザの総数との割合に基づくことを特徴とする請求項1乃至3に記載の情報抽出方法。   4. The information extraction apparatus according to claim 1, wherein the order is based on a ratio between a number of different users who have established the communication and a total number of users to be extracted in the history information of the communication. Information extraction method described in 1. 前記情報抽出装置において、前記コミュニケーションの成立は、第1のユーザの第1のメッセージに対して、第2のユーザが第2のメッセージを返信し、前記第1のユーザが前記第2のメッセージに対して第3のメッセージを返信したときに、前記第1および前記第2のユーザ間で達成されることを特徴とする請求項1乃至3、7又は11に記載の情報抽出方法。   In the information extraction device, the establishment of the communication is performed by a second user returning a second message to the first message of the first user, and the first user responding to the second message. The information extraction method according to claim 1, wherein the information extraction method is achieved between the first and second users when a third message is returned to the user. 前記情報抽出装置において、前記コミュニケーションの成立は、各ジャンル、各スレッド、または各ブランチ内における第1のユーザの複数のメッセージの間に1人または複数のユーザが存在する場合、前記第1のユーザと前記1人または複数のユーザとの間で達成されることを特徴とする請求項1乃至3、7又は11に記載の情報抽出方法。   In the information extracting apparatus, the communication is established when the one or more users exist between the messages of the first user in each genre, each thread, or each branch. The information extraction method according to claim 1, wherein the information extraction method is performed between the user and the one or more users. 前記抽出装置において、所定の期間の前記ユーザ情報または前記コミュニケーションの履歴情報に基づくことを特徴とする請求項1乃至13に記載の情報抽出方法。   14. The information extracting method according to claim 1, wherein the extracting device is based on the user information or the communication history information for a predetermined period. ネットワークを介してユーザ間のコミュニケーションを提供するコミュニケーション提供装置において、前記コミュニケーション提供装置に登録されたユーザ情報と、前記コミュニケーション提供装置によって提供されたコミュニケーションの内容からユーザの特性を抽出する情報抽出装置であって、
前記ユーザ情報から所定のユーザ情報を抽出し、
前記コミュニケーションの内容から所定の履歴情報を抽出し、
前記コミュニケーションの内容から所定のパラメータ情報を集計する
履歴情報収集部と、
前記履歴情報収集部によって抽出された前記所定のユーザ情報が格納された抽出ユーザ情報データベースと、
前記履歴情報収集部によって抽出された前記所定の履歴情報が格納されたコミュニケーション履歴情報データベースと、
前記履歴情報収集部によって集計された前記所定のパラメータ情報が格納された情報抽出用パラメータデータベースと、
前記抽出ユーザ情報データベースおよび前記情報抽出用パラメータデータベースの所定の情報の少なくとも1つが所定の基準に満たしていないユーザを初心者ユーザグループとして抽出し、
前記コミュニケーション履歴情報データベースの情報からこれまでにコミュニケーションを行ったことのあるユーザ数が所定の基準を満たしているユーザを上位ユーザグループとして抽出する
情報抽出部と
を備えたことを特徴とする情報抽出装置。
A communication providing apparatus for providing communication between users via a network, wherein the information extracting apparatus extracts user characteristics from user information registered in the communication providing apparatus and communication contents provided by the communication providing apparatus. There,
Extracting predetermined user information from the user information;
Extracting predetermined history information from the content of the communication,
A history information collection unit that aggregates predetermined parameter information from the content of the communication;
An extracted user information database in which the predetermined user information extracted by the history information collection unit is stored;
A communication history information database in which the predetermined history information extracted by the history information collection unit is stored;
An information extraction parameter database in which the predetermined parameter information tabulated by the history information collection unit is stored;
Extracting a user whose predetermined information in the extracted user information database and the information extraction parameter database does not satisfy a predetermined standard as a beginner user group,
An information extraction unit comprising: an information extraction unit that extracts, as upper user groups, users whose number of users who have communicated so far from information in the communication history information database satisfies a predetermined standard apparatus.
JP2004046850A 2004-02-23 2004-02-23 Information extracting method and device Pending JP2005235118A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004046850A JP2005235118A (en) 2004-02-23 2004-02-23 Information extracting method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004046850A JP2005235118A (en) 2004-02-23 2004-02-23 Information extracting method and device

Publications (1)

Publication Number Publication Date
JP2005235118A true JP2005235118A (en) 2005-09-02

Family

ID=35017990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004046850A Pending JP2005235118A (en) 2004-02-23 2004-02-23 Information extracting method and device

Country Status (1)

Country Link
JP (1) JP2005235118A (en)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200312A (en) * 2006-01-27 2007-08-09 Internatl Business Mach Corp <Ibm> Computer implemented method, device and computer readable memory (system and method for managing instant messaging conversation)
JP2007334591A (en) * 2006-06-14 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> Blog profile extraction method, device, and program
JP2008305258A (en) * 2007-06-08 2008-12-18 Nec Mobiling Ltd Evaluation method for user, user evaluation system and program
JP2009530722A (en) * 2006-03-16 2009-08-27 デイリーミー,インコーポレイテッド Customized news abstract creation method and system
JP2010128849A (en) * 2008-11-28 2010-06-10 Equos Research Co Ltd Information system
JP2010238113A (en) * 2009-03-31 2010-10-21 Nippon Telegr & Teleph Corp <Ntt> Action meaning decision device and program
WO2011077501A1 (en) * 2009-12-26 2011-06-30 株式会社ラピースドリーム Communication system
JP2011165021A (en) * 2010-02-12 2011-08-25 Fujitsu Ltd Chat monitoring apparatus, chat monitoring method, and program
JP2011253530A (en) * 2010-05-31 2011-12-15 Nielsen Co (Us) Llc Method, equipment, and product for ranking user in online social network
KR101222725B1 (en) 2010-06-30 2013-01-15 삼성에스디에스 주식회사 Apparatus and Method for Providing Human Network Information
JP2013084253A (en) * 2011-10-11 2013-05-09 Tata Consultancy Services Ltd Content quality and user contract of social platform
JP2013089086A (en) * 2011-10-19 2013-05-13 Nippon Telegr & Teleph Corp <Ntt> Topic recommendation device, method and program

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200312A (en) * 2006-01-27 2007-08-09 Internatl Business Mach Corp <Ibm> Computer implemented method, device and computer readable memory (system and method for managing instant messaging conversation)
JP2009530722A (en) * 2006-03-16 2009-08-27 デイリーミー,インコーポレイテッド Customized news abstract creation method and system
JP4698495B2 (en) * 2006-06-14 2011-06-08 日本電信電話株式会社 Blog profile extraction method, apparatus, and program
JP2007334591A (en) * 2006-06-14 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> Blog profile extraction method, device, and program
JP2008305258A (en) * 2007-06-08 2008-12-18 Nec Mobiling Ltd Evaluation method for user, user evaluation system and program
JP2010128849A (en) * 2008-11-28 2010-06-10 Equos Research Co Ltd Information system
JP2010238113A (en) * 2009-03-31 2010-10-21 Nippon Telegr & Teleph Corp <Ntt> Action meaning decision device and program
WO2011077501A1 (en) * 2009-12-26 2011-06-30 株式会社ラピースドリーム Communication system
JPWO2011077501A1 (en) * 2009-12-26 2013-05-02 株式会社ラピースドリーム Communication system
JP2011165021A (en) * 2010-02-12 2011-08-25 Fujitsu Ltd Chat monitoring apparatus, chat monitoring method, and program
JP2011253530A (en) * 2010-05-31 2011-12-15 Nielsen Co (Us) Llc Method, equipment, and product for ranking user in online social network
US9455891B2 (en) 2010-05-31 2016-09-27 The Nielsen Company (Us), Llc Methods, apparatus, and articles of manufacture to determine a network efficacy
KR101222725B1 (en) 2010-06-30 2013-01-15 삼성에스디에스 주식회사 Apparatus and Method for Providing Human Network Information
JP2013084253A (en) * 2011-10-11 2013-05-09 Tata Consultancy Services Ltd Content quality and user contract of social platform
JP2013089086A (en) * 2011-10-19 2013-05-13 Nippon Telegr & Teleph Corp <Ntt> Topic recommendation device, method and program

Similar Documents

Publication Publication Date Title
US11301537B1 (en) Methods and systems for providing a document
US10949429B1 (en) Scoring authors of posts
US10511652B2 (en) Recommending posts to non-subscribing users
US10133789B2 (en) Real-time trend detection in a social network
CA2603042C (en) Methods and systems for member-created advertisement in a member network
Crymble An analysis of Twitter and Facebook use by the archival community
Patwardhan et al. Internet dependency relations and online consumer behavior: a media system dependency theory perspective on why people shop, chat, and read news online
US7783592B2 (en) Indicating recent content publication activity by a user
Neumann et al. Semantic social network portal for collaborative online communities
US8060405B1 (en) Methods and systems for correlating connections between users and links between articles
Schaefer Motivations and usage patterns on social network sites
US8762405B2 (en) Search behavior based communication forums
US20180013800A1 (en) Systems and methods for enabling dialog amongst different participant groups with post-level qualifiers
Lafferman Do Facebook and Twitter Make You a Public Figure?: How to Apply the Gertz Public Figure Doctrine to Social Media
JP2005235118A (en) Information extracting method and device
Gervais et al. New media for the new electorate? Congressional outreach to Latinos on Twitter
Carroll et al. Social and Civic Participation in a Community Network.
JP2005515521A (en) Intelligent online community automated growth method, system and software
US10402457B1 (en) Methods and systems for correlating connections between users and links between articles
Hilt et al. Internet and New Media
Sarkar et al. What Does Privacy on Facebook Mean to Jamia Students?