JP5509131B2 - Contributor identification method, server, and program for associating user's post with user's subscriber identifier - Google Patents
Contributor identification method, server, and program for associating user's post with user's subscriber identifier Download PDFInfo
- Publication number
- JP5509131B2 JP5509131B2 JP2011072180A JP2011072180A JP5509131B2 JP 5509131 B2 JP5509131 B2 JP 5509131B2 JP 2011072180 A JP2011072180 A JP 2011072180A JP 2011072180 A JP2011072180 A JP 2011072180A JP 5509131 B2 JP5509131 B2 JP 5509131B2
- Authority
- JP
- Japan
- Prior art keywords
- account
- server
- url
- blog site
- image file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 16
- 238000004891 communication Methods 0.000 claims description 36
- 230000006855 networking Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、ユーザ操作に基づく端末と、そのユーザの投稿文を公開するブログサイトサーバとが、ネットワークを介して接続されたシステムの技術に関する。 The present invention relates to a technology of a system in which a terminal based on a user operation and a blog site server that publishes a posted message of the user are connected via a network.
端末からサーバへのアクセス履歴情報を取得することによって、当該端末を操作するユーザの興味の動向を知ることでき、マーケティング活動に役立てることができる。特に、ユーザ毎に、最適な広告情報やレコメンド情報を提供することができる。 By acquiring access history information from the terminal to the server, it is possible to know the trend of interest of the user who operates the terminal, which can be used for marketing activities. In particular, optimal advertisement information and recommendation information can be provided for each user.
従来、CGI(Common Gateway Interface)を提供するWebサーバは、クライアント端末で起動するWebブラウザからの要求に基づいて、アクセス履歴情報を蓄積することができる。しかしながら、この技術によれば、ページにアクセスする端末を特定することまではできず、その端末を操作するユーザを特定することもできない。 Conventionally, a Web server that provides a common gateway interface (CGI) can accumulate access history information based on a request from a Web browser activated on a client terminal. However, according to this technique, it is impossible to specify a terminal that accesses a page, and it is also impossible to specify a user who operates the terminal.
これに対し、情報蓄積サイトサーバと予め契約した端末について、その端末のアクセス履歴情報を自動的に情報蓄積サイトサーバが収集し管理する技術がある(例えば特許文献1参照)。また、端末から様々な媒体への異なるアクセス履歴情報を、所定条件に基づいて一括管理する技術もある(例えば特許文献2参照)。 On the other hand, there is a technique in which an information storage site server automatically collects and manages access history information of a terminal that has previously contracted with the information storage site server (see, for example, Patent Document 1). There is also a technique for collectively managing different access history information from a terminal to various media based on a predetermined condition (see, for example, Patent Document 2).
一方で、近年、インターネットを介して、ブログ(Web log)やミニブログ(mini Web log)(例えばtwitter(登録商標))のようなサイトに対して、不特定多数の第三者からの投稿文が、活発に発信されている。これらの投稿文には、ユーザの感情表現や消費動向が現れ始めており、大量の投稿文に対する分析が注目されている。これら投稿文には、ユーザを特定するアカウントが付与されており、ユーザの固有性が確保されている。但し、そのユーザのプロファイルは取得できるものの、そのユーザ自身を特定することまではできない。 On the other hand, in recent years, postings from a large number of unspecified third parties to sites such as blogs (Web log) and mini blogs (for example, twitter (registered trademark)) via the Internet. However, it is actively transmitted. The user's emotional expressions and consumption trends are beginning to appear in these posted sentences, and analysis of a large number of posted sentences is attracting attention. These postings are given an account for identifying the user, and the uniqueness of the user is ensured. However, although the user's profile can be acquired, the user cannot be specified.
また、ブログサイトに対して投稿文を送信する端末は、パーソナルコンピュータに限られず、携帯電話機やスマートフォンであってもよい。このような携帯端末は、例えば携帯電話網のような広域通信事業者網を介して、ブログサイトサーバと通信することができる。このように、広域通信事業者網に接続する端末には、そのユーザを特定するユーザ識別子(ID:IDentifier)が付与されている。 Further, the terminal that transmits the posted text to the blog site is not limited to a personal computer, and may be a mobile phone or a smartphone. Such a mobile terminal can communicate with the blog site server via a wide area communication carrier network such as a mobile phone network. Thus, a user identifier (ID: IDentifier) that identifies the user is assigned to a terminal connected to the wide area network.
通信事業者としては、端末からブログサイトサーバへ投稿文を送信したユーザを、特定したいとする要求もある。通信事業者は、端末の加入者IDを取得すると共に、その投稿文の内容を分析することによって、そのユーザが所望するサービスを、そのユーザのみに直接的に提供することができる。 There is also a request for a communication carrier to specify a user who has sent a posted message from a terminal to a blog site server. The telecommunications carrier can provide the service desired by the user directly only to the user by acquiring the subscriber ID of the terminal and analyzing the content of the posted text.
一般に、端末からブログサイトサーバへアクセスするURL(Uniform Resource Locator)には、ユーザのアカウントが含まれる。しかしながら、その通信内容を秘匿するべく、ユーザ情報及びアクセス内容を指定する情報部分は、一般的に暗号化されている。そのために、アクセス履歴のURLから、ブログサイトサーバにおけるアカウントやアクセスページを知ることはできない。また、ブログサイトサーバへアクセスするアプリケーションによっては、URLの表現記述が異なり、全てのブログサイトサーバのURLの記述が一意に表現されることはない。 In general, a URL (Uniform Resource Locator) for accessing a blog site server from a terminal includes a user account. However, in order to conceal the communication contents, the information part for specifying user information and access contents is generally encrypted. Therefore, the account and access page in the blog site server cannot be known from the URL of the access history. Also, depending on the application that accesses the blog site server, the URL expression description differs, and the URL descriptions of all blog site servers are not uniquely expressed.
結果として、通信事業者としては、端末の加入者IDと、ブログサイトサーバへアクセスしたURLとは取得できるが、そのブログサイトサーバにおけるユーザのアカウントやアクセスページを特定することまではできない。即ち、通信事業者であっても、ブログサイトサーバにおける投稿文の分析結果と、端末からのアクセス履歴情報とを関連付けることはできない。 As a result, the telecommunications carrier can acquire the subscriber ID of the terminal and the URL accessed to the blog site server, but cannot specify the user account or access page in the blog site server. That is, even a telecommunications carrier cannot associate the analysis result of the posted text on the blog site server with the access history information from the terminal.
そこで、本発明は、ブログサイトサーバに投稿された投稿文と、ユーザ操作に基づく端末からのアクセス履歴に基づく加入者識別子とを関連付ける(同定する)ことができる投稿者識別方法、サーバ及びプログラムを提供することを目的とする。 Therefore, the present invention provides a poster identification method, server, and program capable of associating (identifying) a posted message posted on a blog site server and a subscriber identifier based on an access history from a terminal based on a user operation. The purpose is to provide.
本発明によれば、投稿文とその投稿者のアカウントとを公開するブログサイトサーバと、加入者識別子を有する端末からブログサイトサーバへアクセスした多数のURLを収集する通信事業設備装置とを有するシステムにおける投稿者識別方法であって、
システムは、加入者識別子とアカウントとを関連付ける識別サーバを更に有し、
識別サーバが、
加入者識別子に対応付けられたURLを含むアクセス履歴情報を、通信事業設備装置から収集する第1のステップと、
アクセス履歴情報の中で、画像ファイル識別子を含む複数のURLを抽出する第2のステップと、
画像ファイル識別子を含む複数のURLの中で、出現回数が最も多いURLを選択し、そのURLに含まれる画像ファイル識別子を抽出する第3のステップと、
ブログサイトサーバから、画像ファイル識別子に対応する画像を含むページを検索し、そのページのアカウントを取得する第4のステップと、
抽出されたアカウントと、そのURLへアクセスした当該端末の加入者識別子とを関連付ける第5のステップと
を有することを特徴とする。
According to the present invention, a system having a blog site server that publishes a posted text and the account of the poster, and a communication business facility device that collects a large number of URLs accessed from a terminal having a subscriber identifier to the blog site server. A method for identifying posters in
The system further comprises an identification server that associates the subscriber identifier with the account;
The identification server
A first step of collecting access history information including a URL associated with a subscriber identifier from a communication business facility device;
A second step of extracting a plurality of URLs including image file identifiers in the access history information;
A third step of selecting a URL having the highest number of appearances from a plurality of URLs including an image file identifier and extracting an image file identifier included in the URL;
A fourth step of retrieving a page including an image corresponding to the image file identifier from the blog site server and acquiring an account of the page;
And a fifth step of associating the extracted account with the subscriber identifier of the terminal that has accessed the URL.
本発明の投稿者識別方法における他の実施形態によれば、画像ファイル識別子は、ブログサイトサーバのページにおける各ユーザを特定するアイコン画像に付与されたものであってもよい。 According to another embodiment of the contributor identification method of the present invention, the image file identifier may be given to an icon image that identifies each user on the page of the blog site server.
本発明の投稿者識別方法における他の実施形態によれば、ブログサイトサーバは、twitter(登録商標)のようなミニブログサイトサーバ、又は、SNS(Social Networking Service)サーバであってもよい。 According to another embodiment of the poster identification method of the present invention, the blog site server may be a mini blog site server such as twitter (registered trademark) or an SNS (Social Networking Service) server.
本発明の投稿者識別方法における他の実施形態によれば、識別サーバが、
ブログサイトサーバからアカウントに基づく投稿文を収集する第6のステップと、
収集された投稿文は、アカウントに関連付けられた当該加入者識別子に基づくユーザによって投稿されたものであると関連付ける第7のステップと
を更に有するものであってもよい。
According to another embodiment of the poster identification method of the present invention, the identification server
A sixth step of collecting posts based on accounts from the blog site server;
The collected posted text may further include a seventh step of associating with the post posted by the user based on the subscriber identifier associated with the account.
本発明によれば、投稿文とその投稿者のアカウントとを公開するブログサイトサーバと、加入者識別子を有する端末からブログサイトサーバへアクセスした多数のURLを収集する通信事業設備装置とに、ネットワークを介して接続された識別サーバであって、
識別サーバは、加入者識別子とアカウントとを関連付けるものであり、
加入者識別子に対応付けられたURLを含むアクセス履歴情報を、通信事業設備装置から収集するアクセス履歴収集手段と、
アクセス履歴情報の中で、画像ファイル識別子を含む複数のURLを抽出する第1のURL抽出手段と、
画像ファイル識別子を含む複数のURLの中で、出現回数が最も多いURLを選択し、そのURLに含まれる画像ファイル識別子を抽出する第2のURL抽出手段と、
ブログサイトサーバから、画像ファイル識別子に対応する画像を含むページを検索し、そのページのアカウントを取得するアカウント取得手段と、
抽出されたアカウントと、そのURLへアクセスした当該端末の加入者識別子とを関連付けるアカウント関連付け手段と
を有することを特徴とする。
According to the present invention, a network is connected to a blog site server that publishes posted text and the account of the poster, and a communication business facility device that collects a large number of URLs accessed from a terminal having a subscriber identifier to the blog site server. An identification server connected via
The identification server associates a subscriber identifier with an account,
Access history collection means for collecting access history information including a URL associated with a subscriber identifier from a communication business facility device;
First URL extracting means for extracting a plurality of URLs including image file identifiers in the access history information;
A second URL extracting means for selecting a URL having the highest appearance frequency from a plurality of URLs including an image file identifier and extracting an image file identifier included in the URL;
Account acquisition means for searching a page including an image corresponding to the image file identifier from the blog site server and acquiring an account of the page;
And an account associating means for associating the extracted account with the subscriber identifier of the terminal accessing the URL.
本発明の識別サーバにおける他の実施形態によれば、画像ファイル識別子は、ブログサイトサーバのユーザページにおける各ユーザを特定するアイコン画像に付与されたものであってもよい。 According to another embodiment of the identification server of the present invention, the image file identifier may be assigned to an icon image that identifies each user in the user page of the blog site server.
本発明の識別サーバにおける他の実施形態によれば、ブログサイトサーバは、twitter(登録商標)のようなミニブログサイトサーバ、又は、SNSサーバであってもよい。 According to another embodiment of the identification server of the present invention, the blog site server may be a mini blog site server such as twitter (registered trademark) or an SNS server.
本発明の識別サーバにおける他の実施形態によれば、
ブログサイトサーバからアカウントに基づく投稿文を収集する投稿文収集手段と、
収集された投稿文は、アカウントに関連付けられた当該加入者識別子に基づくユーザによって投稿されたものであると関連付ける投稿文関連付け手段と
を更に有するものであってもよい。
According to another embodiment of the identification server of the present invention,
Post message collection means for collecting post text based on the account from the blog site server,
The collected posted message may further include a posted message associating unit that associates with the posted message collected by the user based on the subscriber identifier associated with the account.
本発明によれば、投稿文とその投稿者のアカウントとを公開するブログサイトサーバと、加入者識別子を有する端末からブログサイトサーバへアクセスした多数のURLを収集する通信事業設備装置とに、ネットワークを介して接続された識別サーバに搭載されたコンピュータを機能させるプログラムであって、
識別サーバは、加入者識別子とアカウントとを関連付けるものであり、
加入者識別子に対応付けられたURLを含むアクセス履歴情報を、通信事業設備装置から収集するアクセス履歴収集手段と、
アクセス履歴情報の中で、画像ファイル識別子を含む複数のURLを抽出する第1のURL抽出手段と、
画像ファイル識別子を含む複数のURLの中で、出現回数が最も多いURLを選択し、そのURLに含まれる画像ファイル識別子を抽出する第2のURL抽出手段と、
ブログサイトサーバから、画像ファイル識別子に対応する画像を含むページを検索し、そのページのアカウントを取得するアカウント取得手段と、
抽出されたアカウントと、そのURLへアクセスした当該端末の加入者識別子とを関連付けるアカウント関連付け手段と
してコンピュータを機能させることを特徴とする。
According to the present invention, a network is connected to a blog site server that publishes posted text and the account of the poster, and a communication business facility device that collects a large number of URLs accessed from a terminal having a subscriber identifier to the blog site server. A program for operating a computer mounted on an identification server connected via
The identification server associates a subscriber identifier with an account,
Access history collection means for collecting access history information including a URL associated with a subscriber identifier from a communication business facility device;
First URL extracting means for extracting a plurality of URLs including image file identifiers in the access history information;
A second URL extracting means for selecting a URL having the highest appearance frequency from a plurality of URLs including an image file identifier and extracting an image file identifier included in the URL;
Account acquisition means for searching a page including an image corresponding to the image file identifier from the blog site server and acquiring an account of the page;
The computer is caused to function as an account association means for associating the extracted account with the subscriber identifier of the terminal that has accessed the URL.
本発明の投稿者識別方法、サーバ及びプログラムによれば、ブログサイトサーバに投稿された投稿文(定性的データ)と、ユーザ操作に基づく端末からのアクセス履歴(定量的データ)に基づく加入者識別子とを関連付けることができる。投稿文の内容を分析することによって、その加入者IDに基づくユーザが所望するサービスを、そのユーザのみに直接的に提供することができる。 According to the poster identification method, server, and program of the present invention, a subscriber identifier based on a posted sentence (qualitative data) posted on a blog site server and an access history (quantitative data) from a terminal based on a user operation. Can be associated. By analyzing the contents of the posted text, the service desired by the user based on the subscriber ID can be directly provided only to the user.
以下、本発明の実施の形態について、図面を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明におけるシステム構成図である。 FIG. 1 is a system configuration diagram according to the present invention.
図1のシステムによれば、端末2は、通信事業者網に接続し、インターネットを介して、ブログサイトサーバ3と通信することができる。端末2は、ユーザによって操作される例えば携帯電話機、スマートフォン又はパーソナルコンピュータであってもよい。ここで、各端末2は、通信事業者網に接続するための加入者識別子(ID:IDentifier)を有する。
According to the system shown in FIG. 1, the
また、通信事業者網には、通信事業設備装置4が配置されている。通信事業設備装置4は、端末2からブログサイトサーバへアクセスした多数のURLを収集する。また、通信事業設備装置4は、各端末2からの接続を、加入者IDによって認識する。これによって、通信事業設備装置4は、端末2の加入者IDと、アクセスされたURLとを対応付けた「アクセス履歴情報」を収集する。
In addition, a communication
ブログサイトサーバ3は、twitter(登録商標)のようなミニブログサイトサーバ、又は、SNSサーバである。ブログサイトサーバ3は、不特定多数の第三者からの投稿文を受信し、投稿文とその投稿者のアカウントとを公開する。投稿文には、投稿者を識別するアカウントが付与される。ブログサイトサーバ3は、API(Application Programming Interface)を公開しており、様々なサービスを提供する。
The
端末2は、ユーザ操作に基づいて、通信事業者網及びインターネットを介して、ブログサイトサーバ3のブログサイトを閲覧することができる。また、端末2は、ユーザ操作に基づく投稿文を、ブログサイトサーバ3へ送信することが。その投稿文は、ブログサイトサーバ3によって公開される。
The
図1のシステムによれば、識別サーバ1が、インターネットに更に接続されている。識別サーバ1は、ブログサイトサーバ3に送信されたユーザの投稿文と、その文を投稿したユーザの加入者IDと関連付けるものである。識別サーバ1は、通信事業者網に接続された通信事業設備装置4から、インターネットを介して、アクセス履歴情報を受信する。また、識別サーバ1は、ブログサイトサーバ3とインターネットを介して通信することができる。
According to the system of FIG. 1, the
図2は、本発明におけるシーケンス図である。 FIG. 2 is a sequence diagram in the present invention.
(S201)端末2は、ユーザ操作に基づいて通信事業者網に接続する。これによって、通信事業設備装置4は、その端末2の加入者IDを取得する。また、端末2は、ユーザ操作に基づいて、ブログサイトサーバ3のURLを指定してアクセスする。これによって、通信事業設備装置4は、端末2の加入者IDに対応付けて、当該端末2からアクセスされるURLを、アクセス履歴情報として蓄積する。
(S201) The
端末2が、ブログサイトサーバ3へ、ユーザ操作に基づく投稿文を送信する場合、その投稿文には、そのユーザのアカウントも付与される。ここで、通信事業設備装置4によって取得できるURLについて、ユーザ情報に係る情報部分は、一般的に、その通信内容を秘匿するべく暗号化されている。そのために、URLから、ブログサイトサーバ3におけるユーザのアカウントを取得することはできない。
When the
一方で、ブログサイトサーバ3がtwitterサーバである場合、当該ユーザ自身のユーザページは、ページを遷移をした際に常に上部に表示される。即ち、ユーザ自身が意識することなく、自らのユーザページにアクセスする回数が、他のページにアクセスする回数よりも多くなる。また、そのユーザページには、そのユーザのアカウントと、ユーザ自ら作成した固有のアイコン画像とが表示される。即ち、多くの投稿文を送信している端末2は、自らのユーザページに付加された情報、例えば自らを特定する画像に基づく画像ファイルIDにアクセスする回数が、多くなる。本発明は、端末からのアクセスに基づくこのような特性を利用したものである。
On the other hand, when the
例えばテキスト情報を連続的に発信する第三者がタイムラインに存在する場合、そのタイムラインは、その第三者のテキスト情報で埋め尽くされてしまう。この事例としては、例えば現実社会で生じてる状況を、中継者としての第三者が、リアルタイムにテキスト情報を発信するような場合がある。即ち、このような情報発信は、従来の通信や放送とは異なるものである。このような場合であっても、ユーザ自身のアカウント及びアイコンを含むユーザページは、ページが遷移された際であっても、常に上部(上の方の位置)に表示される。従って、ユーザ自身が意識することなく、自らのユーザページにアクセスする回数が、他のページにアクセスする回数よりも多くなる。 For example, when there is a third party who continuously transmits text information in the timeline, the timeline is filled with the text information of the third party. In this case, for example, there is a case where a third party as a relay person transmits text information in real time in a situation occurring in the real world. That is, such information transmission is different from conventional communication and broadcasting. Even in such a case, the user page including the user's own account and icon is always displayed at the top (upper position) even when the page is changed. Therefore, the number of times of accessing his / her user page without being aware of the user himself / herself is greater than the number of times of accessing other pages.
図3は、本発明におけるアクセス履歴情報である。 FIG. 3 shows access history information in the present invention.
図3のアクセス履歴情報によれば、加入者ID「12345678」のユーザが、「12時00分05秒」〜「12時05分32秒」までにアクセスしたURLが表されている。このURLからの明らかなとおり、ユーザ情報の部分は暗号化されている。また、末尾には、例えば「/98765432/photo.gif」のように画像ファイルIDが見える。 According to the access history information in FIG. 3, the URL accessed by the user with the subscriber ID “12345678” from “12:00:05” to “12:05:32” is represented. As is clear from this URL, the user information part is encrypted. At the end, the image file ID can be seen, for example, “/98765432/photo.gif”.
図4は、ミニブログの第1のタイムラインを表す説明図である。 FIG. 4 is an explanatory diagram showing a first timeline of a miniblog.
図4によれば、加入者ID「12345678」のユーザが、「12時00分」にアクセスしたURLのみが表されている。また、このときのミニブログのタイムラインも表されている。例えばtwitterの場合、アイコン画像と共に、投稿文が表示されている。ここでは、画像ファイルIDを含む4つのURLのタイムラインが表示されている。
http://twimobile.jp/img/・・・/98765432/photo.gif
http://twimobile.jp/img/・・・/13579246/shasin.gif
http://twimobile.jp/img/・・・/24680135/kaokao.gif
http://twimobile.jp/img/・・・/97531864/face.gif
According to FIG. 4, only the URL accessed by the user with the subscriber ID “12345678” at “12:00” is shown. The timeline of the miniblog at this time is also shown. For example, in the case of twitter, a posted text is displayed together with an icon image. Here, four URL timelines including the image file ID are displayed.
http://twimobile.jp/img/ ・ ・ ・ /98765432/photo.gif
http://twimobile.jp/img/ ・ ・ ・ /13579246/shasin.gif
http://twimobile.jp/img/ ・ ・ ・ /24680135/kaokao.gif
http://twimobile.jp/img/ ・ ・ ・ /97531864/face.gif
図5は、ミニブログの第2のタイムラインを表す説明図である。 FIG. 5 is an explanatory diagram showing a second timeline of the miniblog.
図5によれば、加入者ID「12345678」のユーザが、「12時05分」にアクセスしたURLのみが表されている。このときのミニブログのタイムラインが表されている。
http://twimobile.jp/img/・・・/98765432/photo.gif
http://twimobile.jp/img/・・・/75319864/photograph.gif
http://twimobile.jp/img/・・・/55330088/photo.gif
http://twimobile.jp/img/・・・/86420975/myicon.gif
According to FIG. 5, only the URL accessed by the user with the subscriber ID “12345678” at “12:05” is shown. The timeline of the miniblog at this time is shown.
http://twimobile.jp/img/ ・ ・ ・ /98765432/photo.gif
http://twimobile.jp/img/ ・ ・ ・ /75319864/photograph.gif
http://twimobile.jp/img/ ・ ・ ・ /55330088/photo.gif
http://twimobile.jp/img/ ・ ・ ・ /86420975/myicon.gif
(S202)識別サーバ1は、加入者IDに対応付けられたURLを含むアクセス履歴情報を、通信事業設備装置4から収集する。
(S202) The
(S203)識別サーバ1は、当該加入者IDに対して、アクセス履歴情報の中で、画像ファイル識別子(ID)を含む複数のURLを抽出する。ここで、例えばtwitterサーバにおける画像ファイルIDは、通常、ページに表示された各ユーザを特定するアイコン画像に付与されたものである。ここで、アイコン画像は、ユーザによって貼り付けて設定されるものであるので、固有性を有する。また、そのアイコン画像に付与される画像ファイルIDも、そのブログサイトサーバでは固有性を有する。
(S203) The
(S204)次に、識別サーバ1は、当該加入者IDに対して、画像ファイルIDを含む多数のURLの中で、出現回数が最も多いURLを選択する。即ち、当該加入者IDのユーザが、最も多くアクセスしてURLを選択する。そのURLは、当該加入者IDのユーザのページであると推定される。そして、そのURLに含まれる画像ファイルIDを抽出する。その画像ファイルIDに基づく画像は、ユーザのアイコン画像であると推定される。
(S204) Next, the
ここで、図4及び図5によれば、加入者ID「12345678」のユーザによってアクセスされたURLの中で、画像ファイルID「/98765432/photo.gif」を含むURLの出現回数が最も多いことが理解できる。 Here, according to FIGS. 4 and 5, the URL including the image file ID “/98765432/photo.gif” appears most frequently among the URLs accessed by the user with the subscriber ID “12345678”. Can understand.
尚、S204によれば、出現回数が最も多いURLが選択されるが、適切な比較的長期間で、出現回数をリセットすることも好ましい。ユーザのアイコン画像やアカウントは、可変される場合もあるからである。 Note that, according to S204, the URL with the highest number of appearances is selected, but it is also preferable to reset the number of appearances over an appropriate relatively long period of time. This is because the user's icon image and account may be variable.
(S205)識別サーバ1は、ブログサイトサーバ3へ、画像ファイルIDに対応する画像を含むユーザページを検索するための要求メッセージを送信する。図5によれば、画像ファイルID「/98765432/photo.gif」を含むページが検索される。
(S205) The
(S206)これに対し、ブログサイトサーバ3は、画像ファイルIDに対応する画像を含むユーザページを含む応答メッセージを返信する。そのユーザページには、ユーザのアカウントが含まれる。図5によれば、画像ファイルID「/98765432/photo.gif」を含むページについて、アカウント「Minamo」が含まれている。
(S206) In response to this, the
(S207)識別サーバ1は、S204における当該加入者IDと、S206で抽出したアカウントとを関連付けることができる。即ち、加入者IDに基づくユーザは、ブログサイトにおけるそのアカウントであると推定することができる。図5によれば、加入者ID「12345678」と、アカウント「Minamo」とが関連付けられる。
(S207) The
(S208)また、識別サーバ1は、そのアカウントに基づく投稿文を取得するべく、投稿文を検索するめの要求メッセージを、ブログサイトサーバ3へ送信する。
(S208) Further, the
(S209)これに対し、ブログサイトサーバ3は、そのアカウントに基づく投稿文を、識別サーバ1へ返信する。
(S209) In response to this, the
(S210)これによって、識別サーバ1は、取得した投稿文を、そのアカウントに関連付けられた加入者IDと関連付けることができる。即ち、ブログサイトにおけるその投稿文は、加入者IDに基づくユーザによって投稿されたものであると推定することができる。
(S210) Thereby, the
尚、アクセス履歴情報に含まれる別の加入者IDについて、アカウントと関連付ける場合、更にS204〜S211を繰り返すことによって実現される。 Note that when another subscriber ID included in the access history information is associated with an account, it is realized by further repeating S204 to S211.
図6は、本発明における識別サーバの機能構成図である。 FIG. 6 is a functional configuration diagram of the identification server in the present invention.
図6によれば、識別サーバ1は、インターネットに接続する通信インタフェース部10と、アクセス履歴収集部11と、第1のURL抽出部12と、第2のURL抽出部13と、アカウント取得部14と、アカウント関連付け部15と、投稿文検索部16と、投稿文関連付け部17とを有する。通信インタフェース部10を除くこれら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現されるものであってもよい。
According to FIG. 6, the
アクセス履歴収集部11は、通信インタフェース部10を介して、加入者IDに対応付けられたURLを含むアクセス履歴情報を、通信事業設備装置4から収集する。収集したアクセス履歴情報は、第1のURL抽出部12へ出力される。
The access
第1のURL抽出部12は、入力したアクセス履歴情報の中で、画像ファイルIDを含む複数のURLを抽出する。抽出されたURLは、第2のURL抽出部13へ出力される。
The first
第2のURL抽出部13は、当該加入者IDについて、画像ファイルIDを含む複数のURLの中で、出現回数が最も多いURLを選択する。このURLは、当該加入者IDに基づくユーザのページであると推定する。そして、そのURLに含まれる画像ファイルIDを抽出す。その画像ファイルIDに基づく画像は、ユーザのアイコン画像であると推定する。抽出された画像ファイルIDは、アカウント取得部14へ出力される。
For the subscriber ID, the second
アカウント取得部14は、通信インタフェース部10を介して、ブログサイトサーバ3へ、画像ファイルIDに対応する画像を含むページを検索する要求メッセージを送信する。そして、ブログサイトサーバ3から、そのページのアカウントを取得する。取得したアカウントは、アカウント関連付け部15へ出力される。
The
アカウント関連付け部15は、入力されたアカウントと、そのURLへアクセスした当該端末の加入者IDとを関連付ける。関連付けられた加入者ID及びアカウントの組は、投稿文検索部16へ出力される。
The
投稿文検索部16は、通信インタフェース部10を介して、ブログサイトサーバ3からアカウントに基づく投稿文を収集する。収集された投稿文は、投稿文関連付け部17へ出力される。
The posted
投稿文関連付け部17は、収集された投稿文は、アカウントに関連付けられた当該加入者IDに基づくユーザによって投稿されたものであると関連付ける。
The posted
以上、詳細に説明したように、本発明の投稿者識別方法、サーバ及びプログラムによれば、ブログサイトサーバに投稿された投稿文(定性的データ)と、ユーザ操作に基づく端末からのアクセス履歴(定量的データ)に基づく加入者識別子とを関連付けることができる。投稿文の内容を分析することによって、その加入者IDに基づくユーザが所望するサービスを、そのユーザのみに直接的に提供することができる。 As described above in detail, according to the contributor identification method, server, and program of the present invention, the posted text (qualitative data) posted on the blog site server and the access history from the terminal based on the user operation ( Subscriber identifiers based on quantitative data). By analyzing the contents of the posted text, the service desired by the user based on the subscriber ID can be directly provided only to the user.
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。 Various changes, modifications, and omissions of the above-described various embodiments of the present invention can be easily made by those skilled in the art. The above description is merely an example, and is not intended to be restrictive. The invention is limited only as defined in the following claims and the equivalents thereto.
1 識別サーバ
10 通信インタフェース部
11 アクセス履歴収集部
12 第1のURL抽出部
13 第2のURL抽出部
14 アカウント取得部
15 アカウント関連付け部
16 投稿文検索部
17 投稿文関連付け部
2 端末
3 ブログサイトサーバ
4 通信事業設備装置
DESCRIPTION OF
Claims (9)
前記システムは、前記加入者識別子と前記アカウントとを関連付ける識別サーバを更に有し、
前記識別サーバが、
前記加入者識別子に対応付けられたURLを含むアクセス履歴情報を、前記通信事業設備装置から収集する第1のステップと、
当該加入者識別子に対して、前記アクセス履歴情報の中で、画像ファイル識別子を含む複数のURLを抽出する第2のステップと、
前記画像ファイル識別子を含む複数のURLの中で、出現回数が最も多いURLを選択し、そのURLに含まれる画像ファイル識別子を抽出する第3のステップと、
前記ブログサイトサーバから、前記画像ファイル識別子に対応する画像を含むページを検索し、そのページのアカウントを取得する第4のステップと、
抽出された前記アカウントと、そのURLへアクセスした当該端末の加入者識別子とを関連付ける第5のステップと
を有することを特徴とする投稿者識別方法。 In a system having a blog site server that publishes posted text and its account, and a communication business facility device that collects a large number of URLs (Uniform Resource Locators) accessed from a terminal having a subscriber identifier to the blog site server A method for identifying posters,
The system further comprises an identification server that associates the subscriber identifier with the account;
The identification server is
A first step of collecting access history information including a URL associated with the subscriber identifier from the communication business facility device;
A second step of extracting a plurality of URLs including an image file identifier in the access history information for the subscriber identifier;
A third step of selecting a URL having the highest number of appearances from a plurality of URLs including the image file identifier, and extracting an image file identifier included in the URL;
A fourth step of retrieving a page including an image corresponding to the image file identifier from the blog site server and acquiring an account of the page;
A contributor identification method comprising the fifth step of associating the extracted account with a subscriber identifier of the terminal that has accessed the URL.
前記ブログサイトサーバから前記アカウントに基づく投稿文を収集する第6のステップと、
収集された前記投稿文は、前記アカウントに関連付けられた当該加入者識別子に基づくユーザによって投稿されたものであると関連付ける第7のステップと
を更に有することを特徴とする請求項1から3のいずれか1項に記載の投稿者識別方法。 The identification server is
A sixth step of collecting posted text based on the account from the blog site server;
4. The seventh step according to claim 1, further comprising a seventh step of associating that the collected posted text is posted by a user based on the subscriber identifier associated with the account. 2. The poster identification method according to item 1.
前記識別サーバは、前記加入者識別子と前記アカウントとを関連付けるものであり、
前記加入者識別子に対応付けられたURLを含むアクセス履歴情報を、前記通信事業設備装置から収集するアクセス履歴収集手段と、
当該加入者識別子に対して、前記アクセス履歴情報の中で、画像ファイル識別子を含む複数のURLを抽出する第1のURL抽出手段と、
前記画像ファイル識別子を含む複数のURLの中で、出現回数が最も多いURLを選択し、そのURLに含まれる画像ファイル識別子を抽出する第2のURL抽出手段と、
前記ブログサイトサーバから、前記画像ファイル識別子に対応する画像を含むページを検索し、そのページのアカウントを取得するアカウント取得手段と、
抽出された前記アカウントと、そのURLへアクセスした当該端末の加入者識別子とを関連付けるアカウント関連付け手段と
を有することを特徴とする識別サーバ。 A network is connected to a blog site server that publishes posted text and the account of the poster, and a communication business facility device that collects a large number of URLs (Uniform Resource Locators) accessed from a terminal having a subscriber identifier to the blog site server. An identification server connected via
The identification server associates the subscriber identifier with the account;
Access history collection means for collecting access history information including a URL associated with the subscriber identifier from the communication business facility device;
A first URL extracting means for extracting a plurality of URLs including an image file identifier in the access history information for the subscriber identifier;
A second URL extracting means for selecting a URL having the highest number of appearances from a plurality of URLs including the image file identifier and extracting an image file identifier included in the URL;
Account acquisition means for searching a page including an image corresponding to the image file identifier from the blog site server and acquiring an account of the page;
An identification server comprising account association means for associating the extracted account with a subscriber identifier of the terminal accessing the URL.
収集された前記投稿文は、前記アカウントに関連付けられた当該加入者識別子に基づくユーザによって投稿されたものであると関連付ける投稿文関連付け手段と
を更に有することを特徴とする請求項5から7のいずれか1項に記載の識別サーバ。 A posted message collection means for collecting a posted message based on the account from the blog site server;
8. The posted message associating means for associating the collected posted messages with a user based on the subscriber identifier associated with the account. The identification server according to claim 1.
前記識別サーバは、前記加入者識別子と前記アカウントとを関連付けるものであり、
前記加入者識別子に対応付けられたURLを含むアクセス履歴情報を、前記通信事業設備装置から収集するアクセス履歴収集手段と、
当該加入者識別子に対して、前記アクセス履歴情報の中で、画像ファイル識別子を含む複数のURLを抽出する第1のURL抽出手段と、
前記画像ファイル識別子を含む複数のURLの中で、出現回数が最も多いURLを選択し、そのURLに含まれる画像ファイル識別子を抽出する第2のURL抽出手段と、
前記ブログサイトサーバから、前記画像ファイル識別子に対応する画像を含むページを検索し、そのページのアカウントを取得するアカウント取得手段と、
抽出された前記アカウントと、そのURLへアクセスした当該端末の加入者識別子とを関連付けるアカウント関連付け手段と
してコンピュータを機能させることを特徴とする識別サーバ用のプログラム。 A network is connected to a blog site server that publishes posted text and the account of the poster, and a communication business facility device that collects a large number of URLs (Uniform Resource Locators) accessed from a terminal having a subscriber identifier to the blog site server. A program for causing a computer mounted on an identification server connected via a computer to function,
The identification server associates the subscriber identifier with the account;
Access history collection means for collecting access history information including a URL associated with the subscriber identifier from the communication business facility device;
A first URL extracting means for extracting a plurality of URLs including an image file identifier in the access history information for the subscriber identifier;
A second URL extracting means for selecting a URL having the highest number of appearances from a plurality of URLs including the image file identifier and extracting an image file identifier included in the URL;
Account acquisition means for searching a page including an image corresponding to the image file identifier from the blog site server and acquiring an account of the page;
A program for an identification server, which causes a computer to function as account association means for associating the extracted account with a subscriber identifier of the terminal that has accessed the URL.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011072180A JP5509131B2 (en) | 2011-03-29 | 2011-03-29 | Contributor identification method, server, and program for associating user's post with user's subscriber identifier |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011072180A JP5509131B2 (en) | 2011-03-29 | 2011-03-29 | Contributor identification method, server, and program for associating user's post with user's subscriber identifier |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012208594A JP2012208594A (en) | 2012-10-25 |
JP5509131B2 true JP5509131B2 (en) | 2014-06-04 |
Family
ID=47188301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011072180A Active JP5509131B2 (en) | 2011-03-29 | 2011-03-29 | Contributor identification method, server, and program for associating user's post with user's subscriber identifier |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5509131B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104113569B (en) * | 2013-04-18 | 2018-09-25 | 腾讯科技(深圳)有限公司 | A kind of method and open platform server of Dynamic Matching information source |
JP6274973B2 (en) * | 2014-05-29 | 2018-02-07 | Kddi株式会社 | User identification device, user identification method, and program |
KR102198789B1 (en) * | 2020-03-31 | 2021-01-06 | 쿠팡 주식회사 | Server for generating integrated usage log data and operating method thereof |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003122673A (en) * | 2001-10-11 | 2003-04-25 | I-Face Inc | Information processor, information processing method, and communication system |
JP5056160B2 (en) * | 2007-05-23 | 2012-10-24 | 富士通株式会社 | Marketing support processing method, apparatus and program |
-
2011
- 2011-03-29 JP JP2011072180A patent/JP5509131B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012208594A (en) | 2012-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10606929B2 (en) | Template selection for mapping a third-party web page to an object in a social networking system | |
US9183291B2 (en) | Mobile content capture and discovery system based on augmented user identity | |
KR101322679B1 (en) | An assistant―adviser using the semantic analysis of community exchanges | |
JP6164808B2 (en) | Recommended share box | |
US9998552B1 (en) | Dynamic creation, data population, and communication establishment across various mediums | |
US9141698B2 (en) | Semantic note taking system | |
US20140344707A1 (en) | Information Distribution Method and Device | |
CN101953189A (en) | The collection view of local and long-range social information | |
JP5431552B1 (en) | Information processing apparatus, information processing method, and computer program | |
US10922359B2 (en) | Computerized system and method for extracting entity information from text communications and displaying content based therefrom | |
US9251297B2 (en) | Semantic note taking system | |
US20140115499A1 (en) | Social networking system and method | |
CN103246699A (en) | Method and device for data access control based on browser | |
JP5509131B2 (en) | Contributor identification method, server, and program for associating user's post with user's subscriber identifier | |
JP2012215930A (en) | Electronic advertisement distribution system | |
KR100840019B1 (en) | Method and system for providing advertisements using schedule information | |
JP5739277B2 (en) | Identification method, identification server, and program for associating user account with subscriber identifier of user terminal | |
JP3935388B2 (en) | Related information providing method, related information providing apparatus, program, and recording medium | |
US10073920B1 (en) | System and method for automatic posting to mediums with a users current interests | |
JP2010086087A (en) | Image-equipped article contribution system for regional community site, program therefor and method therefor | |
KR20090096578A (en) | System and Method for Processing Contents Information and Recording Medium | |
JP5862976B2 (en) | Information processing apparatus and method | |
KR20130062401A (en) | Method, apparatus, server and computer readable recording medium for managing contents | |
KR20100013066A (en) | System and method for providing schedule registration interface and recording medium | |
US20170068399A1 (en) | User-related information display user terminal, user-related information display system, user-related information display method, and program for user-related information display user terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130814 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140324 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5509131 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |