JP2006058948A - Content information collection device, content information collection method, and content information collection program for executing to computer the method - Google Patents

Content information collection device, content information collection method, and content information collection program for executing to computer the method Download PDF

Info

Publication number
JP2006058948A
JP2006058948A JP2004237266A JP2004237266A JP2006058948A JP 2006058948 A JP2006058948 A JP 2006058948A JP 2004237266 A JP2004237266 A JP 2004237266A JP 2004237266 A JP2004237266 A JP 2004237266A JP 2006058948 A JP2006058948 A JP 2006058948A
Authority
JP
Japan
Prior art keywords
information
content
user
website
access restriction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004237266A
Other languages
Japanese (ja)
Other versions
JP2006058948A5 (en
JP4589051B2 (en
Inventor
Mitsuyo Miyazaki
光世 宮崎
Yuji Umemura
雄士 梅村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2004237266A priority Critical patent/JP4589051B2/en
Publication of JP2006058948A publication Critical patent/JP2006058948A/en
Publication of JP2006058948A5 publication Critical patent/JP2006058948A5/ja
Application granted granted Critical
Publication of JP4589051B2 publication Critical patent/JP4589051B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To efficiently collect content information from access restricted websites. <P>SOLUTION: A login management part 503 sends login information for canceling access restriction to paid sites to paid content server devices 30a, 30b that provide services to browse contents in the access restricted paid sites. When receiving access permission information that permits access from the paid content server devices 30a, 30b according to the login formation sent, a content information collecting part 505 collects information about the contents within the paid sites from the paid content server devices 30a, 30b and an index creating part 506 stores information about the contents collected. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

この発明は、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置から該コンテンツに係る情報を収集するコンテンツ情報収集装置、コンテンツ情報収集方法およびコンテンツ情報収集方法をコンピュータに実行させるコンテンツ情報収集プログラムに関し、特に、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集することができるコンテンツ情報収集装置、コンテンツ情報収集方法およびコンテンツ情報収集方法をコンピュータに実行させるコンテンツ情報収集プログラムに関する。   The present invention relates to a content information collecting apparatus, a content information collecting method, and a content information collecting method for causing a computer to execute information relating to the content from a server device that provides a content browsing service in a website. More particularly, the present invention relates to a content information collection device, a content information collection method, and a content information collection program that causes a computer to execute the content information collection method, which can efficiently collect content information from a website with restricted access. .

従来、インターネットにおいて提供されるウェブサイトの数は飛躍的に増加してきており、ユーザがその中から画像や音声、動画などのコンテンツを容易に検索できるようにするため、検索エンジンと呼ばれるコンテンツの検索システムが広く利用されている。   In the past, the number of websites provided on the Internet has increased dramatically, and in order to enable users to easily search for content such as images, sounds, and videos, search for content called search engines The system is widely used.

この検索エンジンは、検索したいコンテンツに関連したキーワードの指定をユーザから受け付け、受け付けたキーワードに合致するコンテンツの情報を検索し、検索されたコンテンツの情報をユーザに提供する。   This search engine accepts specification of a keyword related to the content to be searched from the user, searches for content information matching the received keyword, and provides the searched content information to the user.

検索結果としてユーザに提供されるコンテンツの情報は、クローラと呼ばれるプログラムが実行されることにより、さまざまなウェブサイトが定期的に巡回されて収集されたものである(非特許文献1を参照)。   The content information provided to the user as a search result is collected by periodically visiting various websites by executing a program called a crawler (see Non-Patent Document 1).

具体的には、このクローラは、あるウェブサイト内のコンテンツの情報を収集した後、さらに、ウェブサイトに含まれているリンクを辿って別のウェブサイトからコンテンツの情報を収集することを繰り返す。   Specifically, this crawler repeatedly collects content information from another website by collecting information on content in a certain website and then tracing links included in the website.

グーグル株式会社、“Google よくある質問、Webマスター関連の質問”、[online]、[平成16年7月1日検索]、インターネット<URL: http://www.google.co.jp/intl/ja/faq.html>Google Inc., “Google FAQ, Webmaster related questions”, [online], [Search July 1, 2004], Internet <URL: http://www.google.co.jp/intl/ en / faq.html>

しかしながら、上記非特許文献1に代表される従来技術では、アクセスが制限されているウェブサイトに含まれているコンテンツの情報を収集することができないため、ユーザがそのようなウェブサイトに含まれているコンテンツを検索できないという問題があった。   However, in the conventional technology represented by the above-mentioned Non-Patent Document 1, it is not possible to collect content information included in a website whose access is restricted. Therefore, the user is included in such a website. There was a problem that content that cannot be searched.

すなわち、クローラは、有料のウェブページなど、ユーザがアクセスするのにIDやパスワードなどを入力する必要があるウェブページにはアクセスすることができないため、そのようなウェブページのコンテンツの情報を検索サービス用に収集することができなかった。   That is, the crawler cannot access a web page that requires a user to input an ID, a password, or the like such as a paid web page. Could not be collected for.

この発明は、上述した従来技術による問題点を解消するためになされたものであり、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集することができるコンテンツ情報収集装置、コンテンツ情報収集方法およびコンテンツ情報収集方法をコンピュータに実行させるコンテンツ情報収集プログラムを提供することを目的とする。   The present invention has been made to solve the above-described problems caused by the prior art, and is a content information collection apparatus and content information that can efficiently collect content information from a website with restricted access. It is an object of the present invention to provide a content information collection program that causes a computer to execute a collection method and a content information collection method.

上述した課題を解決し、目的を達成するため、本発明は、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置から該コンテンツに係る情報を収集するコンテンツ情報収集装置であって、アクセス制限がなされているウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信する情報送信手段と、前記情報送信手段により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を記憶するコンテンツ情報収集手段と、を備えたことを特徴とする。   In order to solve the above-described problems and achieve the object, the present invention provides a content information collection device that collects information related to content from a server device that provides a content browsing service in a website, Information transmitting means for transmitting access restriction release information for releasing access restriction to the website to a server device that provides a browsing service for content in the website that has been restricted, and transmitted by the information sending means When access permission information permitting access is received from the server device according to the access restriction release information, information related to the content in the website is collected from the server device, and the information related to the collected content is stored Content information collecting means.

また、本発明は、上記発明において、前記情報送信手段は、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置からウェブサイト内のコンテンツに対するアクセス制限の有無に係る情報を取得し、該サーバ装置により提供されるウェブサイト内のコンテンツに対するアクセス制限がなされている場合に、当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信することを特徴とする。   Further, the present invention is the above invention, wherein the information transmitting means obtains information related to presence / absence of access restriction on the content in the website from a server device that provides a browsing service of the content in the website, When the access restriction on the content in the website provided by the server device is made, the access restriction releasing information for releasing the access restriction to the website is transmitted.

また、本発明は、上記発明において、前記アクセス制限を解除するアクセス制限解除情報をユーザごとに記憶する情報記憶手段をさらに備え、前記情報送信手段は、前記情報記憶手段により記憶された各ユーザのアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集手段は、該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザに対応付けて記憶することを特徴とする。   The present invention further includes information storage means for storing access restriction release information for releasing the access restriction for each user in the above-mentioned invention, wherein the information transmitting means stores each user's information stored by the information storage means. The access restriction release information is transmitted to a server device that provides a browsing service for content in the website, and the content information collecting means collects information related to the content in the website from the server device, and the collected content The information concerning is stored in association with each user.

また、本発明は、上記発明において、前記情報記憶手段は、ユーザの属性に係る情報と前記アクセス制限を解除するアクセス制限解除情報とを対応付けて記憶し、前記情報送信手段は、各ユーザの属性に対応する前記情報記憶手段により記憶されたアクセス制限解除情報を抽出し、抽出されたアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集手段は、前記情報送信手段により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザの属性に対応付けて記憶することを特徴とする。   In the present invention, the information storage means stores information relating to user attributes and access restriction release information for releasing the access restriction in association with each other, and the information transmission means The access restriction release information stored by the information storage means corresponding to the attribute is extracted, and the extracted access restriction release information is transmitted to a server device that provides a content browsing service in the website, and the content information When the collection means receives access permission information permitting access from the server apparatus according to the access restriction release information transmitted by the information transmission means, the collection means collects information related to the content in the website from the server apparatus Then, the information relating to the collected content is stored in association with the attribute of each user.

また、本発明は、上記発明において、前記情報記憶手段は、ユーザが正規ユーザであるか否かを認証する認証情報を受け付けてユーザの認証をおこない、ユーザが正規ユーザであることが認証された場合に、前記アクセス制限を解除するアクセス制限解除情報をユーザから受け付けて、受け付けたアクセス制限解除情報を該ユーザに対応付けて記憶することを特徴とする。   Further, in the present invention according to the above invention, the information storage means accepts authentication information for authenticating whether or not the user is a regular user, authenticates the user, and is authenticated that the user is a regular user. In this case, access restriction release information for releasing the access restriction is received from a user, and the received access restriction release information is stored in association with the user.

また、本発明は、上記発明において、前記コンテンツ情報収集手段は、前記情報記憶手段により記憶されたユーザの属性に係る情報に基づいて、前記サーバ装置からウェブサイト内のコンテンツを紹介する紹介情報を収集し、収集した紹介情報をユーザの属性に対応付けて記憶することを特徴とする。   Further, according to the present invention, in the above-mentioned invention, the content information collection unit obtains introduction information for introducing content in the website from the server device based on information relating to user attributes stored by the information storage unit. The collected introduction information is stored in association with user attributes.

また、本発明は、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置から該コンテンツに係る情報を収集するコンテンツ情報収集方法であって、アクセス制限がなされているウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信する情報送信工程と、前記情報送信工程により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を記憶するコンテンツ情報収集工程と、を含んだことを特徴とする。   The present invention also provides a content information collecting method for collecting information related to content from a server device that provides a browsing service for the content in the website, the content of the content in the website being restricted in access. An information transmission step of transmitting access restriction release information for releasing the access restriction to the website to a server device providing a browsing service, and the server device according to the access restriction release information transmitted by the information transmission step A content information collecting step of collecting information related to the content in the website from the server device and storing the information related to the collected content when the access permission information permitting access is received from the server device. Features.

また、本発明は、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置から該コンテンツに係る情報を収集するコンテンツ情報収集方法をコンピュータに実行させるコンテンツ情報収集プログラムであって、アクセス制限がなされているウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信する情報送信工程と、前記情報送信工程により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を記憶するコンテンツ情報収集工程と、をコンピュータに実行させることを特徴とする。   The present invention is also a content information collection program for causing a computer to execute a content information collection method for collecting information related to content from a server device that provides a browsing service for content in a website, and the access restriction is provided. An information transmission step of transmitting access restriction release information for releasing access restriction to the website to a server device that provides a browsing service of content in the website being made, and the access transmitted by the information transmission step Content information that collects information related to the content in the website from the server device and stores the information related to the collected content when access permission information permitting access is received from the server device according to the restriction release information Let the computer execute the collection process And wherein the door.

また、本発明は、上記発明において、前記アクセス制限を解除するアクセス制限解除情報をユーザごとに記憶する情報記憶工程をさらに含み、前記情報送信工程は、前記情報記憶工程により記憶された各ユーザのアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集工程は、該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザに対応付けて記憶することを特徴とする。   In the above invention, the present invention further includes an information storage step for storing access restriction release information for releasing the access restriction for each user, and the information transmission step includes a step of storing each user stored in the information storage step. The access restriction release information is transmitted to a server device that provides a browsing service for content in the website, and the content information collection step collects information related to the content in the website from the server device, and the collected content The information concerning is stored in association with each user.

また、本発明は、上記発明において、前記情報記憶工程は、ユーザが正規ユーザであるか否かを認証する認証情報を受け付けてユーザの認証をおこない、ユーザが正規ユーザであることが認証された場合に、前記アクセス制限を解除するアクセス制限解除情報をユーザから受け付けて、受け付けたアクセス制限解除情報を該ユーザに対応付けて記憶することを特徴とする。   Further, in the present invention according to the above-described invention, the information storing step receives authentication information for authenticating whether or not the user is a regular user, authenticates the user, and authenticates that the user is a regular user. In this case, access restriction release information for releasing the access restriction is received from a user, and the received access restriction release information is stored in association with the user.

また、本発明は、上記発明において、前記情報記憶工程は、ユーザの属性に係る情報と前記アクセス制限を解除するアクセス制限解除情報とを対応付けて記憶し、前記情報送信工程は、各ユーザの属性に対応する前記情報記憶工程により記憶されたアクセス制限解除情報を抽出し、抽出されたアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集工程は、前記情報送信工程により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザの属性に対応付けて記憶することを特徴とする。   In the present invention, the information storage step stores information relating to user attributes and access restriction release information for releasing the access restriction in association with each other, and the information transmission step The access restriction release information stored in the information storage step corresponding to the attribute is extracted, and the extracted access restriction release information is transmitted to a server device that provides a content browsing service on the website, and the content information The collecting step collects information related to the content in the website from the server device when the access permission information permitting access is received from the server device in accordance with the access restriction release information transmitted in the information transmitting step. Then, the information relating to the collected content is stored in association with the attribute of each user.

また、本発明は、上記発明において、前記コンテンツ情報収集工程は、前記情報記憶工程により記憶されたユーザの属性に係る情報に基づいて、前記サーバ装置からウェブサイト内のコンテンツを紹介する紹介情報を収集し、収集した紹介情報をユーザの属性に対応付けて記憶することを特徴とする。   Further, according to the present invention, in the above-mentioned invention, the content information collecting step includes introduction information for introducing content in the website from the server device based on information relating to user attributes stored in the information storage step. The collected introduction information is stored in association with user attributes.

また、本発明は、上記発明において、前記ユーザの属性に係る情報は、ユーザの会員種別の情報であることを特徴とする。   Also, the present invention is characterized in that, in the above-mentioned invention, the information relating to the user attribute is information of a user membership type.

また、本発明は、上記発明において、前記ユーザの属性に係る情報は、ユーザ登録に係る登録料の情報であることを特徴とする。   Also, the present invention is characterized in that, in the above invention, the information relating to the user attribute is information on a registration fee relating to user registration.

また、本発明は、上記発明において、前記ユーザの属性に係る情報は、ユーザの特典ポイントの情報であることを特徴とする。   Moreover, the present invention is characterized in that, in the above-mentioned invention, the information relating to the attribute of the user is information of a privilege point of the user.

また、本発明は、上記発明において、前記ユーザの属性に係る情報は、ユーザが属するグループの情報であることを特徴とする。   Also, the present invention is characterized in that, in the above invention, the information relating to the user attribute is information of a group to which the user belongs.

本発明によれば、アクセス制限がなされているウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信し、送信されたアクセス制限解除情報に応じてサーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を記憶することとしたので、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集することができるという効果を奏する。   According to the present invention, the access restriction release information for releasing the access restriction to the website is transmitted to the server device that provides the browsing service of the content in the website where the access restriction is made, and the transmitted access When access permission information permitting access is received from the server device according to the restriction release information, information related to the content in the website is collected from the server device, and the information related to the collected content is stored. Therefore, the content information can be efficiently collected from the website where access is restricted.

また、本発明によれば、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置からウェブサイト内のコンテンツに対するアクセス制限の有無に係る情報を取得し、サーバ装置により提供されるウェブサイト内のコンテンツに対するアクセス制限がなされている場合に、当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信することとしたので、アクセス制限がなされているか否かを確認し、アクセス制限がなされている場合に、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集することができるという効果を奏する。   Further, according to the present invention, information relating to presence / absence of access restriction on content in a website is obtained from a server device that provides a browsing service of content in the website, and the website provided by the server device When access restrictions are applied to the contents of this website, access restriction release information for releasing access restrictions on the website is sent, so it is confirmed whether access restrictions have been made and access restrictions are made. In this case, it is possible to efficiently collect content information from a website where access is restricted.

また、本発明によれば、アクセス制限を解除するアクセス制限解除情報をユーザごとに記憶し、記憶された各ユーザのアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザに対応付けて記憶することとしたので、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報をユーザごとに収集し、ユーザごとに異なる検索結果を提供することができるという効果を奏する。   Further, according to the present invention, the server device that stores the access restriction release information for releasing the access restriction for each user, and provides the browsing service of the content in the website for the stored access restriction release information of each user Since the information related to the content in the website is collected from the server device, and the information related to the collected content is stored in association with each user, it is efficient from the website where the access is restricted. In addition, content information can be collected for each user, and different search results can be provided for each user.

また、本発明によれば、ユーザの属性に係る情報とアクセス制限を解除するアクセス制限解除情報とを対応付けて記憶し、各ユーザの属性に対応するアクセス制限解除情報を抽出し、抽出されたアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、送信されたアクセス制限解除情報に応じてサーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザの属性に対応付けて記憶することとしたので、ユーザの属性に応じてアクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集することができるという効果を奏する。   Further, according to the present invention, information related to user attributes and access restriction release information for releasing access restrictions are stored in association with each other, and access restriction release information corresponding to each user attribute is extracted and extracted. When access restriction release information is transmitted to a server device that provides a browsing service for content in the website, and access permission information that permits access from the server device according to the transmitted access restriction release information is received, Information related to the content in the website is collected from the server device, and the information related to the collected content is stored in association with the attribute of each user, so that access is restricted according to the user attribute. The content information can be efficiently collected from the website.

また、本発明によれば、ユーザが正規ユーザであるか否かを認証する認証情報を受け付けてユーザの認証をおこない、ユーザが正規ユーザであることが認証された場合に、アクセス制限を解除するアクセス制限解除情報をユーザから受け付けて、受け付けたアクセス制限解除情報をユーザに対応付けて記憶することとしたので、ユーザが認証情報を取得している場合に、アクセス制限がなされているウェブサイトからコンテンツの情報を収集するようユーザが設定することができるという効果を奏する。   In addition, according to the present invention, authentication information for authenticating whether or not the user is a regular user is accepted and the user is authenticated, and when the user is authenticated as a regular user, the access restriction is released. Since the access restriction release information is received from the user and the received access restriction release information is stored in association with the user, when the user obtains the authentication information, the access restriction is made from the website. There is an effect that the user can set to collect content information.

また、本発明によれば、ユーザの属性に係る情報に基づいて、サーバ装置からウェブサイト内のコンテンツを紹介する紹介情報を収集し、収集した紹介情報をユーザの属性に対応付けて記憶することとしたので、アクセス制限がなされているウェブサイトからウェブサイト内のコンテンツの情報とともに、コンテンツを紹介する紹介情報を効率的に収集し、ユーザの属性に応じてコンテンツの情報またはコンテンツの紹介情報を検索結果として提供することができるという効果を奏する。   Further, according to the present invention, based on information relating to user attributes, the introduction information for introducing the content in the website is collected from the server device, and the collected introduction information is stored in association with the user attributes. Therefore, it efficiently collects the introduction information that introduces the content together with the information of the content in the website from the website where access is restricted, and the content information or the introduction information of the content according to the user attribute There exists an effect that it can provide as a search result.

また、本発明によれば、ユーザの属性に係る情報は、ユーザの会員種別の情報であることとしたので、ユーザの会員種別に応じてアクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集し、ユーザの会員種別に応じたコンテンツの情報を検索結果として提供することができるという効果を奏する。   Further, according to the present invention, since the information related to the user's attribute is information on the user's member type, the content can be efficiently obtained from a website whose access is restricted according to the user's member type. There is an effect that it is possible to collect information and provide content information according to the user's membership type as a search result.

また、本発明によれば、ユーザの属性に係る情報は、ユーザ登録に係る登録料の情報であることとしたので、ユーザがユーザ登録をおこなう場合に支払う登録料に応じて、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集し、登録料に応じたコンテンツの情報を検索結果として提供することができるという効果を奏する。   Further, according to the present invention, since the information related to the user attribute is information on the registration fee related to user registration, access is restricted according to the registration fee paid when the user performs user registration. It is possible to efficiently collect content information from a website and provide content information according to a registration fee as a search result.

また、本発明によれば、ユーザの属性に係る情報は、ユーザの特典ポイントの情報であることとしたので、ユーザが獲得した特典ポイントに応じて、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集し、特典ポイントに応じたコンテンツの情報を検索結果として提供することができるという効果を奏する。   Further, according to the present invention, since the information related to the user's attribute is information of the user's privilege points, it is efficient from a website where access is restricted according to the privilege points acquired by the user. Thus, it is possible to collect content information and to provide content information corresponding to privilege points as a search result.

また、本発明によれば、ユーザの属性に係る情報は、ユーザが属するグループの情報であることとしたので、ユーザが属するグループに応じて、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集し、グループに応じたコンテンツの情報を検索結果として提供することができるという効果を奏する。   Further, according to the present invention, since the information related to the user attribute is the information of the group to which the user belongs, the content can be efficiently obtained from the website whose access is restricted according to the group to which the user belongs. It is possible to collect the information and to provide the content information corresponding to the group as a search result.

以下に添付図面を参照して、本発明に係るコンテンツ情報収集装置、コンテンツ情報収集方法およびコンテンツ情報収集方法をコンピュータに実行させるコンテンツ情報収集プログラムの好適な実施例を詳細に説明する。   Exemplary embodiments of a content information collection apparatus, a content information collection method, and a content information collection method according to the present invention for causing a computer to execute the content information collection apparatus will be described below in detail with reference to the accompanying drawings.

まず、実施例1に係るコンテンツ情報収集装置の機能的構成について説明する。図1は、実施例1に係るコンテンツ情報収集装置の機能的構成を示す図である。図1に示すように、このコンテンツ情報収集装置50は、インターネット40を介して、ユーザ端末装置10a,10b、無料コンテンツサーバ装置20a,20b、および、有料コンテンツサーバ装置30a,30bに接続されている。   First, the functional configuration of the content information collection apparatus according to the first embodiment will be described. FIG. 1 is a diagram illustrating a functional configuration of the content information collection apparatus according to the first embodiment. As shown in FIG. 1, the content information collection device 50 is connected to user terminal devices 10a and 10b, free content server devices 20a and 20b, and pay content server devices 30a and 30b via the Internet 40. .

ユーザ端末装置10a,10bは、ユーザからキーワードの入力を受け付け、インターネット上に公開されているウェブサイト内のコンテンツの検索要求をコンテンツ情報収集装置50に送信し、コンテンツ情報収集装置50から検索結果を受信して、ディスプレイ等に出力する端末装置である。   The user terminal devices 10a and 10b receive input of keywords from the user, transmit a search request for content in a website published on the Internet to the content information collection device 50, and obtain search results from the content information collection device 50. It is a terminal device that receives and outputs to a display or the like.

無料コンテンツサーバ装置20a,20bは、無料でウェブサイト内のコンテンツを公開しているサーバ装置である。有料コンテンツサーバ装置30a,30bは、会員登録をしたユーザに対してのみ、ウェブサイト内のコンテンツを公開しているサーバ装置である。上記コンテンツには、ニュース記事などのテキストデータや音声、画像、動画などのデータが含まれる。   The free content server devices 20a and 20b are server devices that publish content in a website free of charge. The paid content server devices 30a and 30b are server devices that publish content in a website only to users who have registered as members. The content includes text data such as news articles and data such as voice, images, and moving images.

この有料コンテンツサーバ装置30a,30bは、ユーザIDやパスワードのユーザの登録情報を受信した際、ユーザの登録情報の認証をおこない、ユーザの登録情報が認証された場合に、ウェブサイト内の有料コンテンツに対するアクセスを登録情報を送信したユーザに許可するとともに、ユーザの登録情報を送信した装置に対して、有料コンテンツへのアクセスを許可することを示す情報を送信する。   The paid content server devices 30a and 30b authenticate the user registration information when receiving the user registration information of the user ID and password, and when the user registration information is authenticated, the paid content in the website Is permitted to the user who transmitted the registration information, and information indicating that access to the paid content is permitted is transmitted to the device that transmitted the registration information of the user.

コンテンツ情報収集装置50は、無料コンテンツサーバ装置20a,20b、および、有料コンテンツサーバ装置30a,30bからコンテンツの情報を収集して記憶し、ユーザ端末装置10a,10bからコンテンツの検索要求をキーワードとともに受け付けた場合に、キーワードに合致するコンテンツの情報を検索して、検索結果をユーザ端末装置10a,10bに出力する。   The content information collection device 50 collects and stores content information from the free content server devices 20a and 20b and the pay content server devices 30a and 30b, and accepts content search requests from the user terminal devices 10a and 10b together with keywords. In the case of the search, information on the content that matches the keyword is searched, and the search result is output to the user terminal devices 10a and 10b.

有料コンテンツサーバ装置30a,30bからコンテンツの情報を収集する際には、コンテンツ情報収集装置50は、その有料コンテンツサーバ装置30a,30bにユーザの登録情報を送信し、それに応じて有料コンテンツサーバ装置30a,30bからアクセスを許可するアクセス許可情報を受信した場合に、有料コンテンツサーバ装置30a,30bにアクセスし、有料コンテンツの情報を収集してデータベースに記憶する。   When collecting content information from the paid content server devices 30a and 30b, the content information collecting device 50 transmits user registration information to the paid content server devices 30a and 30b, and the paid content server device 30a accordingly. , 30b, access to the pay content server devices 30a, 30b is collected, and information on the pay content is collected and stored in the database.

図1に示すように、このコンテンツ情報収集装置50は、通信部500、ユーザ情報記憶部501、ユーザ情報管理部502、ログイン管理部503、コンテンツ情報記憶部504、コンテンツ情報収集部505、インデックス作成部506、検索入出力制御部507およびコンテンツ検索部508を有する。   As shown in FIG. 1, the content information collection device 50 includes a communication unit 500, a user information storage unit 501, a user information management unit 502, a login management unit 503, a content information storage unit 504, a content information collection unit 505, and an index creation. A unit 506, a search input / output control unit 507, and a content search unit 508.

通信部500は、インターネット40を介して、ユーザ端末装置10a,10b、無料コンテンツサーバ装置20a,20b、あるいは、有料コンテンツサーバ装置30a,30bとの間でデータの授受をおこなうネットワークインターフェースである。   The communication unit 500 is a network interface that exchanges data with the user terminal devices 10a and 10b, the free content server devices 20a and 20b, or the pay content server devices 30a and 30b via the Internet 40.

ユーザ情報記憶部501は、ハードディスク装置などの記憶デバイスであり、ユーザが会員登録をしている有料サイトの情報など、ユーザに係る情報を記憶する。図2は、図1に示したユーザ情報記憶部501が記憶するユーザ情報60の一例を示す図である。   The user information storage unit 501 is a storage device such as a hard disk device, and stores information related to the user such as information on a pay site where the user is registered as a member. FIG. 2 is a diagram illustrating an example of user information 60 stored in the user information storage unit 501 illustrated in FIG.

図2に示すように、このユーザ情報60は、検索サイトユーザID、検索サイトユーザパスワード、有料サイトURL、有料サイトユーザID、有料サイトユーザパスワードの情報を記憶している。   As shown in FIG. 2, this user information 60 stores information on a search site user ID, a search site user password, a pay site URL, a pay site user ID, and a pay site user password.

検索サイトユーザIDおよび検索サイトユーザパスワードは、コンテンツ情報収集装置50がユーザに提供している検索サービスにログインするためのユーザIDおよびパスワードの情報である。   The search site user ID and the search site user password are user ID and password information for logging in to the search service provided by the content information collection device 50 to the user.

有料サイトURLは、ユーザが会員登録をしている有料サイトのURL(Uniform Resource Locator)の情報である。有料サイトユーザIDおよび有料サイトユーザパスワードは、ユーザが会員登録をしている有料サイトにアクセスする際にユーザ認証に用いられるユーザIDおよびパスワードの情報である。   The pay site URL is information on a URL (Uniform Resource Locator) of a pay site where the user is registered as a member. The pay site user ID and the pay site user password are information on the user ID and password used for user authentication when the user accesses a pay site where the user is registered as a member.

図1の説明に戻ると、ユーザ情報管理部502は、検索サイトユーザIDや検索サイトユーザパスワード、有料サイトURL、有料サイトユーザID、有料サイトユーザパスワードなどの情報をユーザ情報記憶部501にユーザ情報60として記憶したり、ユーザ情報60として記憶された情報を更新したりする処理をおこなう。   Returning to the description of FIG. 1, the user information management unit 502 stores information such as a search site user ID, a search site user password, a pay site URL, a pay site user ID, and a pay site user password in the user information storage unit 501. A process of storing as 60 or updating information stored as the user information 60 is performed.

ここで、ユーザ情報管理部502は、検索サイトユーザIDおよび検索サイトユーザパスワードの情報を、コンテンツ情報収集装置50が提供する検索サービスに対してユーザが会員登録をおこなった際に、ユーザ情報60として記憶する。   Here, the user information management unit 502 uses the search site user ID and the search site user password information as user information 60 when the user registers as a member for the search service provided by the content information collection device 50. Remember.

また、ユーザ情報管理部502は、有料サイトURL、有料サイトユーザIDおよび有料サイトユーザパスワードの情報をユーザ端末装置10a,10bから受け付けて、ユーザ情報60として記憶する。   In addition, the user information management unit 502 receives information on the pay site URL, the pay site user ID, and the pay site user password from the user terminal devices 10 a and 10 b and stores them as the user information 60.

ログイン管理部503は、有料サイトに対するログイン処理を管理する。具体的には、ログイン管理部503は、ユーザ情報管理部502を介して、ユーザ情報記憶部501からユーザ情報60を読み出し、ユーザ情報60にURLが記憶された有料サイトを提供している有料コンテンツサーバ装置30a,30bに、有料サイトユーザIDと有料サイトユーザパスワードとを送信する。   The login management unit 503 manages login processing for a pay site. Specifically, the login management unit 503 reads the user information 60 from the user information storage unit 501 via the user information management unit 502, and provides paid content that provides a paid site whose URL is stored in the user information 60. The pay site user ID and the pay site user password are transmitted to the server devices 30a and 30b.

そして、ログイン管理部503は、有料サイトユーザIDと有料サイトユーザパスワードとを送信した有料コンテンツサーバ装置30a,30bから、有料コンテンツへのアクセスが許可されたことを示す情報を受信したか否かを調べ、その情報を受信した場合に、コンテンツ情報収集部505に有料コンテンツの情報を収集するよう要求する。   Then, the login management unit 503 determines whether or not information indicating that access to the pay content is permitted is received from the pay content server devices 30a and 30b that have transmitted the pay site user ID and the pay site user password. When the information is received, the content information collection unit 505 is requested to collect information on the paid content.

コンテンツ情報記憶部504は、ハードディスク装置などの記憶デバイスであり、無料コンテンツサーバ装置20a,20b、および、有料コンテンツサーバ装置30a,30bから収集したコンテンツの情報を記憶する。また、画像のコンテンツの情報を収集した場合には、コンテンツ情報記憶部504は、その画像に対応するサムネイル画像をさらに記憶する。   The content information storage unit 504 is a storage device such as a hard disk device, and stores content information collected from the free content server devices 20a and 20b and the pay content server devices 30a and 30b. In addition, when information about content of an image is collected, the content information storage unit 504 further stores a thumbnail image corresponding to the image.

図3は、図1に示したコンテンツ情報記憶部504が記憶するコンテンツ情報70の一例を示す図である。このコンテンツ情報70は、ユーザごとに記憶されるものである。すなわち、図3に示したコンテンツ情報70は、あるユーザに対して検索サービス用に収集したコンテンツの情報であり、同様のコンテンツ情報が他のユーザに対しても作成され、作成された各コンテンツ情報がユーザ情報60に記憶された検索サイトユーザIDに対応付けられて、コンテンツ情報記憶部504に記憶される。   FIG. 3 is a diagram illustrating an example of the content information 70 stored in the content information storage unit 504 illustrated in FIG. This content information 70 is stored for each user. That is, the content information 70 shown in FIG. 3 is content information collected for a search service for a certain user, and similar content information is created for other users, and each created content information Is associated with the search site user ID stored in the user information 60 and stored in the content information storage unit 504.

図3に示すように、このコンテンツ情報70は、タイトル、URL、説明文、テキストデータ、キーワード、サムネイル画像URLおよび有料無料区分の情報を記憶している。タイトルは、コンテンツを収集したウェブサイトのタイトルの情報である。URLは、ウェブサイトから収集したコンテンツのURLの情報である。   As shown in FIG. 3, the content information 70 stores information on a title, URL, description, text data, keyword, thumbnail image URL, and free charge category. The title is information on the title of the website collecting the content. The URL is URL information of content collected from the website.

説明文は、コンテンツの情報が収集されたウェブサイトに対して付与されたウェブサイトを説明する説明文である。この説明文の情報は、図示しないコンテンツ情報70の管理者の端末装置から受け付けた情報である。   The explanatory text is an explanatory text explaining a website given to the website from which the content information is collected. The information of the explanatory text is information received from the terminal device of the administrator of the content information 70 (not shown).

テキストデータは、ウェブサイトから取得したウェブサイト内のテキストデータであり、このテキストデータから形態素解析によりキーワードの情報が抽出される。キーワードは、テキストデータから抽出されたキーワードの情報であり、コンテンツの検索時に、ユーザから入力されたキーワードと照合されるものである。   The text data is text data in a website acquired from the website, and keyword information is extracted from the text data by morphological analysis. The keyword is keyword information extracted from the text data, and is collated with the keyword input by the user when searching for content.

サムネイル画像URLは、画像のコンテンツの情報を収集し、その画像に対応するサムネイル画像を生成して記憶した場合に、そのサムネイル画像の記憶位置を指定する情報である。有料無料区分は、情報を収集したコンテンツが有料コンテンツなのか、無料コンテンツなのかを示す情報である。   The thumbnail image URL is information that specifies the storage position of the thumbnail image when information on the content of the image is collected and a thumbnail image corresponding to the image is generated and stored. The paid free category is information indicating whether the content for which information is collected is paid content or free content.

図1の説明に戻ると、コンテンツ情報収集部505は、無料コンテンツサーバ装置20a,20bから無料で提供される無料コンテンツの情報を収集する。具体的には、コンテンツ情報収集部505は、図3で説明したタイトル、URL、テキストデータなどの情報を収集し、さらにコンテンツが画像である場合には、画像のデータを収集する。   Returning to the description of FIG. 1, the content information collection unit 505 collects information on free content provided free of charge from the free content server devices 20a and 20b. Specifically, the content information collection unit 505 collects information such as the title, URL, and text data described with reference to FIG. 3, and further collects image data when the content is an image.

また、コンテンツ情報収集部505は、ログイン管理部503が、有料コンテンツを提供する有料コンテンツサーバ装置30a,30bから有料コンテンツに対してアクセスを許可する情報を受信した場合に、有料コンテンツサーバ装置30a,30bから、有料コンテンツのタイトル、URL、テキストデータ、画像のデータなどの情報を収集する。   In addition, the content information collection unit 505, when the login management unit 503 receives information for permitting access to the paid content from the paid content server devices 30a and 30b that provide the paid content, Information such as the title, URL, text data, and image data of the paid content is collected from 30b.

インデックス作成部506は、コンテンツ情報収集部505により収集された情報から、図3に示したコンテンツ情報70を作成し、コンテンツ情報70をユーザの検索サイトユーザIDに対応付けてコンテンツ情報記憶部504に記憶する。   The index creation unit 506 creates the content information 70 shown in FIG. 3 from the information collected by the content information collection unit 505, and associates the content information 70 with the user search site user ID in the content information storage unit 504. Remember.

具体的には、インデックス作成部506は、ウェブサイトのタイトルやURL、テキストデータなどの情報をコンテンツ情報70に記憶するとともに、テキストデータから形態素解析によりキーワードの情報を抽出してコンテンツ情報70に記憶する。   Specifically, the index creation unit 506 stores information such as a website title, URL, and text data in the content information 70, and extracts keyword information from the text data by morphological analysis and stores it in the content information 70. To do.

また、インデックス作成部506は、画像のコンテンツの情報を収集した場合に、その画像に対応するサムネイル画像を生成して記憶し、そのサムネイル画像の記憶位置をコンテンツ情報70に登録する。   Further, when the information of the image content is collected, the index creating unit 506 generates and stores a thumbnail image corresponding to the image, and registers the storage position of the thumbnail image in the content information 70.

また、インデックス作成部506は、無料コンテンツサーバ装置20a,20bから無料コンテンツの情報を収集した場合には、有料無料区分を無料に、有料コンテンツサーバ装置30a,30bから有料コンテンツの情報を収集した場合には、有料無料区分を有料に設定する。   In addition, when the index creation unit 506 collects information on free content from the free content server devices 20a and 20b, the index creation unit 506 collects information on paid content from the paid content server devices 30a and 30b free of charge. , Set the free charge category to pay.

さらに、インデックス作成部506は、コンテンツを説明する説明文の情報を図示しないコンテンツ情報70の管理者の端末装置から受け付けて、コンテンツ情報70に記憶する。   Further, the index creating unit 506 receives information on the explanatory text explaining the content from the terminal device of the administrator of the content information 70 (not shown) and stores it in the content information 70.

検索入出力制御部507は、ユーザ端末装置10a,10bから、コンテンツの検索要求をキーワードとともに受け付け、また、コンテンツの検索結果をユーザ端末装置10a,10bに出力する処理をおこなう。その際、検索入出力制御部507は、コンテンツ情報収集装置50が提供する検索サービスにユーザがログインした際に用いた検索サイトユーザIDの情報を取得する。   The search input / output control unit 507 receives a content search request from the user terminal devices 10a and 10b together with a keyword, and outputs the content search results to the user terminal devices 10a and 10b. At that time, the search input / output control unit 507 acquires information on the search site user ID used when the user logs in to the search service provided by the content information collection device 50.

コンテンツ検索部508は、ユーザ端末装置10a,10bから受け付けたキーワードに合致するコンテンツを、コンテンツ情報70を参照して検索し、検索入出力制御部507を介してユーザ端末装置10a,10bに検索結果を出力する。   The content search unit 508 searches the content information 70 for content that matches the keyword received from the user terminal devices 10a and 10b, and searches the user terminal devices 10a and 10b via the search input / output control unit 507 for search results. Is output.

具体的には、コンテンツ検索部508は、検索要求をおこなったユーザに対応するコンテンツ情報70をコンテンツ情報記憶部504から検索し、当該ユーザに対応するコンテンツ情報70に記憶されたコンテンツの情報から、キーワードに合致するコンテンツを検索し、検索結果を出力する。   Specifically, the content search unit 508 searches the content information storage unit 504 for content information 70 corresponding to the user who made the search request, and from the content information stored in the content information 70 corresponding to the user, Search for content that matches the keyword and output the search results.

その際、コンテンツ検索部508は、コンテンツ情報記憶部504に記憶されたコンテンツのタイトル、URL、説明文などの情報を検索結果として出力する。また、画像のコンテンツの検索を実行した場合には、そのサムネイル画像をさらに出力する。   At that time, the content search unit 508 outputs information such as the title, URL, and description of the content stored in the content information storage unit 504 as a search result. When a search for image content is executed, the thumbnail image is further output.

つぎに、実施例1に係る有料コンテンツ情報収集処理の処理手順について説明する。図4は、実施例1に係る有料コンテンツ情報収集処理の処理手順を示すフローチャートである。   Next, a processing procedure of paid content information collection processing according to the first embodiment will be described. FIG. 4 is a flowchart illustrating a processing procedure of paid content information collection processing according to the first embodiment.

図4に示すように、まず、コンテンツ情報収集装置50のログイン管理部503は、ユーザが会員登録済みであるウェブサイトのURLの情報を、ユーザ情報60から読み込む(ステップS101)。   As shown in FIG. 4, first, the login management unit 503 of the content information collection device 50 reads the URL information of the website that the user has registered as a member from the user information 60 (step S101).

続いて、ログイン管理部503は、ユーザ情報60からユーザが有料サイトにログインする際に必要となる有料サイトユーザIDおよび有料サイトユーザパスワードのログイン情報を読み込み(ステップS102)、ユーザが会員登録済みであるウェブサイトを提供している有料コンテンツサーバ装置30a,30bに読み込んだログイン情報を送信する(ステップS103)。   Subsequently, the login management unit 503 reads the login information of the pay site user ID and the pay site user password required when the user logs in to the pay site from the user information 60 (step S102), and the user has been registered as a member. The login information read is transmitted to the pay content server apparatuses 30a and 30b that provide a certain website (step S103).

その後、ログイン管理部503は、ログイン情報を送信した有料コンテンツサーバ装置30a,30bから、有料コンテンツへのアクセスを許可する情報を受信したか否かを調べる(ステップS104)。   Thereafter, the login management unit 503 checks whether information permitting access to the pay content has been received from the pay content server devices 30a and 30b that transmitted the login information (step S104).

そして、有料コンテンツへのアクセスを許可する情報を受信した場合には(ステップS104,Yes)、コンテンツ情報収集部505は、有料コンテンツの情報を収集し、さらにインデックス作成部506は、コンテンツ情報収集部505により収集された有料コンテンツの情報からコンテンツ情報70を作成してコンテンツ情報記憶部504にそれを記憶する(ステップS105)。   When the information permitting access to the pay content is received (step S104, Yes), the content information collection unit 505 collects the charge content information, and the index creation unit 506 further includes the content information collection unit. The content information 70 is created from the paid content information collected in 505 and stored in the content information storage unit 504 (step S105).

続いて、ログイン管理部503は、コンテンツ情報収集処理の終了要求をコンテンツ情報収集装置50の管理者などにより受け付けたか否かを調べ(ステップS106)、終了要求を受け付けた場合には(ステップS106,Yes)、この有料コンテンツ情報収集処理を終了する。   Subsequently, the login management unit 503 checks whether or not the content information collection processing termination request has been received by the administrator of the content information collection device 50 (step S106). If the termination request is received (step S106, Yes), this paid content information collection process is terminated.

ステップS104において、有料コンテンツへのアクセスが許可されなかった場合(ステップS104,No)、または、ステップS106において、コンテンツ情報収集処理の終了要求を受け付けていない場合には(ステップS106,No)、ログイン管理部503は、つぎの会員登録済みウェブサイトのURL情報を、ユーザ情報60から読み込む(ステップS107)。   If access to the paid content is not permitted in step S104 (step S104, No), or if the content information collection processing end request is not accepted in step S106 (step S106, No), login The management unit 503 reads the URL information of the next member registered website from the user information 60 (step S107).

そして、ログイン管理部503は、ログイン情報をまだ送信していないURL情報があるか否かを調べ(ステップS108)、ログイン情報が未送信であるURL情報がある場合には(ステップS108,Yes)、ステップS102に移行して、それ以後の処理を継続する。ログイン情報が未送信であるURL情報がない場合には(ステップS108,No)、そのままこのコンテンツ情報収集処理を終了する。   Then, the login management unit 503 checks whether there is URL information for which login information has not yet been transmitted (step S108), and if there is URL information for which login information has not yet been transmitted (step S108, Yes). Then, the process proceeds to step S102, and the subsequent processing is continued. If there is no URL information for which login information has not been transmitted (step S108, No), the content information collection process is terminated as it is.

上述してきたように、本実施例1では、ログイン管理部503が、アクセス制限がなされている有料サイト内のコンテンツの閲覧サービスを提供している有料コンテンツサーバ装置30a,30bに有料サイトへのアクセス制限を解除するログイン情報を送信し、送信されたログイン情報に応じて有料コンテンツサーバ装置30a,30bからアクセスを許可するアクセス許可情報を受信した場合に、コンテンツ情報収集部505が、有料コンテンツサーバ装置30a,30bから有料サイト内のコンテンツに係る情報を収集し、インデックス作成部506が、収集したコンテンツに係る情報を記憶することとしたので、アクセス制限がなされている有料サイトから効率的にコンテンツの情報を収集することができる。   As described above, in the first embodiment, the login management unit 503 accesses the pay site to the pay content server devices 30a and 30b that provide the content browsing service in the pay site where access is restricted. When the login information for releasing the restriction is transmitted, and the access permission information for permitting access is received from the paid content server devices 30a and 30b according to the transmitted login information, the content information collection unit 505 causes the paid content server device to 30a and 30b collect information related to the content in the paid site, and the index creation unit 506 stores the information related to the collected content. Information can be collected.

また、本実施例1では、ユーザ情報記憶部501が、アクセス制限を解除するログイン情報をユーザごとに記憶し、ログイン管理部503が、記憶された各ユーザのログイン情報を有料サイト内のコンテンツの閲覧サービスを提供している有料コンテンツサーバ装置30a,30bに送信し、コンテンツ情報収集部505が、有料コンテンツサーバ装置30a,30bから有料サイト内のコンテンツに係る情報を収集し、インデックス作成部506が、収集したコンテンツに係る情報を各ユーザに対応付けて記憶することとしたので、アクセス制限がなされている有料サイトから効率的にコンテンツの情報をユーザごとに収集し、ユーザごとに異なる検索結果を提供することができる。   Further, in the first embodiment, the user information storage unit 501 stores login information for releasing access restriction for each user, and the login management unit 503 stores the stored login information of each user for content in the pay site. The content information collection unit 505 collects information related to the content in the pay site from the pay content server devices 30a and 30b, and the index creation unit 506 transmits the information to the pay content server devices 30a and 30b that provide the browsing service. Since information related to the collected content is stored in association with each user, content information is efficiently collected for each user from a pay site with restricted access, and different search results are obtained for each user. Can be provided.

ここで、上記実施例1では、個々のユーザが会員登録をおこなっている有料サイトから有料コンテンツの情報を取得する場合を示したが、これに限定されず、有料サイトにアクセスする権利をユーザのグループが所有しており、グループごとに有料コンテンツを収集して、グループに属する各ユーザに有料コンテンツの検索サービスを提供することとしてもよい。   Here, in the first embodiment, the case where each user acquires information on the paid content from the paid site where the member has registered is shown, but the present invention is not limited to this, and the right to access the paid site is given by the user. It is good also as collecting paid content for every group, and providing a paid content search service to each user belonging to the group.

これは、具体的には、有料サイトの提供者が、コンテンツ情報収集装置50が提供するコンテンツ検索サービスに会員登録をおこなっているユーザに対して、有料コンテンツの検索を許可しているような場合である。また、上記グループとしては、特定の会社の社員や、ソーシャルネットワークなどにおける知人のグループなど、どのようなグループであってもよい。   Specifically, this is a case where the provider of the paid site permits the user who has registered as a member to the content search service provided by the content information collecting device 50 to search for the paid content. It is. The group may be any group such as an employee of a specific company or a group of acquaintances in a social network.

図5は、実施例1の変形例におけるユーザ情報60’の一例を示す図である。このユーザ情報60’は、図2に示したユーザ情報60の代わりにユーザ情報記憶部501に記憶されるものである。   FIG. 5 is a diagram illustrating an example of user information 60 ′ according to the modification of the first embodiment. This user information 60 'is stored in the user information storage unit 501 instead of the user information 60 shown in FIG.

図5に示すように、このユーザ情報60’は、検索サイトユーザID、検索サイトユーザパスワード、有料サイトURL、有料サイトグループIDおよび有料サイトグループパスワードの情報を記憶している。   As shown in FIG. 5, the user information 60 'stores information on a search site user ID, a search site user password, a pay site URL, a pay site group ID, and a pay site group password.

検索サイトユーザID、検索サイトユーザパスワードおよび有料サイトURLは、図2で説明したユーザ情報60における検索サイトユーザID、検索サイトユーザパスワードおよび有料サイトURLと同様のものである。   The search site user ID, the search site user password, and the pay site URL are the same as the search site user ID, the search site user password, and the pay site URL in the user information 60 described with reference to FIG.

有料サイトグループIDおよび有料サイトグループパスワードは、有料コンテンツの情報収集を許可されたグループ用に有料コンテンツサーバ装置30a,30bから有料コンテンツの情報を収集する際に、有料サイトにログインするためのIDおよびパスワードの情報である。図5に示すように、ユーザ情報60’には、1つのグループの情報に対して、複数のユーザの情報が対応付けて記憶されている。   The pay site group ID and the pay site group password are an ID for logging in to the pay site when collecting pay content information from the pay content server devices 30a and 30b for a group permitted to collect pay content information. Password information. As shown in FIG. 5, in the user information 60 ', information of a plurality of users is stored in association with information of one group.

この場合、ログイン管理部503は、ユーザ情報60’にURLが記憶された有料サイトを提供している有料コンテンツサーバ装置30a,30bに、有料サイトグループIDと有料サイトグループパスワードとを送信する。   In this case, the login management unit 503 transmits the pay site group ID and the pay site group password to the pay content server devices 30a and 30b providing the pay site whose URL is stored in the user information 60 '.

そして、ログイン管理部503は、有料サイトグループIDと有料サイトグループパスワードとを送信した有料コンテンツサーバ装置30a,30bから、有料コンテンツへのアクセスが許可されたことを示す情報を受信したか否かを調べ、その情報を受信した場合に、コンテンツ情報収集部505に有料コンテンツの情報を収集するよう要求する。   Then, the login management unit 503 determines whether or not information indicating that access to the pay content is permitted is received from the pay content server devices 30a and 30b that have transmitted the pay site group ID and the pay site group password. When the information is received, the content information collection unit 505 is requested to collect information on the paid content.

コンテンツ情報収集部505は、ログイン管理部503が有料コンテンツを提供する有料コンテンツサーバ装置30a,30bから、有料コンテンツに対してアクセスを許可する情報を受信した場合に、有料コンテンツサーバ装置30a,30bから有料コンテンツの情報を収集する。   The content information collection unit 505 receives information from the paid content server devices 30a and 30b when the login management unit 503 receives information from the paid content server devices 30a and 30b that provide the paid content. Collect paid content information.

そして、インデックス作成部506は、コンテンツ情報収集部505により収集された情報から、図3に示したようなコンテンツ情報70を作成する。ただし、この場合は、図3に示したタイトル、URL、説明文、テキストデータ、キーワード、サムネイル画像URLおよび有料無料区分の情報を各グループに対応付けて記憶する。また、インデックス作成部506は、各グループに属するユーザの情報を併せて記憶する。   Then, the index creation unit 506 creates the content information 70 as shown in FIG. 3 from the information collected by the content information collection unit 505. In this case, however, the title, URL, description, text data, keyword, thumbnail image URL, and chargeable free charge information shown in FIG. 3 are stored in association with each group. The index creation unit 506 also stores information on users belonging to each group.

ユーザからコンテンツの検索要求を受け付けた場合には、コンテンツ検索部508は、ユーザがどのグループに属しているかを判定し、判定の結果、抽出されたグループに対応し、かつ、ユーザにより入力されたキーワードに合致するコンテンツを、コンテンツ情報70を参照して検索する。   When a content search request is received from the user, the content search unit 508 determines to which group the user belongs, and as a result of the determination, corresponds to the extracted group and is input by the user The content matching the keyword is searched with reference to the content information 70.

なお、図5に示したユーザ情報60’は、グループに属する各ユーザが自分の情報をグループの情報に対応付けて記憶するようにしてもよいし、グループの情報を管理するユーザが、グループに属するユーザの情報を一括して記憶することとしてもよい。   The user information 60 ′ shown in FIG. 5 may be stored so that each user belonging to the group associates his / her information with the group information, or the user who manages the group information is stored in the group. It is good also as storing the information of the user to which it belongs collectively.

この場合、ユーザ情報管理部502は、ユーザからIDおよびパスワードの認証情報の入力を受け付けて、ユーザが、ユーザ情報60’に情報を記憶する権限があるか否かを認証する。そして、ユーザ情報管理部502は、ユーザの認証が成功した場合に、グループに属するユーザの情報を受け付けて、ユーザ情報60’にそれを記憶する。   In this case, the user information management unit 502 receives input of ID and password authentication information from the user, and authenticates whether the user has the authority to store information in the user information 60 '. Then, when the user authentication is successful, the user information management unit 502 receives information on users belonging to the group and stores the information in the user information 60 '.

グループが、ソーシャルネットワークにおける知人のグループなどである場合には、グループ内のユーザから紹介されたIDおよびパスワードを用いて、ユーザが自分の情報をユーザ情報60’に記憶することとしてもよい。   When the group is a group of acquaintances in a social network, the user may store his / her information in the user information 60 ′ using an ID and a password introduced by a user in the group.

上述してきたように、本実施例1の変形例では、コンテンツ情報収集部505が、ユーザが属するグループに応じて、有料サイトからコンテンツの情報をグループごとに収集することとしたので、ユーザが属するグループに応じて、アクセス制限がなされている有料サイトから効率的にコンテンツの情報を収集し、グループに応じたコンテンツの情報を検索結果として提供することができる。   As described above, in the modification of the first embodiment, the content information collection unit 505 collects content information for each group from the pay site according to the group to which the user belongs. According to the group, it is possible to efficiently collect the content information from the pay site where access is restricted, and to provide the content information according to the group as a search result.

また、本実施例1の変形例では、ユーザ情報管理部502が、ユーザがグループに属する正規ユーザであるか否かを認証する認証情報を受け付けてユーザの認証をおこない、ユーザがグループに属する正規ユーザであることが認証された場合に、アクセス制限を解除するログイン情報をユーザから受け付けて、受け付けたログイン情報をユーザ情報記憶部501にユーザに対応付けて記憶することとしたので、ユーザが認証情報を取得している場合に、アクセス制限がなされている有料サイトからコンテンツの情報を収集するようユーザが設定することができる。   In the modification of the first embodiment, the user information management unit 502 accepts authentication information for authenticating whether or not the user is a regular user belonging to the group, authenticates the user, and the user authenticates to the group. When the user is authenticated, the login information for canceling the access restriction is received from the user, and the received login information is stored in the user information storage unit 501 in association with the user. When the information is acquired, the user can set the content information to be collected from the pay site where access is restricted.

ところで、上記実施例1では、ユーザが会員登録をしている有料サイトのコンテンツ情報を収集する場合を示したが、コンテンツ検索サービスにおけるユーザの会員種別ごとに異なるコンテンツの情報を収集することとしてもよい。そこで、実施例2では、ユーザの会員種別ごとに異なるコンテンツの情報を収集する場合について説明する。   By the way, in the first embodiment, the case is shown in which the content information of the pay site where the user is registered as a member is collected. However, it is also possible to collect different content information for each user member type in the content search service. Good. Thus, in the second embodiment, a case will be described in which information on contents different for each member type of the user is collected.

ここでは、ユーザの会員種別として、プレミア会員、有料会員、無料会員の3つを考慮する。プレミア会員および有料会員は、コンテンツ検索サービスの利用料金を支払っている会員である。特に、プレミア会員は、有料会員よりも高額の利用料金を支払っており、有料会員よりも質の高いサービスを受けることができる会員である。無料会員は、コンテンツ検索サービスの利用料金を支払っていない会員である。   Here, three types of user membership are considered: a premium member, a paid member, and a free member. Premier members and paying members are members who have paid for using the content search service. In particular, a premium member is a member who pays a higher usage fee than a paying member and can receive a higher quality service than a paying member. A free member is a member who has not paid the usage fee for the content search service.

このように、会員種別ごとに検索用に収集するコンテンツを変更し、会員種別ごとに収集したコンテンツの中からコンテンツの検索をおこなうことにより、ユーザに、無料会員から有料会員へ、また、有料会員からプレミア会員へと、より上位の会員種別に登録するようインセンティブを与えることができる。   In this way, by changing the content to be collected for search for each member type and searching the content from the content collected for each member type, the user can be changed from a free member to a paid member, or a paid member. An incentive can be given to register for a higher-level membership type from a premier member to a premier member.

まず、実施例2に係るコンテンツ情報収集装置120の機能的構成について説明する。図6は、実施例2に係るコンテンツ情報収集装置120の機能的構成を示す図である。なお、以下では、図1で説明した機能部と同等の機能を有する機能部については、詳しい説明を省略する。   First, a functional configuration of the content information collection apparatus 120 according to the second embodiment will be described. FIG. 6 is a diagram illustrating a functional configuration of the content information collection apparatus 120 according to the second embodiment. In the following, detailed description of functional units having functions equivalent to the functional units described in FIG. 1 is omitted.

図6に示すように、このコンテンツ情報収集装置120は、インターネット110を介して、ユーザ端末装置80a,80b、無料コンテンツサーバ装置90a,90b、および、有料コンテンツサーバ装置100a,100bに接続されている。   As shown in FIG. 6, the content information collection device 120 is connected to user terminal devices 80a and 80b, free content server devices 90a and 90b, and paid content server devices 100a and 100b via the Internet 110. .

ユーザ端末装置80a,80b、および、無料コンテンツサーバ装置90a,90bは、図1で説明したユーザ端末装置10a,10b、および、無料コンテンツサーバ装置20a,20bと同等のものである。   The user terminal devices 80a and 80b and the free content server devices 90a and 90b are equivalent to the user terminal devices 10a and 10b and the free content server devices 20a and 20b described in FIG.

有料コンテンツサーバ装置100a,100bは、ログイン情報を受信した際、ログイン情報の認証をおこない、ログイン情報が認証された場合に、ウェブサイト内の有料コンテンツに対するアクセスを許可するとともに、有料コンテンツサーバ装置100a,100bにログイン情報を送信した装置に対して、有料コンテンツへのアクセスを許可することを示す情報を送信する。   The paid content server devices 100a and 100b authenticate the login information when receiving the login information. When the login information is authenticated, the paid content server devices 100a and 100b permit access to the paid content in the website, and the paid content server device 100a. , 100b, information indicating that access to the paid content is permitted is transmitted to the device that has transmitted the login information.

コンテンツ情報収集装置120は、無料コンテンツサーバ装置90a,90b、および、有料コンテンツサーバ装置100a,100bからコンテンツの情報を収集して記憶し、ユーザ端末装置80a,80bからコンテンツの検索要求をキーワードとともに受け付けた場合に、キーワードに合致するコンテンツの情報を検索して、ユーザ端末装置80a,80bに出力する処理をおこなう。   The content information collection device 120 collects and stores content information from the free content server devices 90a and 90b and the pay content server devices 100a and 100b, and accepts content search requests from the user terminal devices 80a and 80b together with keywords. If the content information matches the keyword, the content information matching the keyword is retrieved and output to the user terminal devices 80a and 80b.

有料コンテンツサーバ装置100a,100bからコンテンツの情報を収集する際には、コンテンツ情報収集装置120は、その有料コンテンツサーバ装置100a,100bにユーザの会員種別に応じたログイン情報を送信し、それに応じて有料コンテンツサーバ装置100a,100bからアクセスを許可するアクセス許可情報を受信した場合に、有料コンテンツサーバ装置100a,100bにアクセスし、有料コンテンツの情報を収集してデータベースに記憶する。   When collecting content information from the paid content server apparatuses 100a and 100b, the content information collecting apparatus 120 transmits login information corresponding to the member type of the user to the paid content server apparatuses 100a and 100b, and accordingly. When access permission information permitting access is received from the pay content server apparatuses 100a and 100b, the pay content server apparatuses 100a and 100b are accessed, and information on the pay contents is collected and stored in the database.

図6に示すように、このコンテンツ情報収集装置120は、通信部1200、ユーザ情報記憶部1201、ユーザ情報管理部1202、有料サイト情報記憶部1203、有料サイト情報管理部1204、ログイン管理部1205、コンテンツ情報記憶部1206、コンテンツ情報収集部1207、インデックス作成部1208、検索入出力制御部1209およびコンテンツ検索部1210を有する。   As shown in FIG. 6, the content information collection device 120 includes a communication unit 1200, a user information storage unit 1201, a user information management unit 1202, a pay site information storage unit 1203, a pay site information management unit 1204, a login management unit 1205, A content information storage unit 1206, a content information collection unit 1207, an index creation unit 1208, a search input / output control unit 1209, and a content search unit 1210 are included.

通信部1200は、図1で説明した通信部500と同等のものである。ユーザ情報記憶部1201は、ハードディスク装置などの記憶デバイスであり、ユーザの会員種別などの情報を記憶する。図7は、図6に示したユーザ情報記憶部1201が記憶するユーザ情報130の一例を示す図である。   The communication unit 1200 is equivalent to the communication unit 500 described with reference to FIG. The user information storage unit 1201 is a storage device such as a hard disk device, and stores information such as the user membership type. FIG. 7 is a diagram illustrating an example of user information 130 stored in the user information storage unit 1201 illustrated in FIG.

図7に示すように、このユーザ情報130は、検索サイトユーザID、検索サイトユーザパスワードおよび会員種別の情報を記憶している。検索サイトユーザIDおよび検索サイトユーザパスワードは、コンテンツ情報収集装置120がユーザに提供する検索サービスにログインするためのユーザIDおよびパスワードの情報である。会員種別は、コンテンツ情報収集装置120が提供している検索サービスにおけるユーザの会員種別の情報である。   As shown in FIG. 7, this user information 130 stores information on a search site user ID, a search site user password, and a member type. The search site user ID and the search site user password are information on a user ID and a password for logging in to a search service provided to the user by the content information collection device 120. The member type is information on the user's member type in the search service provided by the content information collection device 120.

図6の説明に戻ると、ユーザ情報管理部1202は、検索サイトユーザIDや検索サイトユーザパスワード、会員種別の情報をユーザ情報記憶部1201にユーザ情報130として記憶したり、ユーザ情報130として記憶された情報を更新したりする処理をおこなう。   Returning to the description of FIG. 6, the user information management unit 1202 stores the search site user ID, the search site user password, and the member type information in the user information storage unit 1201 as the user information 130 or is stored as the user information 130. Update the information.

有料サイト情報記憶部1203は、ハードディスク装置などの記憶デバイスであり、会員種別ごとにコンテンツの情報を収集する有料サイトの情報を記憶する。図8は、図6に示した有料サイト情報記憶部1203が記憶する有料サイト情報140の一例を示す図である。   The pay site information storage unit 1203 is a storage device such as a hard disk device, and stores pay site information for collecting content information for each member type. FIG. 8 is a diagram illustrating an example of the pay site information 140 stored in the pay site information storage unit 1203 illustrated in FIG.

図8に示すように、この有料サイト情報140は、会員種別、有料サイトURL、有料サイトログインIDおよび有料サイトパスワードの情報が記憶されている。会員種別は、検索サービスにおけるユーザの会員種別の情報である。有料サイトURLは、会員種別ごとにコンテンツの情報を収集する有料サイトのURLの情報である。   As shown in FIG. 8, the pay site information 140 stores information on a member type, a pay site URL, a pay site login ID, and a pay site password. The member type is information on the user's member type in the search service. The paid site URL is URL information of a paid site that collects content information for each member type.

有料サイトログインIDおよび有料サイトパスワードは、有料サイトURLに記憶された有料サイトにログインするために用いられるログインIDおよびパスワードの情報である。   The pay site login ID and the pay site password are information of a login ID and a password used for logging in to the pay site stored in the pay site URL.

図6の説明に戻ると、有料サイト情報管理部1204は、会員種別や有料サイトURL、有料サイトログインID、有料サイトパスワードの情報を有料サイト情報記憶部1203に有料サイト情報140として記憶したり、有料サイト情報140として記憶された情報を更新したりする処理をおこなう。   Returning to the description of FIG. 6, the pay site information management unit 1204 stores the member type, the pay site URL, the pay site login ID, and the pay site password information as the pay site information 140 in the pay site information storage unit 1203. The information stored as the paid site information 140 is updated.

ログイン管理部1205は、有料サイトに対するログイン処理を管理する。具体的には、ログイン管理部1205は、ユーザ情報管理部1202を介して、ユーザ情報記憶部1201からユーザ情報130を読み出し、各ユーザの会員種別の情報を取得する。   The login management unit 1205 manages login processing for a pay site. Specifically, the login management unit 1205 reads the user information 130 from the user information storage unit 1201 via the user information management unit 1202 and acquires information on the membership type of each user.

また、ログイン管理部1205は、有料サイト情報管理部1204を介して、有料サイト情報記憶部1203から有料サイト情報140を読み出し、ユーザの会員種別に対応する有料サイトの情報を取得する。   Also, the login management unit 1205 reads the pay site information 140 from the pay site information storage unit 1203 via the pay site information management unit 1204, and acquires information on the pay site corresponding to the user's membership type.

そして、ログイン管理部1206は、有料サイト情報140にURLが記憶された有料サイトを提供している有料コンテンツサーバ装置100a,100bに、有料サイトログインIDと有料サイトパスワードとを送信する。   Then, the login management unit 1206 transmits the pay site login ID and the pay site password to the pay content server devices 100a and 100b that provide the pay site whose URL is stored in the pay site information 140.

さらに、ログイン管理部1206は、有料サイトログインIDと有料サイトパスワードとを送信した有料コンテンツサーバ装置100a,100bから、有料コンテンツへのアクセスが許可されたことを示す情報を受信したか否かを調べ、その情報を受信した場合に、コンテンツ情報収集部1207に有料コンテンツの情報を収集するよう要求する。   Further, the login management unit 1206 checks whether information indicating that access to the pay content is permitted is received from the pay content server apparatuses 100a and 100b that have transmitted the pay site login ID and the pay site password. When the information is received, the content information collecting unit 1207 is requested to collect the paid content information.

コンテンツ情報記憶部1206は、ハードディスク装置などの記憶デバイスであり、無料コンテンツサーバ装置90a,90b、および、有料コンテンツサーバ装置100a,100bから収集したコンテンツの情報を、図3に示したようなコンテンツ情報として記憶する。   The content information storage unit 1206 is a storage device such as a hard disk device, and content information collected from the free content server devices 90a and 90b and the pay content server devices 100a and 100b is content information as shown in FIG. Remember as.

ここで、コンテンツ情報は、会員種別ごとに記憶されるものである。すなわち、コンテンツ情報は、各会員種別に対して作成され、作成されたコンテンツ情報がユーザ情報130に記憶された会員種別に対応付けられて、コンテンツ情報記憶部1206に記憶される。   Here, the content information is stored for each member type. That is, content information is created for each member type, and the created content information is associated with the member type stored in the user information 130 and stored in the content information storage unit 1206.

コンテンツ情報収集部1207は、無料コンテンツサーバ装置90a,90bから無料で提供される無料コンテンツの情報を収集する。また、コンテンツ情報収集部1207は、ログイン管理部1205が、有料コンテンツを提供する有料コンテンツサーバ装置100a,100bから有料コンテンツに対してアクセスを許可する情報を受信した場合に、有料コンテンツサーバ装置100a,100bから、有料コンテンツの情報を収集する。   The content information collection unit 1207 collects information on free content provided free of charge from the free content server devices 90a and 90b. In addition, the content information collection unit 1207, when the login management unit 1205 receives information that permits access to the pay content from the pay content server devices 100a and 100b that provide the pay content, the pay content server device 100a, Information on paid content is collected from 100b.

インデックス作成部1208は、コンテンツ情報収集部1207により収集された情報から、図3に示したようなコンテンツ情報を作成し、コンテンツ情報を会員種別に対応付けてコンテンツ情報記憶部1206に記憶する。   The index creation unit 1208 creates content information as shown in FIG. 3 from the information collected by the content information collection unit 1207, and stores the content information in the content information storage unit 1206 in association with the member type.

検索入出力制御部1209は、ユーザ端末装置80a,80bから、コンテンツの検索要求をキーワードとともに受け付け、また、コンテンツの検索結果をユーザ端末装置80a,80bに出力する処理をおこなう。   The search input / output control unit 1209 receives a content search request from the user terminal devices 80a and 80b together with a keyword, and outputs the content search result to the user terminal devices 80a and 80b.

その際、検索入出力制御部1209は、コンテンツ情報収集装置120が提供する検索サービスにユーザがログインした際に用いた検索サイトユーザIDの情報を取得する。そして、検索入出力制御部1209は、ユーザ情報130を参照してユーザの会員種別を判定する処理をおこなう。   At that time, the search input / output control unit 1209 acquires information on the search site user ID used when the user logs in to the search service provided by the content information collection device 120. Then, the search input / output control unit 1209 performs a process of referring to the user information 130 to determine the user membership type.

コンテンツ検索部1210は、ユーザ端末装置80a,80bから受け付けたキーワードに合致するコンテンツをコンテンツ情報記憶部1206に記憶されたコンテンツ情報を参照して検索し、検索入出力制御部1209を介してユーザ端末装置80a,80bに検索結果を出力する。   The content search unit 1210 searches the content information stored in the content information storage unit 1206 for content that matches the keyword received from the user terminal devices 80a and 80b, and the user terminal via the search input / output control unit 1209. The search results are output to the devices 80a and 80b.

具体的には、コンテンツ検索部1210は、検索要求をおこなったユーザの会員種別に対応するコンテンツ情報をコンテンツ情報記憶部1206から検索し、当該ユーザの会員種別に対応するコンテンツの情報から、キーワードに合致するコンテンツを検索し、検索結果を出力する。   Specifically, the content search unit 1210 searches the content information storage unit 1206 for content information corresponding to the member type of the user who made the search request, and uses the content information corresponding to the user type of the user as a keyword. Search for matching content and output search results.

つぎに、実施例2に係る有料コンテンツ情報収集処理の処理手順について説明する。図9は、実施例2に係る有料コンテンツ情報収集処理の処理手順を示すフローチャートである。   Next, a processing procedure of paid content information collection processing according to the second embodiment will be described. FIG. 9 is a flowchart illustrating a processing procedure of paid content information collection processing according to the second embodiment.

図9に示すように、まず、コンテンツ情報収集装置120のログイン管理部1205は、ユーザの会員種別の情報をユーザ情報130から読み込み(ステップS201)、ユーザの会員種別に対応する有料サイトのURL情報を有料サイト情報140から読み込む(ステップS202)。   As shown in FIG. 9, first, the login management unit 1205 of the content information collection device 120 reads user member type information from the user information 130 (step S <b> 201), and URL information of the pay site corresponding to the user member type. Is read from the pay site information 140 (step S202).

続いて、ログイン管理部1205は、会員種別に対応する有料サイトにログインするための有料サイトログインIDおよび有料サイトログインパスワードのログイン情報を有料サイト情報140から読み込む(ステップS203)。   Subsequently, the login management unit 1205 reads the pay site login ID and the login information of the pay site login password for logging in to the pay site corresponding to the member type from the pay site information 140 (step S203).

そして、ログイン管理部1205は、読み込んだログイン情報を、有料サイトを提供している有料コンテンツサーバ装置100a,100bに送信し(ステップS204)、ログイン情報を送信した有料コンテンツサーバ装置100a,100bから、有料コンテンツへのアクセスを許可する情報を受信したか否かを調べる(ステップS205)。   Then, the login management unit 1205 transmits the read login information to the pay content server apparatuses 100a and 100b that provide the pay site (step S204), and from the pay content server apparatuses 100a and 100b that transmitted the login information, It is checked whether information permitting access to the paid content has been received (step S205).

有料コンテンツへのアクセスを許可する情報を受信した場合には(ステップS205,Yes)、コンテンツ情報収集部1207は、有料コンテンツの情報を収集し、さらにインデックス作成部1208は、コンテンツ情報収集部1207により収集された有料コンテンツの情報からコンテンツ情報を作成し、会員種別に対応付けてコンテンツ情報記憶部1206に記憶する(ステップS206)。   When the information permitting access to the paid content is received (step S205, Yes), the content information collecting unit 1207 collects information on the paid content, and the index creating unit 1208 is further processed by the content information collecting unit 1207. Content information is created from the collected paid content information, and stored in the content information storage unit 1206 in association with the member type (step S206).

続いて、ログイン管理部1205は、コンテンツ情報収集処理の終了要求をコンテンツ情報収集装置120の管理者などにより受け付けたか否かを調べ(ステップS207)、終了要求を受け付けた場合には(ステップS207,Yes)、この有料コンテンツ情報収集処理を終了する。   Subsequently, the login management unit 1205 checks whether or not the content information collection processing termination request has been received by the administrator of the content information collection device 120 (step S207). If the termination request is received (step S207, Yes), this paid content information collection process is terminated.

ステップS205において、有料コンテンツへのアクセスが許可されなかった場合(ステップS205,No)、または、ステップS207において、コンテンツ情報収集処理の終了要求を受け付けていない場合には(ステップS207,No)、ログイン管理部1205は、つぎの会員登録済み有料サイトのURL情報を、有料サイト情報140から読み込む(ステップS208)。   If access to the paid content is not permitted in step S205 (step S205, No), or if a request to end the content information collection process is not accepted in step S207 (step S207, No), login The management unit 1205 reads URL information of the next member-registered pay site from the pay site information 140 (step S208).

そして、ログイン管理部1205は、ログイン情報をまだ送信していないURL情報があるか否かを調べ(ステップS209)、ログイン情報が未送信であるURL情報がある場合には(ステップS209,Yes)、ステップS203に移行して、それ以後の処理を継続する。ログイン情報が未送信であるURL情報がない場合には(ステップS209,No)、そのままこのコンテンツ情報収集処理を終了する。   Then, the login management unit 1205 checks whether there is URL information for which login information has not yet been transmitted (step S209). If there is URL information for which login information has not been transmitted (step S209, Yes). Then, the process proceeds to step S203, and the subsequent processing is continued. If there is no URL information for which login information has not been transmitted (No at Step S209), the content information collection process is terminated as it is.

なお、ここでは、ユーザの会員種別に応じてコンテンツを収集する有料サイトを選択することとしたが、これに限定されず、コンテンツ情報収集装置120が提供する検索サービスに対してユーザがユーザ登録をおこなうために支払っている会員登録料や、検索サービスの登録ユーザに対して与えられる特典ポイントなどの大小に応じてユーザを分類し、分類されたユーザごとにコンテンツを収集する有料サイトを選択することとしてもよい。   In this example, the pay site for collecting contents is selected according to the user's membership type. However, the present invention is not limited to this, and the user registers the user for the search service provided by the content information collecting apparatus 120. Classify users according to the size of membership registration fees paid to perform, privilege points given to registered users of search services, etc., and select paid sites that collect content for each classified user It is good.

上述してきたように、本実施例2では、コンテンツ情報収集部1207が、ユーザの会員種別に応じて、有料サイトからコンテンツの情報を会員種別ごとに収集することとしたので、ユーザの会員種別に応じて、アクセス制限がなされている有料サイトから効率的にコンテンツの情報を収集し、会員種別に応じたコンテンツの情報を検索結果として提供することができる。   As described above, in the second embodiment, the content information collection unit 1207 collects content information from the pay site for each member type according to the user's member type. Accordingly, it is possible to efficiently collect content information from a pay site where access is restricted, and to provide content information corresponding to the member type as a search result.

また、本実施例2では、コンテンツ情報収集部1207が、ユーザが支払った会員登録料に応じて、有料サイトからコンテンツの情報をユーザごとに収集することとしたので、ユーザが支払った会員登録料に応じて、アクセス制限がなされている有料サイトから効率的にコンテンツの情報を収集し、会員登録料に応じたコンテンツの情報を検索結果として提供することができる。   In the second embodiment, the content information collection unit 1207 collects content information for each user from the pay site according to the membership registration fee paid by the user. Accordingly, it is possible to efficiently collect content information from a pay site where access is restricted, and to provide content information corresponding to the membership registration fee as a search result.

また、本実施例2では、コンテンツ情報収集部1207が、ユーザが獲得した特典ポイントに応じて、有料サイトからコンテンツの情報をユーザごとに収集することとしたので、ユーザが獲得した特典ポイントに応じて、アクセス制限がなされている有料サイトから効率的にコンテンツの情報を収集し、特典ポイントに応じたコンテンツの情報を検索結果として提供することができる。   In the second embodiment, the content information collection unit 1207 collects content information for each user from the pay site according to the privilege points acquired by the user. Thus, it is possible to efficiently collect content information from a pay site where access is restricted, and to provide content information according to privilege points as a search result.

ここで、上記実施例2では、ユーザの会員種別に応じてコンテンツの情報を収集する有料サイトを選択したが、ユーザが無料会員である場合には、有料コンテンツを紹介する紹介情報のみを検索用に収集することとしてもよい。   Here, in the second embodiment, a paid site for collecting content information is selected according to the user's membership type. However, if the user is a free member, only introduction information for introducing paid content is used for searching. It is good also as collecting.

たとえば、紹介情報として、有料サイト内にある画像の数などの情報を収集し、無料会員に対しては、画像の検索時に、サムネイル画像などの画像の情報を提供するのではなく、キーワードに合致する有料サイト内の画像の数などの情報を提供する。有料会員またはプレミア会員に対しては、有料サイト内の画像に対応するサムネイル画像を検索結果として出力する。   For example, we collect information such as the number of images in the paid site as introduction information, and do not provide image information such as thumbnail images to free members when searching for images. Provide information such as the number of images in a paid site. For paying members or premier members, thumbnail images corresponding to images on the pay site are output as search results.

このように、無料会員と、有料会員またはプレミア会員との間で検索できるコンテンツに格差を設けることにより、ユーザに、無料会員から有料会員またはプレミア会員へと、上位の会員種別に登録するようインセンティブを与えることができる。   In this way, users can be incentivized to register from the free member to the paid member or the premium member in the top member type by creating a disparity in the content that can be searched between the free member and the paid member or premium member. Can be given.

図10は、実施例2の変形例に係る有料コンテンツ情報収集処理の処理手順を示すフローチャートである。図10の各処理手順は、図9に示したステップS206の処理に置き換えられるものである。   FIG. 10 is a flowchart illustrating a processing procedure of paid content information collection processing according to a modification of the second embodiment. Each processing procedure in FIG. 10 is replaced with the processing in step S206 shown in FIG.

図10に示すように、コンテンツ情報収集装置120のコンテンツ情報収集部1207は、ユーザ情報130を参照して、現在コンテンツの情報を収集している対象ユーザが無料会員であるか否かを調べる(ステップS301)。   As shown in FIG. 10, the content information collection unit 1207 of the content information collection device 120 refers to the user information 130 to check whether or not the target user currently collecting content information is a free member ( Step S301).

そして、ユーザが無料会員でない場合には(ステップS301,No)、コンテンツ情報収集部1207は、有料コンテンツの情報を収集し、さらにインデックス作成部1208は、コンテンツ情報収集部1207により収集された有料コンテンツの情報から、図3に示したようなコンテンツ情報を作成してコンテンツ情報記憶部1206にそれを記憶して(ステップS302)、この有料コンテンツ情報収集処理を終了する。   If the user is not a free member (No in step S301), the content information collection unit 1207 collects information on the paid content, and the index creation unit 1208 further collects the paid content collected by the content information collection unit 1207. The content information as shown in FIG. 3 is created from the information and stored in the content information storage unit 1206 (step S302), and the paid content information collection process is terminated.

ユーザが無料会員である場合には(ステップS301,Yes)、コンテンツ情報収集部1207は、有料コンテンツのタイトルやURL、テキストデータなどの情報を収集するとともに、有料サイトに含まれる画像の数などの情報を収集し、インデックス作成部1208は、コンテンツ情報収集部1207により収集されたテキストデータから形態素解析によりキーワードの情報を抽出して、抽出したキーワードを収集した情報とともにコンテンツ情報記憶部1206に記憶して(ステップS303)、この有料コンテンツ情報収集処理を終了する。   When the user is a free member (step S301, Yes), the content information collection unit 1207 collects information such as the title, URL, and text data of the paid content, and the number of images included in the paid site. The index creation unit 1208 collects information, extracts keyword information from the text data collected by the content information collection unit 1207 by morphological analysis, and stores the extracted keyword together with the collected information in the content information storage unit 1206. (Step S303), and the paid content information collection process is terminated.

そして、検索入出力制御部1209が、無料会員であるユーザから画像の検索要求をキーワードとともに受け付けた場合には、コンテンツ検索部1210は、そのキーワードに合致する画像の数などの情報を検索し、検索結果をユーザの操作するユーザ端末装置80a,80bに出力する。   When the search input / output control unit 1209 receives an image search request from a user who is a free member together with a keyword, the content search unit 1210 searches for information such as the number of images that match the keyword, The search result is output to the user terminal devices 80a and 80b operated by the user.

上述してきたように、本実施例2の変形例では、コンテンツ情報収集部1207が、ユーザの属性に係る情報に基づいて、有料コンテンツサーバ装置100a,100bから有料サイト内のコンテンツを紹介する紹介情報を収集し、インデックス作成部1208が、収集した紹介情報をユーザの属性に対応付けて記憶することとしたので、アクセス制限がなされている有料サイトから有料サイト内のコンテンツの情報とともに、コンテンツを紹介する紹介情報を効率的に収集し、ユーザの属性に応じてコンテンツの情報またはコンテンツの紹介情報を検索結果として提供することができる。   As described above, in the modification of the second embodiment, the content information collection unit 1207 introduces the content in the pay site from the pay content server devices 100a and 100b based on the information related to the user attribute. Since the index creation unit 1208 stores the collected introduction information in association with the user attribute, the content is introduced together with the information on the content in the pay site from the pay site where access is restricted. The introduction information to be collected can be efficiently collected, and the content information or the content introduction information can be provided as a search result according to the attribute of the user.

ところで、上記実施例1または2では、有料コンテンツの情報を収集する有料サイトがあらかじめ登録されている場合を示したが、ウェブサイトの閲覧サービスを提供するサーバ装置から、そのウェブサイトが有料サイトか無料サイトかを示す情報を受信して、有料サイトである場合にログイン情報を送信し、その後、有料サイトのコンテンツの情報を収集することとしてもよい。   By the way, in the first embodiment or the second embodiment, a case where a paid site for collecting paid content information is registered in advance has been described. However, whether the website is a paid site from a server device that provides a website browsing service. Information indicating whether the site is a free site may be received, login information may be transmitted if the site is a paid site, and then content information of the paid site may be collected.

このようにウェブサイトの閲覧サービスを提供するサーバ装置からウェブサイトへのアクセス制限に係る情報を受信することにより、有料コンテンツの情報を収集する有料サイトの情報があらかじめ登録されていなくとも、有料コンテンツの情報を収集することができるようになる。そこで、実施例3では、ウェブサイトの閲覧サービスを提供するサーバ装置からウェブサイトへのアクセス制限に係る情報を受信する場合について説明する。   In this way, by receiving information related to access restrictions to the website from the server device that provides the website browsing service, even if the information on the paid site for collecting information on the paid content is not registered in advance, the paid content You will be able to collect information. Thus, in the third embodiment, a case will be described in which information related to access restriction to a website is received from a server device that provides a website browsing service.

まず、実施例3に係るコンテンツ情報収集装置190の機能的構成について説明する。図11は、実施例3に係るコンテンツ情報収集装置190の機能的構成を示す図である。なお、以下では、図1で説明した機能部と同等の機能を有する機能部については、詳しい説明を省略する。   First, the functional configuration of the content information collection apparatus 190 according to the third embodiment will be described. FIG. 11 is a diagram illustrating a functional configuration of the content information collection apparatus 190 according to the third embodiment. In the following, detailed description of functional units having functions equivalent to the functional units described in FIG. 1 is omitted.

図11に示すように、このコンテンツ情報収集装置190は、インターネット180を介して、ユーザ端末装置150a,150b、無料コンテンツサーバ装置160a,160b、および、有料コンテンツサーバ装置170a,170bに接続されている。   As shown in FIG. 11, the content information collection device 190 is connected to user terminal devices 150a and 150b, free content server devices 160a and 160b, and pay content server devices 170a and 170b via the Internet 180. .

ユーザ端末装置150a,150bは、図1で説明したユーザ端末装置10a,10bと同等のものである。無料コンテンツサーバ装置160a,160b、および、有料コンテンツサーバ装置170a,170bは、それぞれ無料および有料でウェブサイト内のコンテンツを公開しているサーバ装置である。   The user terminal devices 150a and 150b are equivalent to the user terminal devices 10a and 10b described in FIG. The free content server devices 160a and 160b and the pay content server devices 170a and 170b are server devices that publish the contents in the website for free and for a fee, respectively.

また、無料コンテンツサーバ装置160a,160b、および、有料コンテンツサーバ装置170a,170bは、コンテンツ情報収集装置190からアクセス制限の問い合わせを受け付けた場合に、アクセス制限をしているか否かの情報をコンテンツ情報収集装置190に送信する。   In addition, when the free content server apparatuses 160a and 160b and the pay content server apparatuses 170a and 170b receive an access restriction inquiry from the content information collection apparatus 190, the information indicating whether or not the access restriction is performed is the content information. Transmit to the collection device 190.

また、有料コンテンツサーバ装置170a,170bは、ログインIDやパスワードのログイン情報を受信した際、ログイン情報の認証をおこない、ログイン情報が認証された場合に、ウェブサイト内の有料コンテンツに対するアクセスを許可するとともに、ログイン情報を有料コンテンツサーバ装置170a,170bに送信した装置に対して、有料コンテンツへのアクセスを許可することを示す情報を送信する。   The paid content server apparatuses 170a and 170b authenticate the login information when receiving login information of login ID and password, and permit access to the paid content in the website when the login information is authenticated. At the same time, information indicating that access to the pay content is permitted is transmitted to the device that has transmitted the login information to the pay content server devices 170a and 170b.

コンテンツ情報収集装置190は、無料コンテンツサーバ装置160a,160b、および、有料コンテンツサーバ装置170a,170bからコンテンツの情報を収集して記憶し、ユーザ端末装置150a,150bからコンテンツの検索要求をキーワードとともに受け付けた場合に、キーワードに合致するコンテンツの情報を検索して、ユーザ端末装置150a,150bに出力する処理をおこなう。   The content information collection device 190 collects and stores content information from the free content server devices 160a and 160b and the pay content server devices 170a and 170b, and accepts content search requests from the user terminal devices 150a and 150b together with keywords. If the content information matches the keyword, the content information that matches the keyword is retrieved and output to the user terminal devices 150a and 150b.

無料コンテンツサーバ装置160a,160b、または、有料コンテンツサーバ装置170a,170bからコンテンツの情報を収集する際には、コンテンツ情報収集装置190は、無料コンテンツサーバ装置160a,160b、または、有料コンテンツサーバ装置170a,170bにアクセス制限の問い合わせをおこない、無料コンテンツサーバ装置160a,160b、または、有料コンテンツサーバ装置170a,170bからアクセス制限の有無の情報を受信する。   When collecting content information from the free content server devices 160a and 160b or the pay content server devices 170a and 170b, the content information collection device 190 is connected to the free content server devices 160a and 160b or the pay content server device 170a. , 170b and access restriction information is received from the free content server apparatuses 160a and 160b or the pay content server apparatuses 170a and 170b.

そして、コンテンツ情報収集装置190は、コンテンツを有料コンテンツサーバ装置170a,170bから収集する場合、すなわち、ウェブサイトに対するアクセス制限がある場合に、ログイン情報を有料コンテンツサーバ装置170a,170bに送信する。   Then, the content information collection device 190 transmits login information to the pay content server devices 170a and 170b when content is collected from the pay content server devices 170a and 170b, that is, when access to the website is restricted.

そして、コンテンツ情報収集装置190は、送信したログイン情報に応じて有料コンテンツサーバ装置170a,170bからアクセスを許可するアクセス許可情報を受信した場合に、有料コンテンツサーバ装置170a,170bにアクセスし、有料コンテンツの情報を収集してデータベースに記憶する。   When the content information collection device 190 receives access permission information permitting access from the pay content server devices 170a and 170b in accordance with the transmitted login information, the content information collection device 190 accesses the pay content server devices 170a and 170b, and pay content. Is collected and stored in the database.

図11に示すように、このコンテンツ情報収集装置190は、通信部1900、ログイン情報記憶部1901、ログイン情報管理部1902、ログイン管理部1903、コンテンツ情報記憶部1904、コンテンツ情報収集部1905、インデックス作成部1906、検索入出力制御部1907およびコンテンツ検索部1908を有する。   As shown in FIG. 11, the content information collection device 190 includes a communication unit 1900, a login information storage unit 1901, a login information management unit 1902, a login management unit 1903, a content information storage unit 1904, a content information collection unit 1905, an index creation. A search input / output control unit 1907 and a content search unit 1908.

通信部1900は、図1で説明した通信部500と同等のものである。ログイン情報記憶部1901は、有料コンテンツサーバ装置170a,170bにログインするためのログインIDおよびパスワードのログイン情報を記憶している。ここでは、ログイン情報は、各有料コンテンツサーバ装置170a,170bで共通のものとするが、有料コンテンツサーバ装置170a,170bで異なるログイン情報を用いることとしてもよい。   The communication unit 1900 is equivalent to the communication unit 500 described with reference to FIG. The login information storage unit 1901 stores login information of login ID and password for logging in to the pay content server apparatuses 170a and 170b. Here, the login information is common to each of the pay content server apparatuses 170a and 170b, but different login information may be used for the pay content server apparatuses 170a and 170b.

ログイン情報管理部1902は、ログインIDおよびパスワードのログイン情報をログイン情報記憶部1901に記憶したり、ログイン情報記憶部1901に記憶されたログイン情報を更新したりする処理をおこなう。   The login information management unit 1902 performs processing for storing login information of login ID and password in the login information storage unit 1901 and updating login information stored in the login information storage unit 1901.

ログイン管理部1903は、無料コンテンツサーバ装置160a,160b、および、有料コンテンツサーバ装置170a,170bに、ウェブサイトがアクセス制限をしている有料サイトか否かの問い合わせをおこなう。   The login management unit 1903 makes an inquiry to the free content server devices 160a and 160b and the pay content server devices 170a and 170b as to whether or not the website is a pay site with access restriction.

そして、ログイン管理部1903は、無料コンテンツサーバ装置160a,160b、および、有料コンテンツサーバ装置170a,170bから、ウェブサイトがアクセス制限をおこなっている有料サイトか否かの情報を受信し、有料サイトであることを示す情報を受信した場合には、その情報を送信した有料コンテンツサーバ装置170a,170bにログイン情報を送信する。   The login management unit 1903 receives information from the free content server devices 160a and 160b and the pay content server devices 170a and 170b as to whether or not the website is a pay site where access is restricted. When the information indicating the presence is received, the login information is transmitted to the pay content server apparatuses 170a and 170b that transmitted the information.

さらに、ログイン管理部1903は、ログイン情報を送信した有料コンテンツサーバ装置170a,170bから、有料コンテンツへのアクセスが許可されたことを示す情報を受信したか否かを調べ、その情報を受信した場合に、コンテンツ情報収集部1905に有料コンテンツの情報を収集するよう要求する。   Further, the login management unit 1903 checks whether or not information indicating that access to the paid content is permitted is received from the paid content server apparatuses 170a and 170b that transmitted the login information, and receives the information. In addition, the content information collection unit 1905 is requested to collect information on the paid content.

コンテンツ情報記憶部1904は、ハードディスク装置などの記憶デバイスであり、無料コンテンツサーバ装置160a,160b、および、有料コンテンツサーバ装置170a,170bから収集したコンテンツの情報を、図3に示したようなコンテンツ情報として記憶する。   The content information storage unit 1904 is a storage device such as a hard disk device. Content information collected from the free content server devices 160a and 160b and the pay content server devices 170a and 170b is content information as shown in FIG. Remember as.

ここで、有料コンテンツサーバ装置170a,170bから収集したコンテンツの情報は、コンテンツ情報収集装置190が提供するコンテンツ検索サービスの登録ユーザ全員の検索用に用いられる。   Here, the content information collected from the pay content server apparatuses 170a and 170b is used for searching all registered users of the content search service provided by the content information collecting apparatus 190.

すなわち、ここでは、有料サイトを提供している提供者が、コンテンツ情報収集装置190が提供するコンテンツ検索サービスの登録ユーザ全員に有料コンテンツの検索を許可する場合を想定している。ただし、これに限定されず、実施例2で説明したように、会員種別などのユーザの属性に応じて、特定のユーザのみに有料コンテンツの検索を許可することとしてもよい。   That is, here, it is assumed that the provider who provides the pay site permits all registered users of the content search service provided by the content information collection device 190 to search for the pay content. However, the present invention is not limited to this, and as described in the second embodiment, only specific users may be allowed to search for paid content according to user attributes such as membership type.

コンテンツ情報収集部1905は、無料コンテンツサーバ装置160a,160bから無料で提供される無料コンテンツの情報を収集する。また、コンテンツ情報収集部1905は、ログイン管理部1903が、有料コンテンツサーバ装置170a,170bから有料コンテンツに対してアクセスを許可する情報を受信した場合に、有料コンテンツサーバ装置170a,170bから、有料コンテンツの情報を収集する。   The content information collection unit 1905 collects information on free content provided free of charge from the free content server devices 160a and 160b. Also, the content information collection unit 1905, when the login management unit 1903 receives information that permits access to the pay content from the pay content server devices 170a and 170b, the pay content server devices 170a and 170b. Collect information.

インデックス作成部1906は、コンテンツ情報収集部1905により収集された情報から、図3に示したようなコンテンツ情報を作成し、コンテンツ情報記憶部1904に記憶する。   The index creation unit 1906 creates content information as shown in FIG. 3 from the information collected by the content information collection unit 1905 and stores it in the content information storage unit 1904.

検索入出力制御部1907は、ユーザ端末装置150a,150bから、コンテンツの検索要求をキーワードとともに受け付け、また、コンテンツの検索結果をユーザ端末装置150a,150bに出力する処理をおこなう。   The search input / output control unit 1907 receives a content search request from the user terminal devices 150a and 150b together with a keyword, and outputs the content search result to the user terminal devices 150a and 150b.

コンテンツ検索部1908は、ユーザ端末装置150a,150bから受け付けたキーワードに合致するコンテンツをコンテンツ情報記憶部1904に記憶されたコンテンツ情報を参照して検索し、検索入出力制御部1907を介してユーザ端末装置150a,150bに検索結果を出力する。   The content search unit 1908 searches the content information stored in the content information storage unit 1904 for content that matches the keyword received from the user terminal devices 150a and 150b, and the user terminal via the search input / output control unit 1907. The search results are output to the devices 150a and 150b.

つぎに、実施例3に係るコンテンツ収集処理の処理手順について説明する。図12は、実施例3に係るコンテンツ収集処理の処理手順を示すフローチャートである。図12に示すように、コンテンツ情報収集装置190のログイン管理部1903は、ウェブサイトのURLの情報を取得する(ステップS401)。ログイン管理部1903は、このURLの情報を、任意のウェブサイトのHTML文書に記載されたリンクの情報から取得する。   Next, a processing procedure for content collection processing according to the third embodiment will be described. FIG. 12 is a flowchart illustrating a processing procedure of content collection processing according to the third embodiment. As illustrated in FIG. 12, the login management unit 1903 of the content information collection device 190 acquires website URL information (step S401). The login management unit 1903 acquires the URL information from the link information described in the HTML document of an arbitrary website.

そして、ログイン管理部1903は、URLの情報を取得したウェブサイトを提供している無料コンテンツサーバ装置150a,150b、または、有料コンテンツサーバ装置170a,170bに対して、ウェブサイトにアクセス制限があるか否かを問い合わせ、その問い合わせに応じて送信されたアクセス制限の有無の情報を取得する(ステップS402)。   Then, the login management unit 1903 has access restrictions to the free content server devices 150a and 150b or the paid content server devices 170a and 170b that provide the website from which the URL information is acquired. Whether or not there is an access restriction transmitted in response to the inquiry is acquired (step S402).

続いて、ログイン管理部1903は、ウェブサイトにアクセス制限があるか否かを調べ(ステップS403)、アクセス制限がない無料サイトの場合には(ステップS403,No)、コンテンツ情報収集部1905は、無料コンテンツの情報を収集し、さらにインデックス作成部1906は、コンテンツ情報収集部1905により収集された無料コンテンツの情報からコンテンツ情報を作成し、コンテンツ情報記憶部1904にそれを記憶する(ステップS407)。   Subsequently, the login management unit 1903 checks whether or not the website has access restrictions (step S403), and in the case of a free site without access restrictions (step S403, No), the content information collection unit 1905 The free content information is collected, and the index creation unit 1906 creates content information from the free content information collected by the content information collection unit 1905, and stores it in the content information storage unit 1904 (step S407).

続いて、ログイン管理部1203は、コンテンツ情報収集処理の終了要求をコンテンツ情報収集装置190の管理者などにより受け付けたか否かを調べ(ステップS408)、終了要求を受け付けた場合には(ステップS408,Yes)、この有料コンテンツ情報収集処理を終了する。   Subsequently, the login management unit 1203 checks whether or not the content information collection processing termination request has been received by the administrator of the content information collection device 190 (step S408). When the termination request is received (step S408, Yes), this paid content information collection process is terminated.

ステップS406において、有料コンテンツへのアクセスが許可されなかった場合(ステップS406,No)、または、ステップS408において、コンテンツ情報収集処理の終了要求を受け付けていない場合には(ステップS408,No)、ログイン管理部1903は、つぎのウェブサイトのURL情報を、ウェブサイトのHTML文書に記載されたリンクの情報から取得し(ステップS409)、まだアクセス制限情報を取得していないURLの情報があるか否かを調べる(ステップS410)。   If access to the paid content is not permitted in step S406 (step S406, No), or if a request to end the content information collection process is not accepted in step S408 (step S408, No), login The management unit 1903 acquires the URL information of the next website from the link information described in the HTML document of the website (step S409), and whether there is URL information for which access restriction information has not yet been acquired. (Step S410).

アクセス制限情報を取得していないURLの情報がある場合には(ステップS410,Yes)、ログイン管理部1903は、ステップS402に移行して、それ以後の処理を継続する。アクセス制限情報を取得していないURLの情報がない場合には(ステップS410,No)、そのままこのコンテンツ情報収集処理を終了する。   If there is URL information for which access restriction information has not been acquired (step S410, Yes), the login management unit 1903 proceeds to step S402 and continues the subsequent processing. If there is no URL information for which access restriction information has not been acquired (No at step S410), the content information collection process is terminated.

ステップS403において、ウェブサイトに対するアクセス制限がある有料サイトの場合には(ステップS403,Yes)、ログイン管理部1903は、有料サイトにログインするためのログイン情報をログイン情報記憶部1901から読み込む(ステップS404)。   In step S403, in the case of a pay site with access restrictions on the website (step S403, Yes), the login management unit 1903 reads login information for logging in to the pay site from the login information storage unit 1901 (step S404). ).

そして、ログイン管理部1903は、読み込んだログイン情報を有料サイトを提供している有料コンテンツサーバ装置170a,170bに送信し(ステップS405)、ログイン情報を送信した有料コンテンツサーバ装置170a,170bから、有料コンテンツへのアクセスを許可する情報を受信したか否かを調べる(ステップS406)。   Then, the login management unit 1903 transmits the read login information to the pay content server apparatuses 170a and 170b providing the pay site (step S405), and pays from the pay content server apparatuses 170a and 170b that transmitted the login information. It is checked whether information permitting access to the content has been received (step S406).

有料コンテンツへのアクセスを許可する情報を受信した場合には(ステップS406,Yes)、コンテンツ情報収集部1905は、有料コンテンツの情報を収集し、さらにインデックス作成部1906は、コンテンツ情報収集部1905により収集された有料コンテンツの情報から、図3に示したようなコンテンツ情報を作成してコンテンツ情報記憶部1904にそれを記憶し(ステップS407)、それ以降の処理を継続する。   When the information permitting access to the pay content is received (step S406, Yes), the content information collection unit 1905 collects the information of the pay content, and the index creation unit 1906 further includes the content information collection unit 1905. Content information as shown in FIG. 3 is created from the collected paid content information and stored in the content information storage unit 1904 (step S407), and the subsequent processing is continued.

上述してきたように、本実施例3では、ログイン管理部1903が、ウェブサイト内のコンテンツの閲覧サービスを提供している無料コンテンツサーバ装置160a,160b、または、有料コンテンツサーバ装置170a,170bから、ウェブサイト内のコンテンツに対するアクセス制限の有無に係る情報を取得し、有料コンテンツサーバ装置170a,170bにより有料サイト内のコンテンツに対するアクセス制限がなされている場合に、有料サイトへのアクセス制限を解除するログイン情報を送信することとしたので、アクセス制限がなされているか否かを確認し、アクセス制限がなされている場合に、アクセス制限がなされている有料サイトから効率的にコンテンツの情報を収集することができる。   As described above, in the third embodiment, the login management unit 1903 is configured to use the free content server devices 160a and 160b or the pay content server devices 170a and 170b that provide a browsing service for content in the website. Log-in that acquires information related to the presence or absence of access restrictions on the content in the website and removes the access restrictions on the pay site when the access to the content in the pay site is restricted by the pay content server devices 170a and 170b Since we decided to send information, we can check whether access restrictions have been made, and if access restrictions have been made, content information can be collected efficiently from paid sites with access restrictions. it can.

以上、上記実施例において、コンテンツ情報収集処理をコンピュータ上で実現する場合について説明してきたが、コンテンツ情報収集処理を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ、実行することによりコンテンツ情報収集処理を実現してもよい。   In the above embodiment, the case where the content information collecting process is realized on a computer has been described. However, a program for realizing the content information collecting process is recorded on a computer-readable recording medium, and the recording medium is recorded on the recording medium. The content information collection process may be realized by causing a computer to read and execute a recorded program.

図13は、コンテンツ情報収集処理を実現するコンピュータ200のハードウェア構成を示すブロック図である。図13に示すように、このコンピュータ200は、上記プログラムを実行するCPU210と、データを入力する入力装置220と、各種データを記憶するROM230と、演算パラメータ等を記憶するRAM240と、コンテンツ情報収集処理を実現するためのプログラムを記録した記録媒体300からプログラムを読み取る読取装置250と、ディスプレイ等の出力装置260と、ネットワーク400を介して他のコンピュータとの間でデータの授受をおこなうネットワークインターフェース270とが、バス280で接続された構成となっている。   FIG. 13 is a block diagram illustrating a hardware configuration of a computer 200 that realizes content information collection processing. As shown in FIG. 13, the computer 200 includes a CPU 210 that executes the program, an input device 220 that inputs data, a ROM 230 that stores various data, a RAM 240 that stores calculation parameters and the like, and content information collection processing A reading device 250 that reads a program from a recording medium 300 that records a program for realizing the above, an output device 260 such as a display, and a network interface 270 that exchanges data with other computers via the network 400 However, they are connected by a bus 280.

CPU210は、読取装置250を経由して記録媒体300に記録されているプログラムを読み込んだ後、プログラムを実行することにより、コンテンツ情報収集処理を実現する。なお、記録媒体300としては、光ディスク、フレキシブルディスク、CD−ROM、ハードディスク等が挙げられる。また、このプログラムは、ネットワーク400を介してコンピュータ200に導入することとしてもよい。   The CPU 210 implements content information collection processing by reading a program recorded on the recording medium 300 via the reading device 250 and then executing the program. Examples of the recording medium 300 include an optical disk, a flexible disk, a CD-ROM, and a hard disk. Further, this program may be installed in the computer 200 via the network 400.

さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施例にて実施されてもよいものである。   Although the embodiments of the present invention have been described so far, the present invention may be implemented in various different embodiments in addition to the above-described embodiments within the scope of the technical idea described in the claims. It ’s good.

たとえば、上記実施例では、URLなどのコンテンツの情報を収集し、収集したコンテンツの情報に基づいて検索をおこない、検索結果を出力することとしたが、本発明はこれに限定されるものではなく、コンテンツ自体を収集し、収集したコンテンツの中からユーザの属性情報に適合するコンテンツを検索し、検索したコンテンツを出力することとしてもよい。   For example, in the above embodiment, content information such as URL is collected, search is performed based on the collected content information, and the search result is output. However, the present invention is not limited to this. The content itself may be collected, content that matches the user's attribute information may be searched from the collected content, and the searched content may be output.

また、上記実施例では、キーワードに合致するコンテンツを検索することとしたが、本発明はこれに限定されるものではなく、たとえば、白黒の画像など、検索されるコンテンツが満足すべき条件の指定を受け付け、その条件を満足するコンテンツを検索することとしてもよい。   In the above embodiment, the content matching the keyword is searched. However, the present invention is not limited to this. For example, the specification of the condition that the searched content should satisfy, such as a black and white image. May be accepted and content satisfying the condition may be searched.

また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。   In addition, among the processes described in this embodiment, all or part of the processes described as being performed automatically can be performed manually, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method. In addition, the processing procedure, control procedure, specific name, and information including various data and parameters shown in the above-mentioned document and drawings can be arbitrarily changed unless otherwise specified.

また、図示したコンテンツ情報収集装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、コンテンツ情報収集装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。   Each component of the illustrated content information collection apparatus is functionally conceptual and does not necessarily need to be physically configured as illustrated. That is, the specific form of distribution / integration of the content information collection device is not limited to the one shown in the figure, and all or part of the content information collection device can be functionally or physically in arbitrary units depending on various loads and usage conditions. It can be configured to be distributed and integrated.

さらに、コンテンツ情報収集装置にて行なわれる処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。   Furthermore, the processing functions performed by the content information collection device can be realized in whole or in part by a CPU and a program that is analyzed and executed by the CPU, or can be realized as hardware by wired logic. .

以上のように、本発明にかかるコンテンツ情報収集装置、コンテンツ情報収集方法およびコンテンツ情報収集方法をコンピュータに実行させるコンテンツ情報収集プログラムは、アクセス制限がなされているウェブサイトから効率的にコンテンツの情報を収集することが必要なコンテンツ情報収集システムに有用である。   As described above, the content information collection apparatus, the content information collection method, and the content information collection program for causing a computer to execute the content information collection method according to the present invention efficiently retrieve content information from a website with restricted access. This is useful for a content information collection system that needs to be collected.

実施例1に係るコンテンツ情報収集装置の機能的構成を示す図である。It is a figure which shows the functional structure of the content information collection apparatus which concerns on Example 1. FIG. 図1に示したユーザ情報記憶部501が記憶するユーザ情報60の一例を示す図である。It is a figure which shows an example of the user information 60 which the user information storage part 501 shown in FIG. 1 memorize | stores. 図1に示したコンテンツ情報記憶部504が記憶するコンテンツ情報70の一例を示す図である。It is a figure which shows an example of the content information 70 which the content information storage part 504 shown in FIG. 1 memorize | stores. 実施例1に係る有料コンテンツ情報収集処理の処理手順を示すフローチャートである。6 is a flowchart illustrating a processing procedure of paid content information collection processing according to the first embodiment. 実施例1の変形例におけるユーザ情報60’の一例を示す図である。It is a figure which shows an example of the user information 60 'in the modification of Example 1. FIG. 実施例2に係るコンテンツ情報収集装置120の機能的構成を示す図である。It is a figure which shows the functional structure of the content information collection apparatus 120 which concerns on Example 2. FIG. 図6に示したユーザ情報記憶部1201が記憶するユーザ情報130の一例を示す図である。It is a figure which shows an example of the user information 130 which the user information storage part 1201 shown in FIG. 6 memorize | stores. 図6に示した有料サイト情報記憶部1203が記憶する有料サイト情報140の一例を示す図である。It is a figure which shows an example of the pay site information 140 which the pay site information storage part 1203 shown in FIG. 6 memorize | stores. 実施例2に係る有料コンテンツ情報収集処理の処理手順を示すフローチャートである。12 is a flowchart illustrating a processing procedure of paid content information collection processing according to the second embodiment. 実施例2の変形例に係る有料コンテンツ情報収集処理の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the pay content information collection process which concerns on the modification of Example 2. FIG. 実施例3に係るコンテンツ情報収集装置190の機能的構成を示す図である。It is a figure which shows the functional structure of the content information collection apparatus 190 which concerns on Example 3. FIG. 実施例3に係るコンテンツ収集処理の処理手順を示すフローチャートである。12 is a flowchart illustrating a processing procedure of content collection processing according to the third embodiment. コンテンツ情報収集処理を実現するコンピュータ200のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the computer 200 which implement | achieves content information collection processing.

符号の説明Explanation of symbols

10a,10b,80a,80b,150a,150b ユーザ端末装置
20a,20b,90a,90b,160a,160b 無料コンテンツサーバ装置
30a,30b,100a,100b,170a,170b 有料コンテンツサーバ装置
40,110,180 インターネット
50,120,190 コンテンツ情報収集装置
500,1200,1900 通信部
501,1201 ユーザ情報記憶部
502,1202 ユーザ情報管理部
503,1205,1903 ログイン管理部
504,1206,1904 コンテンツ情報記憶部
505,1207,1905 コンテンツ情報収集部
506,1208,1906 インデックス作成部
507,1209,1907 検索入出力制御部
508,1210,1908 コンテンツ検索部
60,60’,130 ユーザ情報
70 コンテンツ情報
1203 有料サイト情報記憶部
1204 有料サイト情報管理部
140 有料サイト情報
1901 ログイン情報記憶部
1902 ログイン情報管理部
10a, 10b, 80a, 80b, 150a, 150b User terminal device 20a, 20b, 90a, 90b, 160a, 160b Free content server device 30a, 30b, 100a, 100b, 170a, 170b Paid content server device 40, 110, 180 Internet 50, 120, 190 Content information collection device 500, 1200, 1900 Communication unit 501, 1201 User information storage unit 502, 1202 User information management unit 503, 1205, 1903 Login management unit 504, 1206, 1904 Content information storage unit 505, 1207 , 1905 Content information collection unit 506, 1208, 1906 Index creation unit 507, 1209, 1907 Search input / output control unit 508, 1210, 1908 Content search unit 60, 60 ', 130 User information 70 Content information 1203 Pay site information storage unit 1204 Pay site information management unit 140 Pay site information 1901 Login information storage unit 1902 Login information management unit

Claims (30)

ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置から該コンテンツに係る情報を収集するコンテンツ情報収集装置であって、
アクセス制限がなされているウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信する情報送信手段と、
前記情報送信手段により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を記憶するコンテンツ情報収集手段と、
を備えたことを特徴とするコンテンツ情報収集装置。
A content information collection device that collects information related to content from a server device that provides a browsing service for content in a website,
Information transmitting means for transmitting access restriction releasing information for releasing access restriction to the website to a server device that provides a browsing service of content in the website for which access restriction is made;
When access permission information permitting access is received from the server device according to the access restriction release information transmitted by the information transmitting means, information related to the content in the website is collected from the server device and collected. Content information collecting means for storing information relating to the content;
A content information collecting apparatus comprising:
前記情報送信手段は、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置からウェブサイト内のコンテンツに対するアクセス制限の有無に係る情報を取得し、該サーバ装置により提供されるウェブサイト内のコンテンツに対するアクセス制限がなされている場合に、当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信することを特徴とする請求項1に記載のコンテンツ情報収集装置。   The information transmitting means obtains information related to presence / absence of access restriction on the content in the website from the server device that provides the browsing service of the content in the website, and the information in the website provided by the server device 2. The content information collecting apparatus according to claim 1, wherein, when access restriction is made on content, access restriction release information for releasing access restriction to the website is transmitted. 前記アクセス制限を解除するアクセス制限解除情報をユーザごとに記憶する情報記憶手段をさらに備え、前記情報送信手段は、前記情報記憶手段により記憶された各ユーザのアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集手段は、該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザに対応付けて記憶することを特徴とする請求項1に記載のコンテンツ情報収集装置。   Information storage means for storing access restriction release information for releasing the access restriction for each user is further provided, and the information transmitting means stores the access restriction release information of each user stored in the information storage means in the content on the website. The content information collecting means collects information related to the content in the website from the server device and associates the information related to the collected content with each user. The content information collecting apparatus according to claim 1, wherein the content information collecting apparatus is stored. 前記情報記憶手段は、ユーザの属性に係る情報と前記アクセス制限を解除するアクセス制限解除情報とを対応付けて記憶し、前記情報送信手段は、各ユーザの属性に対応する前記情報記憶手段により記憶されたアクセス制限解除情報を抽出し、抽出されたアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集手段は、前記情報送信手段により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザの属性に対応付けて記憶することを特徴とする請求項3に記載のコンテンツ情報収集装置。   The information storage means stores information relating to user attributes and access restriction release information for releasing the access restriction in association with each other, and the information transmission means stores the information storage means corresponding to each user attribute. The extracted access restriction release information is extracted, the extracted access restriction release information is transmitted to a server device that provides a content browsing service in the website, and the content information collection means is transmitted by the information transmission means When access permission information permitting access is received from the server device according to the access restriction release information, information related to the content in the website is collected from the server device, and the information related to the collected content is 4. The content information collecting apparatus according to claim 3, wherein the content information collecting apparatus is stored in association with a user attribute. 前記情報記憶手段は、ユーザが正規ユーザであるか否かを認証する認証情報を受け付けてユーザの認証をおこない、ユーザが正規ユーザであることが認証された場合に、前記アクセス制限を解除するアクセス制限解除情報をユーザから受け付けて、受け付けたアクセス制限解除情報を該ユーザに対応付けて記憶することを特徴とする請求項3または4に記載のコンテンツ情報収集装置。   The information storage means accepts authentication information for authenticating whether or not the user is a regular user, authenticates the user, and accesses that release the access restriction when the user is authenticated as a regular user. 5. The content information collecting apparatus according to claim 3, wherein the restriction release information is received from a user, and the received access restriction release information is stored in association with the user. 前記コンテンツ情報収集手段は、前記情報記憶手段により記憶されたユーザの属性に係る情報に基づいて、前記サーバ装置からウェブサイト内のコンテンツを紹介する紹介情報を収集し、収集した紹介情報をユーザの属性に対応付けて記憶することを特徴とする請求項5に記載のコンテンツ情報収集装置。   The content information collecting means collects introduction information for introducing content in a website from the server device based on information relating to user attributes stored by the information storage means, and the collected introduction information is collected by the user. The content information collecting apparatus according to claim 5, wherein the content information collecting apparatus is stored in association with an attribute. 前記ユーザの属性に係る情報は、ユーザの会員種別の情報であることを特徴とする請求項5または6に記載のコンテンツ情報収集装置。   7. The content information collecting apparatus according to claim 5, wherein the information related to the user attribute is information on a user's membership type. 前記ユーザの属性に係る情報は、ユーザ登録に係る登録料の情報であることを特徴とする請求項5または6に記載のコンテンツ情報収集装置。   The content information collecting apparatus according to claim 5, wherein the information related to the user attribute is registration fee information related to user registration. 前記ユーザの属性に係る情報は、ユーザの特典ポイントの情報であることを特徴とする請求項5または6に記載のコンテンツ情報収集装置。   The content information collecting apparatus according to claim 5 or 6, wherein the information relating to the user attribute is information on a privilege point of the user. 前記ユーザの属性に係る情報は、ユーザが属するグループの情報であることを特徴とする請求項5または6に記載のコンテンツ情報収集装置。   7. The content information collecting apparatus according to claim 5, wherein the information related to the user attribute is information on a group to which the user belongs. ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置から該コンテンツに係る情報を収集するコンテンツ情報収集方法であって、
アクセス制限がなされているウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信する情報送信工程と、
前記情報送信工程により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を記憶するコンテンツ情報収集工程と、
を含んだことを特徴とするコンテンツ情報収集方法。
A content information collection method for collecting information related to content from a server device that provides a browsing service for content in a website,
An information transmission step of transmitting access restriction release information for releasing access restriction to the website to a server device that provides a browsing service of content in the website for which access restriction is made;
When access permission information permitting access is received from the server device according to the access restriction release information transmitted in the information transmission step, information related to the content in the website is collected from the server device and collected. A content information collecting step for storing information related to the content;
Content information collection method characterized by including
前記情報送信工程は、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置からウェブサイト内のコンテンツに対するアクセス制限の有無に係る情報を取得し、該サーバ装置により提供されるウェブサイト内のコンテンツに対するアクセス制限がなされている場合に、当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信することを特徴とする請求項11に記載のコンテンツ情報収集方法。   The information transmission step obtains information related to presence / absence of access restriction on the content in the website from the server device that provides the browsing service of the content in the website, and the information in the website provided by the server device 12. The content information collecting method according to claim 11, wherein access restriction release information for releasing access restriction to the website is transmitted when access restriction on the content is made. 前記アクセス制限を解除するアクセス制限解除情報をユーザごとに記憶する情報記憶工程をさらに含み、前記情報送信工程は、前記情報記憶工程により記憶された各ユーザのアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集工程は、該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザに対応付けて記憶することを特徴とする請求項11に記載のコンテンツ情報収集方法。   An information storage step of storing access restriction release information for releasing the access restriction for each user, wherein the information transmission step stores the access restriction release information of each user stored in the information storage step in the content on the website; The content information collecting step collects information related to the content in the website from the server device, and associates the information related to the collected content with each user. The content information collecting method according to claim 11, wherein the content information collecting method is stored. 前記情報記憶工程は、ユーザの属性に係る情報と前記アクセス制限を解除するアクセス制限解除情報とを対応付けて記憶し、前記情報送信工程は、各ユーザの属性に対応する前記情報記憶工程により記憶されたアクセス制限解除情報を抽出し、抽出されたアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集工程は、前記情報送信工程により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザの属性に対応付けて記憶することを特徴とする請求項13に記載のコンテンツ情報収集方法。   The information storage step stores information related to user attributes and access restriction release information for releasing the access restriction in association with each other, and the information transmission step stores the information according to the information storage step corresponding to each user attribute. The extracted access restriction release information is extracted, and the extracted access restriction release information is transmitted to a server device that provides a content browsing service in the website, and the content information collection step is transmitted by the information transmission step. When access permission information permitting access is received from the server device according to the access restriction release information, information related to the content in the website is collected from the server device, and the information related to the collected content is The content information collecting method according to claim 13, wherein the content information is stored in association with a user attribute. . 前記情報記憶工程は、ユーザが正規ユーザであるか否かを認証する認証情報を受け付けてユーザの認証をおこない、ユーザが正規ユーザであることが認証された場合に、前記アクセス制限を解除するアクセス制限解除情報をユーザから受け付けて、受け付けたアクセス制限解除情報を該ユーザに対応付けて記憶することを特徴とする請求項13または14に記載のコンテンツ情報収集方法。   The information storing step accepts authentication information for authenticating whether or not the user is a regular user, authenticates the user, and accesses that release the access restriction when the user is authenticated as a regular user. 15. The content information collecting method according to claim 13, wherein the restriction release information is received from a user, and the received access restriction release information is stored in association with the user. 前記コンテンツ情報収集工程は、前記情報記憶工程により記憶されたユーザの属性に係る情報に基づいて、前記サーバ装置からウェブサイト内のコンテンツを紹介する紹介情報を収集し、収集した紹介情報をユーザの属性に対応付けて記憶することを特徴とする請求項15に記載のコンテンツ情報収集方法。   The content information collection step collects introduction information for introducing content in a website from the server device based on information relating to the user attributes stored in the information storage step, and the collected introduction information is The content information collecting method according to claim 15, wherein the content information is stored in association with an attribute. 前記ユーザの属性に係る情報は、ユーザの会員種別の情報であることを特徴とする請求項15または16に記載のコンテンツ情報収集方法。   The content information collecting method according to claim 15 or 16, wherein the information relating to the user attribute is information on a user's membership type. 前記ユーザの属性に係る情報は、ユーザ登録に係る登録料の情報であることを特徴とする請求項15または16に記載のコンテンツ情報収集方法。   The content information collecting method according to claim 15 or 16, wherein the information related to the user attribute is information on a registration fee related to user registration. 前記ユーザの属性に係る情報は、ユーザの特典ポイントの情報であることを特徴とする請求項15または16に記載のコンテンツ情報収集方法。   The content information collecting method according to claim 15 or 16, wherein the information relating to the user attribute is information on a user's privilege points. 前記ユーザの属性に係る情報は、ユーザが属するグループの情報であることを特徴とする請求項15または16に記載のコンテンツ情報収集方法。   The content information collecting method according to claim 15 or 16, wherein the information related to the user attribute is information of a group to which the user belongs. ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置から該コンテンツに係る情報を収集するコンテンツ情報収集方法をコンピュータに実行させるコンテンツ情報収集プログラムであって、
アクセス制限がなされているウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信する情報送信工程と、
前記情報送信工程により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を記憶するコンテンツ情報収集工程と、
をコンピュータに実行させることを特徴とするコンテンツ情報収集プログラム。
A content information collection program for causing a computer to execute a content information collection method for collecting information related to content from a server device that provides a browsing service for content in a website,
An information transmission step of transmitting access restriction release information for releasing access restriction to the website to a server device that provides a browsing service of content in the website for which access restriction is made;
When access permission information permitting access is received from the server device according to the access restriction release information transmitted in the information transmission step, information related to the content in the website is collected from the server device and collected. A content information collecting step for storing information related to the content;
A content information collecting program for causing a computer to execute the above.
前記情報送信工程は、ウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置からウェブサイト内のコンテンツに対するアクセス制限の有無に係る情報を取得し、該サーバ装置により提供されるウェブサイト内のコンテンツに対するアクセス制限がなされている場合に、当該ウェブサイトへのアクセス制限を解除するアクセス制限解除情報を送信することを特徴とする請求項21に記載のコンテンツ情報収集プログラム。   The information transmission step obtains information related to presence / absence of access restriction on the content in the website from the server device that provides the browsing service of the content in the website, and the information in the website provided by the server device The content information collection program according to claim 21, wherein, when access restriction is made on content, access restriction release information for releasing access restriction to the website is transmitted. 前記アクセス制限を解除するアクセス制限解除情報をユーザごとに記憶する情報記憶工程をさらに含み、前記情報送信工程は、前記情報記憶工程により記憶された各ユーザのアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集工程は、該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザに対応付けて記憶することを特徴とする請求項21に記載のコンテンツ情報収集プログラム。   An information storage step of storing access restriction release information for releasing the access restriction for each user, wherein the information transmission step stores the access restriction release information of each user stored in the information storage step in the content on the website; The content information collecting step collects information related to the content in the website from the server device, and associates the information related to the collected content with each user. The content information collecting program according to claim 21, wherein the content information collecting program is stored. 前記情報記憶工程は、ユーザの属性に係る情報と前記アクセス制限を解除するアクセス制限解除情報とを対応付けて記憶し、前記情報送信工程は、各ユーザの属性に対応する前記情報記憶工程により記憶されたアクセス制限解除情報を抽出し、抽出されたアクセス制限解除情報をウェブサイト内のコンテンツの閲覧サービスを提供しているサーバ装置に送信し、前記コンテンツ情報収集工程は、前記情報送信工程により送信されたアクセス制限解除情報に応じて前記サーバ装置からアクセスを許可するアクセス許可情報を受信した場合に、当該サーバ装置からウェブサイト内のコンテンツに係る情報を収集し、収集したコンテンツに係る情報を各ユーザの属性に対応付けて記憶することを特徴とする請求項23に記載のコンテンツ情報収集プログラム。   The information storage step stores information related to user attributes and access restriction release information for releasing the access restriction in association with each other, and the information transmission step stores the information according to the information storage step corresponding to each user attribute. The extracted access restriction release information is extracted, and the extracted access restriction release information is transmitted to a server device that provides a content browsing service in the website, and the content information collection step is transmitted by the information transmission step. When access permission information permitting access is received from the server device according to the access restriction release information, information related to the content in the website is collected from the server device, and the information related to the collected content is 24. The content information collection program according to claim 23, which is stored in association with a user attribute. Grams. 前記情報記憶工程は、ユーザが正規ユーザであるか否かを認証する認証情報を受け付けてユーザの認証をおこない、ユーザが正規ユーザであることが認証された場合に、前記アクセス制限を解除するアクセス制限解除情報をユーザから受け付けて、受け付けたアクセス制限解除情報を該ユーザに対応付けて記憶することを特徴とする請求項23または24に記載のコンテンツ情報収集プログラム。   The information storing step accepts authentication information for authenticating whether or not the user is a regular user, authenticates the user, and accesses that release the access restriction when the user is authenticated as a regular user. The content information collection program according to claim 23 or 24, wherein restriction release information is received from a user, and the received access restriction release information is stored in association with the user. 前記コンテンツ情報収集工程は、前記情報記憶工程により記憶されたユーザの属性に係る情報に基づいて、前記サーバ装置からウェブサイト内のコンテンツを紹介する紹介情報を収集し、収集した紹介情報をユーザの属性に対応付けて記憶することを特徴とする請求項25に記載のコンテンツ情報収集プログラム。   The content information collection step collects introduction information for introducing content in a website from the server device based on information relating to the user attributes stored in the information storage step, and the collected introduction information is 26. The content information collection program according to claim 25, which is stored in association with an attribute. 前記ユーザの属性に係る情報は、ユーザの会員種別の情報であることを特徴とする請求項25または26に記載のコンテンツ情報収集プログラム。   27. The content information collection program according to claim 25 or 26, wherein the information relating to the user attribute is information of a user membership type. 前記ユーザの属性に係る情報は、ユーザ登録に係る登録料の情報であることを特徴とする請求項25または26に記載のコンテンツ情報収集プログラム。   27. The content information collection program according to claim 25 or 26, wherein the information related to the user attribute is registration fee information related to user registration. 前記ユーザの属性に係る情報は、ユーザの特典ポイントの情報であることを特徴とする請求項25または26に記載のコンテンツ情報収集プログラム。   27. The content information collection program according to claim 25 or 26, wherein the information related to the user attribute is information on a user privilege point. 前記ユーザの属性に係る情報は、ユーザが属するグループの情報であることを特徴とする請求項25または26に記載のコンテンツ情報収集プログラム。   27. The content information collection program according to claim 25 or 26, wherein the information related to the user attribute is information of a group to which the user belongs.
JP2004237266A 2004-08-17 2004-08-17 Search device Expired - Fee Related JP4589051B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004237266A JP4589051B2 (en) 2004-08-17 2004-08-17 Search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004237266A JP4589051B2 (en) 2004-08-17 2004-08-17 Search device

Publications (3)

Publication Number Publication Date
JP2006058948A true JP2006058948A (en) 2006-03-02
JP2006058948A5 JP2006058948A5 (en) 2007-10-04
JP4589051B2 JP4589051B2 (en) 2010-12-01

Family

ID=36106393

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004237266A Expired - Fee Related JP4589051B2 (en) 2004-08-17 2004-08-17 Search device

Country Status (1)

Country Link
JP (1) JP4589051B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008134966A (en) * 2006-11-29 2008-06-12 Sony Corp Data management server, data management system, data management method and program
JP2010122886A (en) * 2008-11-19 2010-06-03 Yahoo Japan Corp Information retrieving device, and information retrieval method and program
JP2012238050A (en) * 2011-05-10 2012-12-06 Hitachi Solutions Ltd Integrated retrieval device, integrated retrieval system, and integrated retrieval method
KR20140072075A (en) * 2011-10-03 2014-06-12 톰슨 라이센싱 Method and apparatus for processing content offers in a digital locker system
JP2015130154A (en) * 2013-12-06 2015-07-16 株式会社リコー Information processing device, program, and information management method
JP2017016446A (en) * 2015-07-02 2017-01-19 富士ゼロックス株式会社 Information processor and information processing program
JP2021002302A (en) * 2019-06-24 2021-01-07 エコノス株式会社 Search system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325269A (en) * 2000-05-15 2001-11-22 Internatl Business Mach Corp <Ibm> Website, information communication terminal, robot type retrieval engine response system, robot type retrieval engine registration method, storage medium and program transmitter
JP2001344245A (en) * 2000-03-29 2001-12-14 Fujitsu Ltd Information processor
JP2003030231A (en) * 2001-07-11 2003-01-31 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for providing document retrieval service and storage medium with document retrieval service program stored thereon

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344245A (en) * 2000-03-29 2001-12-14 Fujitsu Ltd Information processor
JP2001325269A (en) * 2000-05-15 2001-11-22 Internatl Business Mach Corp <Ibm> Website, information communication terminal, robot type retrieval engine response system, robot type retrieval engine registration method, storage medium and program transmitter
JP2003030231A (en) * 2001-07-11 2003-01-31 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for providing document retrieval service and storage medium with document retrieval service program stored thereon

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
伊藤 将雄: "WWW自動巡回ソフト:波乗野郎Enterprise", 日経WINDOWS NT, vol. 第19号, JPN6009037774, 1 October 1998 (1998-10-01), JP, pages 26 - 27, ISSN: 0001721199 *
原田昌紀, サーチエンジン徹底活用術, JPN6009059224, 24 December 1997 (1997-12-24), JP, pages 192 - 221, ISSN: 0001465714 *
鈴木 雅也: "波乗野郎Enterprise Ver.1.0", アスキーNT 第3巻, vol. 第3巻第10号, JPN6009037771, 1 October 1998 (1998-10-01), JP, pages 118 - 119, ISSN: 0001379875 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008134966A (en) * 2006-11-29 2008-06-12 Sony Corp Data management server, data management system, data management method and program
US8219619B2 (en) 2006-11-29 2012-07-10 Sony Corporation Data management server, data management system, data management method, and program
JP2010122886A (en) * 2008-11-19 2010-06-03 Yahoo Japan Corp Information retrieving device, and information retrieval method and program
JP2012238050A (en) * 2011-05-10 2012-12-06 Hitachi Solutions Ltd Integrated retrieval device, integrated retrieval system, and integrated retrieval method
KR20140072075A (en) * 2011-10-03 2014-06-12 톰슨 라이센싱 Method and apparatus for processing content offers in a digital locker system
JP2015505424A (en) * 2011-10-03 2015-02-19 トムソン ライセンシングThomson Licensing Method and apparatus for processing content offers in a digital locker system
JP2015130154A (en) * 2013-12-06 2015-07-16 株式会社リコー Information processing device, program, and information management method
JP2017016446A (en) * 2015-07-02 2017-01-19 富士ゼロックス株式会社 Information processor and information processing program
JP2021002302A (en) * 2019-06-24 2021-01-07 エコノス株式会社 Search system
JP2021101378A (en) * 2019-06-24 2021-07-08 エコノス株式会社 Searching system

Also Published As

Publication number Publication date
JP4589051B2 (en) 2010-12-01

Similar Documents

Publication Publication Date Title
US8645416B2 (en) Searching content in distributed computing networks
KR101422859B1 (en) Permission-based document server
CN1328636C (en) Method and system for peer-to-peer authorization
US20080250021A1 (en) Method for Searching Private Data Via a Public Data Search Interface
US20060026692A1 (en) Network resource access authentication apparatus and method
JP2005135381A (en) System and method for client-based web crawling
JP2000357176A (en) Contents indexing retrieval system and retrieval result providing method
KR20030048045A (en) A method for searching and analysing information in data networks
JP6323994B2 (en) Content management apparatus, content management method and program
JP2002032216A (en) Hosting device for application
KR101977624B1 (en) Method and apparatus for providing authentication information on a web page
US11641356B2 (en) Authorization apparatus, data server and communication system
CN106254528A (en) A kind of resource downloading method and buffer memory device
US20050005174A1 (en) Configurable password authentication policies
KR100714504B1 (en) System and method for searching contents in personal terminals using wired and wireless internet
JP4589051B2 (en) Search device
JP2006058948A5 (en)
JP2005339008A (en) Access control method and program, and recording medium
JP6162056B2 (en) Advertisement content delivery system and advertisement content delivery method
KR100496355B1 (en) Distributed syndicate service system of Multimedia contents
JP2002342270A (en) Remote access control method and remote access control program
CA2520258C (en) System and method for dynamically generating a user-centric portal
JP2002083082A (en) Intellectual property information managing system, program for the same and computer readable recording medium recording program
JP4511281B2 (en) Content search apparatus and content search method
JP2006189978A (en) System, server, method and program for information retrieval

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070817

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100720

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100907

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100909

R150 Certificate of patent or registration of utility model

Ref document number: 4589051

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees