JP4807048B2 - Content creation date management program and method and apparatus - Google Patents

Content creation date management program and method and apparatus Download PDF

Info

Publication number
JP4807048B2
JP4807048B2 JP2005335508A JP2005335508A JP4807048B2 JP 4807048 B2 JP4807048 B2 JP 4807048B2 JP 2005335508 A JP2005335508 A JP 2005335508A JP 2005335508 A JP2005335508 A JP 2005335508A JP 4807048 B2 JP4807048 B2 JP 4807048B2
Authority
JP
Japan
Prior art keywords
creation date
rss
page
creation
date
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005335508A
Other languages
Japanese (ja)
Other versions
JP2007141033A (en
Inventor
寛治 内野
哲朗 ▲高▼橋
文人 西野
青史 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005335508A priority Critical patent/JP4807048B2/en
Publication of JP2007141033A publication Critical patent/JP2007141033A/en
Application granted granted Critical
Publication of JP4807048B2 publication Critical patent/JP4807048B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

コンテンツの作成日を生成する分野に関する。   The present invention relates to the field for generating the creation date of content.

インターネットやイントラネットが発達した現在では、個人の必要な情報を検索エンジンなどの技術を駆使してネットから探す場合が非常に多くなってきている。ただし、その探し出した情報が信用できるものなのかどうか戸惑う場合が多い。例えば、ソフトウエアのトラブルに関する解決方法をネットで見つけ出しても、その方法が現在も有効なものなのかを判断することは難しい。そのような場合、ページ内にそのページを作成した日付情報があると判断の助けになるが、Webページやコンテンツには必ずしも作成日や更新日(以下、作成日には更新日も含む)が記述されているわけではなく、ユーザが確実に作成日を知る手段はなかった。
特開2000−155731公報
Now that the Internet and intranets have been developed, there are a great number of cases where information required by individuals is searched from the Internet by using a technology such as a search engine. However, many people are confused as to whether the information they have found can be trusted. For example, even if a solution for a software problem is found on the Internet, it is difficult to determine whether the method is still effective. In such a case, it is helpful to determine if there is date information that created the page in the page, but the Web page or content does not necessarily have a creation date or an update date (hereinafter, the creation date includes the update date). It was not described, and there was no way for the user to know the creation date.
JP 2000-155731 A

Web上のページの作成日はそのページの情報の信頼度を判断する上で、非常に重要な要素であるが、Webページやコンテンツには必ずしも作成日が記述されているわけではない。日付が書かれていない場合、ユーザはそのページの情報が新しいものか古いものかを判断する術がなく、その情報の信憑性が怪しくなってしまう。   The creation date of a page on the Web is a very important factor in determining the reliability of information on the page, but the creation date is not necessarily described in the Web page or content. If the date is not written, the user has no way of determining whether the information on the page is new or old, and the credibility of the information becomes suspicious.

また、既存のRSSサービス(例えばhttp://myrss.jpやhttp://www.hatena.ne.jpで提供されているサービス)では、監視対象とするページをすべてキャッシュし、広告などページの一部でも変更があるとそれを差分情報としてレポートする仕組みを持っている。しかし、この仕組みではキュッシュすべきページが膨大になってしまう。   Also, with existing RSS services (for example, services provided at http://myrss.jp and http://www.hatena.ne.jp), all pages to be monitored are cached, and advertisements and other pages If there is any change, it has a mechanism to report it as difference information. However, this mechanism results in a huge number of pages to be chushed.

そこで、監視対象とするページ中に作成日が明示的に書かれていなくても、そのページの作成日をユーザに提示することを目的とする。更に、そのページ中のURLと作成日の組から成るDBを作成して、キュッシュすべきページを不要とすることを目的とする。   Therefore, the purpose is to present the creation date of the page to the user even if the creation date is not explicitly written in the page to be monitored. A further object of the present invention is to create a DB comprising a set of URL and creation date in the page so that a page to be cached is unnecessary.

本願第1の発明は、更新ページの情報をまとめているユーザが指定したWebページ(以下更新ページという)から抽出したリンクと抽出した日付とから成るリンクテーブル1を作成し、定期的に該更新ページから抽出したリンクと抽出した日付とから成るリンクテーブル2を作成するリンクテーブル作成部と、
前記リンクテーブル1と前記リンクテーブル2を比較して差があった場合、比較を行った日を作成日と判断する作成日取得部と、
判断された作成日と差があったリンクテーブルが指すリンク先とから成る作成日テーブルを作成する作成日テーブル作成部を有することを特徴とする。
The first invention of the present application creates a link table 1 composed of links extracted from Web pages (hereinafter referred to as update pages) designated by a user who summarizes information of update pages and extracted dates, and periodically updates them. A link table creation unit for creating a link table 2 composed of links extracted from pages and extracted dates;
When there is a difference between the link table 1 and the link table 2, a creation date acquisition unit that determines a date of comparison as a creation date;
It has a creation date table creation unit that creates a creation date table including a link destination pointed to by a link table having a difference from the determined creation date.

本願第2の発明は、更新ページの情報をまとめているユーザが指定したWebページ(以下更新ページという)をRSS化したRSS1を得、定期的に該更新ページをRSS化したRSS2を得るRSS化部と、
前記RSS1と前記RSS2を比較して差があった場合、比較を行った日を作成日と判断する作成日取得部と、
判断された作成日と差があったRSSが指すURLとから成る作成日テーブルを作成する作成日テーブル作成部を有することを特徴とする。
The second invention of the present application obtains RSS1 obtained by converting RSS to a Web page (hereinafter referred to as update page) designated by a user who summarizes update page information, and periodically obtains RSS2 obtained by converting the update page into RSS. And
When there is a difference between the RSS1 and the RSS2, the creation date acquisition unit that determines the date of comparison as the creation date;
It has a creation date table creation unit that creates a creation date table composed of the determined creation date and the URL indicated by the RSS having a difference.

本願第3の発明は、前記更新ページは、コンテンツの作成日が記載されていないページであることを特徴とすることを特徴とする。   The third invention of the present application is characterized in that the update page is a page in which the creation date of the content is not described.

本願第4の発明は、指定されたURLについて前記作成日テーブルを検索して作成日を得る検索部を更に有することを特徴とする。   The fourth invention of the present application further includes a search unit that searches the creation date table for a specified URL and obtains the creation date.

Webページ中にコンテンツ作成日が明示的に書かれていなくても、コンテンツ作成日を得ることができる。   Even if the content creation date is not explicitly written in the Web page, the content creation date can be obtained.

また、Webページ中にコンテンツ作成日が明示的に書かれていなくても、コンテンツ作成日をキーに、かかるページを検索することができる。   Further, even if the content creation date is not explicitly written in the Web page, such a page can be searched using the content creation date as a key.

また、従来技術では、Webページ内に作成日があればその日がRSSのitemのpubdateとして採用され、作成日がなければアクセスされた日付がpubdateとして採用されてしまうが、本願発明によればRSSのitemにあたるコンテンツの作成日が特定できるので、itemの作成日が保証されたRSSを出力することができる。   In the conventional technology, if there is a creation date in the Web page, that date is adopted as the RSS item publication. If there is no creation date, the accessed date is adopted as the publication. Since the creation date of the content corresponding to the item can be specified, an RSS in which the creation date of the item is guaranteed can be output.

また、既存のRSSサービスとは異なり、キュッシュすべきページを不要とすることができる。   Further, unlike the existing RSS service, a page to be crushed can be made unnecessary.

図1は、本願発明の実施例の構成図である。本願発明は、コンテンツ作成日管理装置1、Webサーバ20、ユーザ端末21から構成される。コンテンツ作成日管理装置1は、ページアクセス部2、RSS化部3、作成日取得部4、作成日テーブル作成部5、検索部6、RSS記憶部7、作成日テーブル記憶部8、リンクテーブル作成部13、リンクテーブル記憶部17から構成される。   FIG. 1 is a configuration diagram of an embodiment of the present invention. The present invention includes a content creation date management device 1, a Web server 20, and a user terminal 21. The content creation date management device 1 includes a page access unit 2, an RSS generation unit 3, a creation date acquisition unit 4, a creation date table creation unit 5, a search unit 6, an RSS storage unit 7, a creation date table storage unit 8, and a link table creation. Section 13 and a link table storage section 17.

ページアクセス部2は、ユーザが指定した時または定期的に、ユーザが指定したURLを持つWebページを管理しているWebサーバ20にネットワークを介してアクセスする処理部である。このWebページは、対象サイトのトップページ、「What‘s New」ページ、新着情報ページなどの更新ページの情報をまとめているページを前提とし、このページのリンクが各コンテンツページを指している(図1)。以下、このWebページを単に更新ページと言う。   The page access unit 2 is a processing unit that accesses, via a network, the Web server 20 that manages a Web page having a URL specified by the user when specified by the user or periodically. This Web page is premised on a page that summarizes information of update pages such as the top page of the target site, the “What's New” page, the new arrival information page, and the link of this page points to each content page ( FIG. 1). Hereinafter, this Web page is simply referred to as an update page.

RSS化部3は、この更新ページをRSS化して、RSS(Really Simple Syndication、Rich Site Summary)を得る処理部である。更新ページをRSS化する技術は既存の技術を使う。なお、更新ページは、コンテンツの作成日(以下、作成日時も含む)が記載されていないページを前提とするが、作成日が記載されているページでも良い。また、コンテンツの作成日が記載されていないページについては、タグの繰り返しやルールなど対象ページのRSS化すべき部分を指定して既存の技術(例えば特願2005−053696)を利用してRSS化しても良い。   The RSS conversion unit 3 is a processing unit that converts the update page into RSS to obtain RSS (Really Simple Syndication, Rich Site Summary). The technology for converting the update page into RSS uses an existing technology. The update page is assumed to be a page on which the creation date of content (hereinafter including the creation date and time) is not described, but may be a page on which the creation date is described. For pages where the date of creation of content is not described, specify the portion of the target page to be converted to RSS, such as tag repetition and rules, and use existing technology (for example, Japanese Patent Application No. 2005-053696) to convert it to RSS. Also good.

作成日取得部4は、ユーザが指定した更新ページに以前アクセスしてRSS記憶部7に格納されていたRSS(以下RSS1という)と、その更新ページに定期的にアクセスして新たに得られたRSS(以下RSS2という)とを比較し、RSS1とRSS2に差があった場合、変化があったRSSのitemタグに関して、比較を行った日付をpubdateと判断する処理部である。pubdateとはそのページが初めてWeb上に公開された日であり、作成日と同義である。また、ユーザが指定した更新ページに以前アクセスしてリンクテーブル記憶部17に格納されていたリンクテーブル(以下リンクテーブル1という)と、その更新ページに定期的にアクセスして新たに得られたリンクテーブル(以下リンクテーブル2という)とを比較し、変化があったリンクテーブル対して、比較を行った日付をpubdateと判断する処理部である。   The creation date acquisition unit 4 is newly obtained by accessing the update page designated by the user previously and RSS (hereinafter referred to as RSS1) stored in the RSS storage unit 7 and periodically accessing the update page. This is a processing unit that compares RSS (hereinafter referred to as RSS2) and, when there is a difference between RSS1 and RSS2, regarding the RSS item tag that has changed, determines that the date of comparison is “publish”. “Pubdate” is the date when the page is first published on the Web, and is synonymous with the creation date. In addition, a link table (hereinafter referred to as link table 1) that has been previously accessed by the user and specified in the link table storage unit 17 by accessing the update page designated by the user, and a link obtained by periodically accessing the update page. This is a processing unit that compares a table (hereinafter referred to as the link table 2) and determines the date of comparison with the link table that has changed as a publication.

作成日テーブル作成部5は、作成日取得部4で判断された作成日と変化があったitemタグ内のrdfタグが指すURLとから成る作成日テーブルを作成または更新し、作成日テーブル記憶部8に格納する処理部である。また、作成日取得部4で判断された作成日と変化があったリンクテーブルが指すURLとから成る作成日テーブルを作成または更新し、作成日テーブル記憶部8に格納する処理部である。   The creation date table creation unit 5 creates or updates a creation date table including the creation date determined by the creation date acquisition unit 4 and the URL pointed to by the rdf tag in the item tag that has changed, and the creation date table storage unit 8 is a processing unit to be stored. In addition, it is a processing unit that creates or updates a creation date table including the creation date determined by the creation date acquisition unit 4 and the URL indicated by the link table that has changed, and stores the created date table in the creation date table storage unit 8.

検索部6は、ユーザがユーザ端末21から作成日を知りたいページのURLを指定したのを契機に、作成日テーブル記憶部8から作成日テーブルを読み出し、指定されたURLを検索して作成日を得る処理部である。   The retrieval unit 6 reads the creation date table from the creation date table storage unit 8 when the user designates the URL of the page for which the user wants to know the creation date from the user terminal 21, searches the designated URL, and creates the creation date. Is a processing unit for obtaining

RSS記憶部7は、RSS化部3で作成されたRSSを記憶する記憶部である。   The RSS storage unit 7 is a storage unit that stores the RSS created by the RSS conversion unit 3.

作成日テーブル記憶部8は、作成日テーブル作成部5で作成された作成日テーブルを記憶する記憶部である。   The creation date table storage unit 8 is a storage unit that stores the creation date table created by the creation date table creation unit 5.

リンクテーブル作成部13は、更新ページからリンクをすべて抽出し、抽出したリンクと日時とから成るリンクテーブルを作成または更新し、リンクテーブル記憶部17に保存する処理部である。   The link table creation unit 13 is a processing unit that extracts all the links from the update page, creates or updates a link table including the extracted links and dates, and stores them in the link table storage unit 17.

リンクテーブル記憶部17は、リンク保存部13で作成されたリンクテーブルを記憶する記憶部である。   The link table storage unit 17 is a storage unit that stores the link table created by the link storage unit 13.

以下、フローチャートを用いて本願発明の実施例を説明する(図2)。   Hereinafter, an embodiment of the present invention will be described with reference to a flowchart (FIG. 2).

まず、ページアクセス部2はユーザが指定した更新ページ(図3)にアクセスし、RSS化部3はその更新ページをRSS化したRSS(RSS1)(図4)を得てRSS記憶部7に保存する(S1)。このとき、RSSのitemタグのリンク先のページの保存は行わない。図4のRSSを保存する時のデータ構造を図5に示す。なお、図3のページをRSS化すると、図3の中ほどにある「トピックス」配下の項目がRSSの要素としてリストアップされるとする(図4)。   First, the page access unit 2 accesses an update page designated by the user (FIG. 3), and the RSS conversion unit 3 obtains RSS (RSS1) (FIG. 4) obtained by converting the update page into RSS and stores it in the RSS storage unit 7. (S1). At this time, the link destination page of the RSS item tag is not saved. FIG. 5 shows a data structure when the RSS of FIG. 4 is stored. When the page of FIG. 3 is converted to RSS, items under “topics” in the middle of FIG. 3 are listed as RSS elements (FIG. 4).

そして、ページアクセス部2は定期的に(例えば毎日)同じ更新ページにアクセスし、RSS化部3はその更新ページをRSS化してRSS(RSS2)を得る(S2)。図3の更新ページが図6のように更新された時のRSSが、図7である。   And the page access part 2 accesses the same update page regularly (for example, every day), and the RSS conversion part 3 converts the update page into RSS and obtains RSS (RSS2) (S2). FIG. 7 shows the RSS when the update page of FIG. 3 is updated as shown in FIG.

そして、作成日取得部4は、RSS記憶部7に保存されていたRSS1とRSS2との比較を行い(S3)、RSS1とRSS2に差があった場合、変化があったitemタグに関して、比較を行った日付をpubdateと判断する(S4)。図8は、RSS1とRSS2の差分を取り出したものであり、
http://www.mhlw.go.jp/bunya/kodomo/topics02/index.html
の作成日を、比較を行った日と判断する。
Then, the creation date acquisition unit 4 compares RSS1 and RSS2 stored in the RSS storage unit 7 (S3), and if there is a difference between RSS1 and RSS2, the comparison is performed on the item tag that has changed. The date of execution is determined as “pubdate” (S4). FIG. 8 shows the difference between RSS1 and RSS2.
http://www.mhlw.go.jp/bunya/kodomo/topics02/index.html
The creation date is determined as the date of comparison.

そして、作成日テーブル作成部5は、判断された作成日と変化があったitemタグが指すURLとから成る作成日テーブル(図9)を作成または更新し、作成日テーブル記憶部8に格納し、RSS2をRSS1にコピーしてRSS1を更新してRSS記憶部7に保存し(S5)、S2に戻る。   Then, the creation date table creation unit 5 creates or updates a creation date table (FIG. 9) including the determined creation date and the URL pointed to by the changed item tag, and stores it in the creation date table storage unit 8. , RSS2 is copied to RSS1, RSS1 is updated and stored in the RSS storage unit 7 (S5), and the process returns to S2.

一方、検索部6は、ユーザが作成日を知りたいページのURLがユーザ端末21から送られてきたとき、作成日テーブル記憶部8から作成日テーブルを読み出し、そのURLから作成日テーブルを検索して該当する作成日を得、その作成日をユーザに返す。   On the other hand, when the URL of the page for which the user wants to know the creation date is sent from the user terminal 21, the retrieval unit 6 reads the creation date table from the creation date table storage unit 8, and searches the creation date table from the URL. To obtain the corresponding creation date and return the creation date to the user.

次に、RSSを利用しない実施例を説明する。   Next, an embodiment that does not use RSS will be described.

まず、ページアクセス部2はユーザが指定した更新ページにアクセスし、リンクテーブル作成部13はその更新ページからリンクをすべて抽出し、抽出したリンクと抽出した日付とから成るリンクテーブル(以下リンクテーブル1という)を作成してリンクテーブル記憶部17に保存する。   First, the page access unit 2 accesses an update page designated by the user, the link table creation unit 13 extracts all links from the update page, and a link table (hereinafter referred to as link table 1) composed of the extracted links and the extracted dates. And stored in the link table storage unit 17.

そして、ページアクセス部2は定期的に(例えば毎日)同じ更新ページにアクセスし、リンクテーブル作成部13は同様にリンクテーブル2を作成する。   The page access unit 2 accesses the same update page periodically (for example, every day), and the link table creation unit 13 creates the link table 2 in the same manner.

そして、作成日取得部4は、リンクテーブル記憶部17に保存されていたリンクテーブル1とリンクテーブル2との比較を行い、リンクテーブル1とリンクテーブル2に差があった場合、変化があったリンクに関して、比較を行った日付をpubdateと判断する。   Then, the creation date acquisition unit 4 compares the link table 1 and the link table 2 stored in the link table storage unit 17, and if there is a difference between the link table 1 and the link table 2, there is a change. Regarding the link, the date on which the comparison was made is determined as “pubdate”.

そして、作成日テーブル作成部5は、判断された作成日と変化があったリンクテーブルが指すURLとから成る作成日テーブルを作成または更新し、作成日テーブル記憶部8に格納し、リンクテーブル2をリンクテーブル1にコピーしてリンクテーブル1を更新してリンクテーブル記憶部17に保存し、S2に戻る。   Then, the creation date table creation unit 5 creates or updates a creation date table composed of the determined creation date and the URL pointed to by the changed link table, stores it in the creation date table storage unit 8, and stores the link table 2. Is copied to the link table 1, the link table 1 is updated and stored in the link table storage unit 17, and the process returns to S2.

その他、本願発明を利用した次のような応用が考えられる。   In addition, the following applications using the present invention can be considered.

(1)検索エンジンへの応用
現在の一般的なWebの検索エンジンでは、コンテンツを収集した日付は持つことができるが、コンテンツの作成日付(ネットにアップされた日付)は持つことができていない。本願発明により、コンテンツの作成日が取得できるので検索インデックス作成時に日付も含めてインデックス作成を行い、検索結果の表示オプションとして作成日付順で並べ替えることが可能になる。
(1) Application to a search engine A current general Web search engine can have a date when contents are collected, but cannot have a creation date (date uploaded to the net). . According to the present invention, since the creation date of the content can be acquired, it is possible to create an index including the date when creating the search index, and rearrange the search result display options in the order of creation date.

(2)WEBアーカイブの作成
電子図書館などWebアーカイブのプロジェクトでコンテンツの作成日付順に正確に管理することが可能になる。
(2) Creation of WEB archive It becomes possible to manage accurately in the order of creation date of contents in a web archive project such as an electronic library.

(3)掲示板などのコンテンツを証拠として活用する場合
風説流布などで掲示板などを監視する場合に作成日付がない掲示板に対して、作成日付を特定することで証拠となる可能性がある。
(3) When using content such as a bulletin board as evidence When monitoring a bulletin board or the like with a popular distribution or the like, specifying a creation date for a bulletin board without a creation date may provide evidence.

(付記1)コンピュータを、
更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)から抽出したリンクと抽出した日付とから成るリンクテーブル1を作成し、定期的に該更新ページから抽出したリンクと抽出した日付とから成るリンクテーブル2を作成するリンクテーブル作成部、
前記リンクテーブル1と前記リンクテーブル2を比較して差があった場合、比較を行った日を作成日と判断する作成日取得部、
判断された作成日と差があったリンクテーブルが指すリンク先とから成る作成日テーブルを作成する作成日テーブル作成部、
として機能させることを特徴とするコンテンツ作成日管理プログラム。
(付記2)コンピュータを、
更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)をRSS化したRSS1を得、定期的に該更新ページをRSS化したRSS2を得るRSS化部、
前記RSS1と前記RSS2を比較して差があった場合、比較を行った日を作成日と判断する作成日取得部、
判断された作成日と差があったRSSが指すURLとから成る作成日テーブルを作成する作成日テーブル作成部、
として機能させることを特徴とするコンテンツ作成日管理プログラム。
(付記3)前記更新ページは、コンテンツの作成日が記載されていないページであることを特徴とする付記1または2記載のコンテンツ作成日管理プログラム。
(付記4)指定されたURLについて前記作成日テーブルを検索して作成日を得る検索部を更に有することを特徴とする付記1、2または3記載のコンテンツ作成日管理プログラム。
(付記5)リンクテーブル作成部が、更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)から抽出したリンクと抽出した日付とから成るリンクテーブル1を作成し、定期的に該更新ページから抽出したリンクと抽出した日付とから成るリンクテーブル2を作成するステップと、
作成日取得部が、前記リンクテーブル1と前記リンクテーブル2を比較して差があった場合、比較を行った日を作成日と判断するステップと、
作成日テーブル作成部が、判断された作成日と差があったリンクテーブルが指すリンク先とから成る作成日テーブルを作成するステップと、
を有することを特徴とするコンテンツ作成日管理方法。
(付記6)コンピュータを、
RSS化部が、更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)をRSS化したRSS1を得、定期的に該更新ページをRSS化したRSS2を得るステップと、
作成日取得部が、前記RSS1と前記RSS2を比較して差があった場合、比較を行った日を作成日と判断するステップと、
作成日テーブル作成部が、判断された作成日と差があったRSSが指すURLとから成る作成日テーブルを作成するステップと、
を有することを特徴とするコンテンツ作成日管理方法。
(付記7)前記更新ページは、コンテンツの作成日が記載されていないページであることを特徴とする付記5または6記載のコンテンツ作成日管理方法。
(付記8)検索部が、指定されたURLについて前記作成日テーブルを検索して作成日を得るステップを更に有することを特徴とする付記5、6または7記載のコンテンツ作成日管理方法。
(付記9)更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)から抽出したリンクと抽出した日付とから成るリンクテーブル1を作成し、定期的に該更新ページから抽出したリンクと抽出した日付とから成るリンクテーブル2を作成するリンクテーブル作成部と、
前記リンクテーブル1と前記リンクテーブル2を比較して差があった場合、比較を行った日を作成日と判断する作成日取得部と、
判断された作成日と差があったリンクテーブルが指すリンク先とから成る作成日テーブルを作成する作成日テーブル作成部と、
を有することを特徴とするコンテンツ作成日管理装置
(付記10)更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)をRSS化したRSS1を得、定期的に該更新ページをRSS化したRSS2を得るRSS化部と、
前記RSS1と前記RSS2を比較して差があった場合、比較を行った日を作成日と判断する作成日取得部と、
判断された作成日と差があったRSSが指すURLとから成る作成日テーブルを作成する作成日テーブル作成部と、
を有することを特徴とするコンテンツ作成日管理装置
(付記11)前記更新ページは、コンテンツの作成日が記載されていないページであることを特徴とする付記9または10記載のコンテンツ作成日管理装置。
(付記12)指定されたURLについて前記作成日テーブルを検索して作成日を得る検索部を更に有することを特徴とする付記9、10または11記載のコンテンツ作成日管理装置。
(Appendix 1) Computer
A link table 1 composed of links extracted from Web pages (hereinafter simply referred to as update pages) designated by a user who summarizes information of update pages and extracted dates is created, and links extracted from the update pages periodically A link table creation unit for creating a link table 2 composed of the extracted dates;
When there is a difference between the link table 1 and the link table 2, a creation date acquisition unit that determines a date of comparison as a creation date;
A creation date table creation unit that creates a creation date table composed of a link destination pointed to by a link table having a difference from the determined creation date;
Content creation date management program characterized by functioning as
(Appendix 2) Computer
An RSS conversion unit that obtains RSS1 obtained by converting a Web page (hereinafter simply referred to as an update page) designated by a user who summarizes information of update pages into RSS, and periodically obtains RSS2 obtained by converting the update page into RSS,
When there is a difference between the RSS1 and the RSS2, a creation date acquisition unit that determines a date of comparison as a creation date;
A creation date table creation unit that creates a creation date table composed of the determined creation date and the URL pointed to by the RSS having a difference;
Content creation date management program characterized by functioning as
(Supplementary note 3) The content creation date management program according to supplementary note 1 or 2, wherein the update page is a page in which the creation date of the content is not described.
(Supplementary note 4) The content creation date management program according to supplementary note 1, 2 or 3, further comprising a retrieval unit for retrieving the creation date by searching the creation date table for a specified URL.
(Supplementary Note 5) The link table creation unit creates a link table 1 composed of links extracted from a Web page (hereinafter simply referred to as an update page) designated by a user who summarizes information of update pages and extracted dates. Creating a link table 2 consisting of links extracted from the update page and extracted dates;
The creation date acquisition unit, if there is a difference between the link table 1 and the link table 2, determining the date of comparison as the creation date;
A step in which the creation date table creation unit creates a creation date table including a link destination pointed to by a link table having a difference from the determined creation date;
A content creation date management method characterized by comprising:
(Appendix 6)
The RSS conversion unit obtains RSS1 obtained by converting the Web page (hereinafter simply referred to as update page) designated by the user who summarizes the information of the update page into RSS, and periodically obtains RSS2 obtained by converting the update page into RSS;
If the creation date acquisition unit compares the RSS1 and the RSS2 and there is a difference, the step of determining the date of comparison as the creation date;
A step in which a creation date table creation unit creates a creation date table including a URL pointed to by the RSS that has a difference from the determined creation date;
A content creation date management method characterized by comprising:
(Supplementary note 7) The content creation date management method according to supplementary note 5 or 6, wherein the update page is a page in which the creation date of the content is not described.
(Supplementary note 8) The content creation date management method according to supplementary note 5, 6 or 7, further comprising a step in which the search unit searches the creation date table for the specified URL to obtain the creation date.
(Additional remark 9) The link table 1 which consists of the link extracted from the Web page (henceforth an update page) designated by the user who summarizes the information of an update page, and the extracted date is created, and it updates regularly from the update page. A link table creation unit for creating a link table 2 composed of the extracted link and the extracted date;
When there is a difference between the link table 1 and the link table 2, a creation date acquisition unit that determines a date of comparison as a creation date;
A creation date table creation unit that creates a creation date table composed of a link destination pointed to by a link table having a difference from the determined creation date;
Content creation date management device (Appendix 10) characterized in that RSS1 obtained by converting a Web page (hereinafter simply referred to as an update page) designated by a user who summarizes information on update pages into RSS is obtained and periodically updated RSS conversion unit for obtaining RSS2 obtained by converting the page into RSS;
When there is a difference between the RSS1 and the RSS2, the creation date acquisition unit that determines the date of comparison as the creation date;
A creation date table creation unit that creates a creation date table composed of the determined creation date and the URL pointed to by the RSS having a difference;
Content creation date management device (Supplementary Note 11) The content creation date management device according to Supplementary Note 9 or 10, wherein the update page is a page in which the creation date of the content is not described.
(Supplementary note 12) The content creation date management apparatus according to supplementary note 9, 10 or 11, further comprising a search unit that searches the creation date table for a specified URL and obtains the creation date.

構成図Diagram フローチャートflowchart WebページWeb page RSSRSS RSSを保存する時のデータ構造Data structure when saving RSS 更新されたWebページUpdated web page 更新されたRSSUpdated RSS 更新されたRSSの差分Updated RSS difference 作成日テーブルCreation date table

符号の説明Explanation of symbols

2 ページアクセス部
3 RSS化部
4 作成日取得部
5 作成日テーブル作成部
6 検索部
7 RSS記憶部
8 作成日テーブル記憶部
13 リンクテーブル作成部
17 リンクテーブル記憶部
20 Webサーバ20
2 page access unit 3 RSS conversion unit 4 creation date acquisition unit 5 creation date table creation unit 6 search unit 7 RSS storage unit 8 creation date table storage unit 13 link table creation unit 17 link table storage unit 20 Web server 20

Claims (4)

コンピュータを、
更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)をRSS化したRSS1を得、定期的に該更新ページをRSS化したRSS2を得るRSS化部、
前記RSS1と前記RSS2を比較して差があった場合、変化があったRSS2のitemタグの中のlinkタグが示すURLに関して、比較を行った日を作成日と判断する作成日取得部、
前記作成日取得部が判断をした作成日と、変化があったRSS2のitemタグの中のlinkタグが示すURLを関連付けてもつ作成日テーブルを作成する作成日テーブル作成部、
として機能させることを特徴とするコンテンツ作成日管理プログラム。
Computer
An RSS conversion unit that obtains RSS1 obtained by converting a Web page (hereinafter simply referred to as an update page) designated by a user who summarizes information of update pages into RSS, and periodically obtains RSS2 obtained by converting the update page into RSS,
If there is a difference between the RSS1 and the RSS2, there is a creation date acquisition unit that determines the date of comparison as the creation date for the URL indicated by the link tag in the item tag of the RSS 2 that has changed ,
A creation date table creation unit that creates a creation date table that associates the creation date determined by the creation date acquisition unit with the URL indicated by the link tag in the item tag of RSS 2 that has changed ;
Content creation date management program characterized by functioning as
指定されたURLについて前記作成日テーブルを検索して作成日を得る検索部を更に有することを特徴とする請求項1記載のコンテンツ作成日管理プログラム。 The content creation date management program according to claim 1, further comprising a search unit that searches the creation date table for a specified URL to obtain a creation date. コンピュータが、
更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)をRSS化したRSS1を得、定期的に該更新ページをRSS化したRSS2を得て、、
前記RSS1と前記RSS2を比較して差があった場合、変化があったRSS2のitemタグの中のlinkタグが示すURLに関して、比較を行った日を作成日と判断し
前記判断をした作成日と、変化があったRSS2のitemタグの中のlinkタグが示すURLを関連付けてもつ作成日テーブルを作成する、
ことを特徴とするコンテンツ作成日管理方法。
Computer
Obtaining RSS1 obtained by converting the Web page (hereinafter simply referred to as an update page) designated by the user that summarizes the information of the update page into RSS, periodically obtaining RSS2 obtained by converting the update page into RSS,
If there is a difference between the RSS1 and the RSS2, the date of comparison is determined as the creation date for the URL indicated by the link tag in the item tag of the RSS2 that has changed.
Creating a creation date table that associates the creation date determined above with the URL indicated by the link tag in the item tag of RSS 2 that has changed ,
Content creation date management method characterized by the above.
更新ページの情報をまとめているユーザが指定したWebページ(以下単に更新ページという)をRSS化したRSS1を得、定期的に該更新ページをRSS化したRSS2を得るRSS化部、
前記RSS1と前記RSS2を比較して差があった場合、変化があったRSS2のitemタグの中のlinkタグが示すURLに関して、比較を行った日を作成日と判断する作成日取得部、
前記作成日取得部が判断をした作成日と、変化があったRSS2のitemタグの中のlinkタグが示すURLを関連付けてもつ作成日テーブルを作成する作成日テーブル作成部、
を有することを特徴とするコンテンツ作成日管理装置。
An RSS conversion unit that obtains RSS1 obtained by converting a Web page (hereinafter simply referred to as an update page) designated by a user who summarizes information of update pages into RSS, and periodically obtains RSS2 obtained by converting the update page into RSS,
If there is a difference between the RSS1 and the RSS2, there is a creation date acquisition unit that determines the date of comparison as the creation date for the URL indicated by the link tag in the item tag of the RSS 2 that has changed ,
A creation date table creation unit that creates a creation date table that associates the creation date determined by the creation date acquisition unit with the URL indicated by the link tag in the item tag of RSS 2 that has changed ;
A content creation date management device characterized by comprising:
JP2005335508A 2005-11-21 2005-11-21 Content creation date management program and method and apparatus Expired - Fee Related JP4807048B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005335508A JP4807048B2 (en) 2005-11-21 2005-11-21 Content creation date management program and method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005335508A JP4807048B2 (en) 2005-11-21 2005-11-21 Content creation date management program and method and apparatus

Publications (2)

Publication Number Publication Date
JP2007141033A JP2007141033A (en) 2007-06-07
JP4807048B2 true JP4807048B2 (en) 2011-11-02

Family

ID=38203799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005335508A Expired - Fee Related JP4807048B2 (en) 2005-11-21 2005-11-21 Content creation date management program and method and apparatus

Country Status (1)

Country Link
JP (1) JP4807048B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101487205B1 (en) * 2007-07-13 2015-01-30 삼성전자 주식회사 Apparatus, system and method for providing contents in media server
WO2011077957A1 (en) * 2009-12-21 2011-06-30 日本電気株式会社 Information estimation device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000066945A (en) * 1998-08-20 2000-03-03 Nec Corp Document collection system, device and method and recording medium
JP2002175240A (en) * 2000-12-06 2002-06-21 Fuji Xerox Co Ltd Website evaluation system, website evaluation method and recording medium
CN101228521B (en) * 2004-03-15 2013-02-13 雅虎公司 Integration of personalized portals with WEB content syndication
JP2005284334A (en) * 2004-03-26 2005-10-13 Oki Electric Ind Co Ltd Web page update notification method and apparatus

Also Published As

Publication number Publication date
JP2007141033A (en) 2007-06-07

Similar Documents

Publication Publication Date Title
US7552109B2 (en) System, method, and service for collaborative focused crawling of documents on a network
US7974832B2 (en) Web translation provider
US7987173B2 (en) Systems and methods of handling internet spiders
CA2673110C (en) Method and system for intellegent processing of electronic information
US9111003B2 (en) Scalable derivative services
US20070124285A1 (en) Data feeds for management systems
JP2009059353A (en) Device and method for retrieving information selectively and enabling display of information after that
US20070162459A1 (en) System and method for creating searchable user-created blog content
US20070282825A1 (en) Systems and methods for dynamic content linking
EP2131292A1 (en) Method and apparatus for searching a plurality of realtime sensors
US20080172396A1 (en) Retrieving Dated Content From A Website
Schade et al. Augmenting SDI with linked data
RU2399090C2 (en) System and method for real time internet search of multimedia content
JPWO2003060764A1 (en) Information retrieval system
US20100192054A1 (en) Sematically tagged background information presentation
JP4807048B2 (en) Content creation date management program and method and apparatus
Ohmukai et al. Metadata-driven personal knowledge publishing
KR102054020B1 (en) Building of a web corpus with the help of a reference web crawl
JP2007128367A (en) Information retrieval knowhow management system
Kitamoto Digital typhoon: Near real-time aggregation, recombination and delivery of typhoon-related information
Ohmukai et al. Personal knowledge publishing suite with Weblog
Kaur et al. Research on the application of web mining technique based on XML for unstructured web data using LINQ
JP2006235882A (en) Method and system for browsing informations
Emamdadi et al. A focused linked data crawler based on HTML link analysis
JP2006227925A (en) Method and apparatus for providing information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080526

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110719

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110801

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140826

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees