JP2007087358A - ウェブログにおいて自動でトラックバックを作成する装置 - Google Patents

ウェブログにおいて自動でトラックバックを作成する装置 Download PDF

Info

Publication number
JP2007087358A
JP2007087358A JP2005307763A JP2005307763A JP2007087358A JP 2007087358 A JP2007087358 A JP 2007087358A JP 2005307763 A JP2005307763 A JP 2005307763A JP 2005307763 A JP2005307763 A JP 2005307763A JP 2007087358 A JP2007087358 A JP 2007087358A
Authority
JP
Japan
Prior art keywords
entry
information
registered
update
homepage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005307763A
Other languages
English (en)
Inventor
Shigehiro Boku
成浩 朴
Masaru Naruoka
優 成岡
Shigeru Aoki
茂 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2005307763A priority Critical patent/JP2007087358A/ja
Publication of JP2007087358A publication Critical patent/JP2007087358A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

【課題】 ウェブログにおいて自動的なトラックバック作成手段を提供する。
【解決手段】 データベースにインターネット上のウェブログのエントリを蓄積しておいて、新しくエントリが作成された場合、データベース内から類似するエントリを探して自動的にトラックバックを作成する。さらに、エントリ中のキーワードに反応して、自動的にそのキーワードに関連する広告宣伝用のウェブログやホームページをトラックバックする。
【選択図】 図1

Description

本発明は、ウェブログを使用したウェブログ利用者同士の交流を円滑に進めたり、ウェブログ利用者に対する広告・宣伝を容易に行うためのサーバー装置に関するものである。
従来、インターネットあるいはイントラネット上で情報を発信するための仕組みの一つとしてはホームページが知られている。また、ホームページの一つの種類として、特に高頻度で簡単に情報を発信できるようにした仕組みの一つとしてウェブログが普及していて、ウェブログで提示される情報はエントリという単位でまとめられている。
ウェブログには単に情報を発信するだけでなく、ウェブログ利用者が相互に内容の関連性の高いエントリ同士を通知し合うトラックバックという機能があり、この機能を使ってウェブログ利用者は他の利用者と交流を図ったり、あるエントリに対してそのエントリに関連性の強い商品やサービスの内容を紹介したエントリの広告・宣伝を行うことができる。
しかしながら、従来、トラックバックによって他のウェブログ利用者に自己のエントリを通知するためには、まず関連性の高いエントリを探し、また、そのエントリに対するトラックバックを自分で作成するという手間がかかる問題がある。また、特に広告・宣伝要素を含むエントリをトラックバックする場合、トラックバックされる側の心証を悪くしないように、あらかじめ同意を求める手間をかけなくてはいけない問題がある。
本発明は、このような課題に鑑みてなされたものであり、トラックバックする相手を探したり、トラックバックを作成したり、また、その同意を求める手間を省くサービスを実現する装置を提供することを目的とする。
本発明の装置は、図1のように、複数のウェブログやホームページを登録する仕組み(登録部)と、それら登録されているウェブログに新しくエントリが作成されたことを検知する仕組み(更新検知部)と、登録されているウェブログ内で作成されたエントリの内容を読み取る仕組み(更新内容取得部)および取得された内容の中に登場する語句の情報を元に他のエントリやホームページとの関連性の強弱を判断する仕組み(制御部)と、制御部の判断に基づいて実際にトラックバックを作成したり通知を行ったりする仕組み(実行部)を備えている。また、各部から参照され、かつ各部の動作の結果得られる情報を記憶しておく仕組み(データベース部)を持つ。
登録部は、本装置の操作対象となる、自動的にトラックバックを行いたいウェブログやホームページに関する情報をデータベースに入力するためのものであり、インターネット、あるいはイントラネットや特定のコンピューター上から本装置の利用者(本装置を使ったサービスの利用者やそのサービスの管理者)が利用できるようになっている。また、それらの情報に合わせて、トラックバックを行う際の判断基準に関するパラメータ(例えば、特定のキーワードを含む記事に優先的にトラックバックするとか、性的な単語を含む記事からはトラックバックを受け付けない、といったような設定)を設定できるようになっている。また、登録部は人間による明示的な入力機構だけでなく、一定の時間間隔ごとあるいは明示的に指示されたタイミング等のタイミングによって動作して、インターネット上のウェブログやホームページに関する情報を自動で収集する仕組みを必要に応じて備える。
更新検知部は、一定の時間間隔あるいは新しくエントリが作成されたことを通知される等のタイミングごとに動作して、登録されているウェブログに更新がないかを検出する。
更新内容取得部は、更新検知部が更新を検出したタイミング、あるいは一定の時間間隔ごとに動作して、更新が検出されたウェブログにアクセスして、更新されたエントリの内容を取得する。
制御部は、更新内容取得部が新たなエントリを取得したタイミング、あるいは一定の時間間隔ごとに動作して、新たに更新内容が取得されたエントリと、すでに登録あるいは取得されているエントリやホームページとを比較し、それぞれの内容の類似度や含まれる単語、それぞれに設定されているパラメータを元にトラックバックをしたりされたりするのが適切かどうかを判断する。
実行部は、制御部が新たにトラックバックを作成するように判断したタイミング、あるいは一定の時間間隔ごとに動作して、判断の対象となったエントリやホームページに設定されているパラメータを元にトラックバックを作成したり、それらの管理者にEメール等で通知を行ったりする。
現在、類似の装置やそれを使用したサービスはほとんど見あたらないが、比較的近いものとして、ウェブログサービス事業者が、その会員が作成したエントリについて、他の会員が似たような内容のエントリを作成していた場合、そのエントリを指し示すというサービスがある。(現在、「はてな」という事業者が行っている)
しかし、この場合は本装置とは異なり、異なるウェブログサービス事業者を利用したウェブログ間において類似記事を検索することはできない。
また、類似記事を書いた他のユーザーが、記事が似ているからと言って、トラックバックされることを好んでいるかどうかも分からない。
本装置を使ったサービスでは、単一のウェブログサービス事業者が提供するウェブログサービス内に留まらず、広く類似の記事を探すことができ、しかも会員はトラックバックされることを承認する基準を明示しているため、意にそぐわないトラックバックをして顰蹙を買うようなこともなくなる。
さらに、単にウェブログ同士ではなく、ホームページからのトラックバック、あるいは企業が広告用に作成したウェブログからのトラックバックを制御することも可能なので、例えば、あるキーワードを含むエントリにトラックバックさせてもらう、といった、ウェブログを使った広告宣伝に活用することも可能である。
本装置の各部分は、実施においてはソフトウェアプログラムとして実現するのが適当であり、その形態を以下に説明する。簡単のため、以下の説明では全てのプログラムは1台のサーバーコンピューター上で稼働するものとするが、実際は、処理量に応じて負荷分散のために複数台のサーバー構成上に分散して配置する場合もある。
(1)データベース部
データベース部は、汎用のリレーショナルデータベースサーバーソフトウェアを使用する。データベース内には、それぞれテーブルを分けて、利用者情報、ページ情報、キーワード情報、エントリ情報、ログ情報を保持する。これらの情報は、この装置を使ったサービスの利用者や管理者および本装置内で動作するプログラム自身によって登録、変更、削除等の管理をされる性質のものである。
利用者情報は、この装置を使ったサービスを利用する会員に関する情報であり、会員一人一人に対してユニークにアカウントを設定し、アカウント名、パスワード、Eメールアドレスを管理する。
ページ情報は、この装置の操作の対象となるウェブログやホームページ(以下、まとめてページと呼ぶ)に関する情報であり、ページURL、ページ管理者の利用者情報上のアカウント名を管理する。またさらに加えて、各ページに対して、必要に応じて、名称、RSSアドレス、ウェブログサービス提供事業者、トラックバックに関する嗜好を設定するためのパラメータ、ページの重要度、ページの最終更新日時等の情報を管理する。
トラックバックに関する嗜好を設定するためのパラメータは、例えば、広告宣伝トラックバックの受付の可否、サービス利用を明示的に申し込んだ会員以外からのトラックバック受付の可否、性的な単語を含むエントリとのトラックバックの扱い方法、自分自身のウェブログ上の他のエントリとのトラックバックの扱い方法、一定の更新期間以前の古いエントリとのトラックバックの扱い方法や、重点的にトラックバックを作成するキーワード、自動的にトラックバックを作成するのではなくトラックバックできそうな候補を通知するだけにするかどうか、といった情報である。
キーワード情報は、エントリ間の内容の類似度を判定するために使用する単語(以下、キーワードと呼ぶ)に関する情報であり、キーワードID、キーワード内容(=単語そのもの)、重要度を管理する。
エントリ情報は、この装置の操作の対象となるウェブログ内のエントリに関する情報であり、ウェブログURL(ページ情報のページURLと同じものを指す)、エントリURL、更新日時を管理する。また、各エントリに対して、そのエントリ内で頻出する上位の複数(あらかじめ設定された値)の個数のキーワードに対し、キーワードIDと登場回数を保持する。
ログ情報は、この装置の動作ログに関する情報であり、動作エラーや作成したトラックバックの履歴等の情報を記録するものである。
(2)登録部
登録部は、汎用のウェブサーバーソフトウェアと、ユーザーインターフェース提供プログラム、データベースアクセス用のプログラム、情報自動収集用のプログラムによって構成される。
ユーザーインターフェース提供プログラムは、ウェブサーバーソフトウェア上で動作し、ウェブサーバーにアクセスするインターネットブラウザに対して、アクセスしてきた利用者の認証や、各種の情報登録、編集用の画面を提供する。
データベースアクセス用のプログラムは、ユーザーインターフェース提供プログラムに入力された情報をデータベースに保存する。
情報自動収集用のプログラムは、必要に応じて設置され、一定の時間間隔、あるいは動作を指示されたタイミングによって動作して、通常のインターネット検索エンジンが情報収集のために行うインターネット巡回と同様の動作をして、本装置を使ったサービスを明示的に利用申し込みしていないページの情報を収集し、データベースアクセス用のプログラムによってデータベースにそれらの情報を保存する。
(3)更新検知部
更新検知部は、更新通知受付用プログラムと、タイマープログラム、更新確認プログラムによって構成される。それぞれのプログラムは共通の記憶機構として要更新検知ページリストを利用する。
要更新検知ページリストは、データベース、あるいは共有メモリや一時ファイルといった短期的な記憶を保持できる機構上に実現されるページのリストである。
更新通知受付用プログラムは、登録されているウェブログからpingによって更新を通知して貰うためのサーバープログラムで、登録されているウェブログが本装置に更新を通知するためにping送信を利用する場合、そのpingを受け取って通知を発信したページを要更新検知ページリストに入れる。
タイマープログラムは、あらかじめ設定された一定の時間間隔ごとに動作して、データベース内から、最終更新日時がある設定時間以上に古いページを発見して要更新検知ページリストに入れる。
更新確認プログラムは、要更新検知ページリスト内のページに実際にアクセスして、更新の有無を確認して確認を完了したページは要更新検知ページリストから削除する。ページが更新されている場合は、続いて更新内容取得部に内容の取得を指示する。なお、ここでは、簡単に更新確認後、即、更新内容取得という動作の流れを想定しているが、この他にも、更新確認したものはリストに記憶しておいて、更新確認と更新内容の取得を非同期的に動作させる方法も考えられる。
(4)更新内容取得部
更新内容取得部は、更新確認プログラムによって更新内容の取得を指示されているページにアクセスして、実際に更新された内容(ウェブログの場合は更新されたエントリ)を取得し、その情報をデータベースに保存するプログラムである。
更新内容取得部は、取得した内容の中から、データベースに保持されているキーワードを発見し、その登場回数を数え、登場回数が上位のキーワードの情報をデータベースのエントリ情報に記録する。キーワードの発見と登場回数の計算は、単純な単語検索によって行うか、あるいは、形態素解析という既存の文章解析技術(およびそれを実現する既存のプログラム)を利用して行う。
更新内容取得部は、更新内容を取得後、制御部に更新された内容があることを通知し、その後の処理を起動する。なお、ここでは、簡単に更新内容取得後、即、制御という動作の流れを想定しているが、この他にも、内容取得したものはリストに記憶しておいて、更新内容の取得と制御を非同期的に動作させる方法も考えられる。
(5)制御部
制御部は、新たに更新内容取得が取得されたページに対して、すでに登録あるいは取得されているエントリやホームページとを比較し、それぞれの内容の類似度や含まれる単語、それぞれに設定されているパラメータを元にトラックバックをしたりされたりするのが適切かどうかを判断するプログラムである。
制御部は、更新内容が取得されたページに含まれる登場回数の多いキーワードを含むページを、それぞれのキーワードに対してデータベース内から複数個(あらかじめ設定した数等の適当個)取得し、データベースに保持されているそれぞれの頻出キーワードを比較して、重複するキーワードと重複回数を数える。そして、それぞれの重複回数にキーワードごとの重要度を掛け合わせたものを、重複するキーワード全てで合計した数字を求める。その数字が最も高い上位複数個(あらかじめ設定した数等の適当個)のページ間で、トラックバックに関する嗜好を設定するパラメータに反しないものをトラックバックできる組合せの候補とする。ただし、一方がトラックバックに関する嗜好を設定するパラメータに反しないが、他方が反する場合は、一方通行のトラックバックとする。
制御部は、更新内容が取得されたページに含まれる登場回数の多いキーワードが、すでに登録あるいは取得されているエントリやホームページを含むページの重点的にトラックバックを作成するキーワードに設定されていないかを確認し、設定されている場合は、そのページからトラックバックさせる候補にする。そうしたページが複数、発見された場合は、重要度の高い方から優先してトラックバックさせるものとする。
制御部は、トラックバック候補を発見した場合、実行部に引き続く処理を依頼する。ただし、この他にも、トラックバックの候補を一旦、リストに記憶しておいて、制御部の動作と実行部の動作を非同期的に動作させる方法も考えられる。
(6)実行部
実行部は、制御部が発見したトラックバック候補について、そのページやアカウントに設定されているパラメータを元にトラックバックを作成したり、それらの管理者にEメール等で通知を行ったりするプログラムである。
実行部は、実際にトラックバックを行う場合は、トラックバックに必要なエントリURLやエントリのタイトルといった情報をトラックバック作成先のウェブログシステムに送信して、トラックバックの作成を依頼する。
実行部は、Eメールを送る場合は、汎用のメールサーバーソフトウェア、あるいはメーラーソフトウェアやメール送信用プログラムなどの適当なメール送信手段を使ってEメールを送る。
本発明をそのまま使用することで、インターネット上におけるコミュニケーションと広告宣伝を円滑に行うサービスを直ちに開始することが可能である。
本発明装置の全体構成を表す概要図

Claims (3)

  1. 複数のウェブログ(Web Log、ブログとも言う)を登録する仕組みと、それら登録されているウェブログに新しくエントリが作成されたことを検知する仕組みと、登録されているウェブログ内で作成されたエントリの内容を読み取りその中に登場する語句の情報を元に、他のエントリとの関連性の強弱を判断する仕組みを備えていて、一定の時間間隔、あるいは新しくエントリが作成されたことを検知した等のタイミングで、それら関連性の強いエントリ同士の間で双方向に、あるいは片方から他方へとトラックバックを作成するサーバー装置。
  2. 複数のウェブログと複数のホームページを登録する仕組みと、それら登録されているウェブログに新しくエントリが作成されたことを検知する仕組みと、登録されているウェブログ内で作成されたエントリの内容や登録されているホームページの内容を読み取りその中に登場する語句の情報を元に、登録されているウェブログとホームページ間の関連性の強弱を判断する仕組みを備えていて、一定の時間間隔、あるいは新しくエントリが作成されたことを検知した等のタイミングで、それら関連性の強いエントリとホームページの間で、ホームページをウェブログのように扱う技術を用いてホームページからエントリへとトラックバックを作成するサーバー装置。
  3. 請求項1および請求項2において、登録されているウェブログのエントリあるいはホームページに対して、それらの内容とは別にそれらに関連付ける語句を登録、記憶する仕組みを持ち、その仕組みをエントリあるいはホームページ間の関連性を判断する際に使用することを特徴とするもの。
JP2005307763A 2005-09-22 2005-09-22 ウェブログにおいて自動でトラックバックを作成する装置 Pending JP2007087358A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005307763A JP2007087358A (ja) 2005-09-22 2005-09-22 ウェブログにおいて自動でトラックバックを作成する装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005307763A JP2007087358A (ja) 2005-09-22 2005-09-22 ウェブログにおいて自動でトラックバックを作成する装置

Publications (1)

Publication Number Publication Date
JP2007087358A true JP2007087358A (ja) 2007-04-05

Family

ID=37974252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005307763A Pending JP2007087358A (ja) 2005-09-22 2005-09-22 ウェブログにおいて自動でトラックバックを作成する装置

Country Status (1)

Country Link
JP (1) JP2007087358A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008293318A (ja) * 2007-05-25 2008-12-04 Nec Biglobe Ltd トラックバック遮断システムおよびトラックバック遮断方法
JP2009211352A (ja) * 2008-03-04 2009-09-17 Brother Ind Ltd 利用許諾依頼方法、利用許諾依頼サーバ、および利用許諾依頼プログラム
CN117520313A (zh) * 2024-01-02 2024-02-06 北京淇瑀信息科技有限公司 基于多维关联数据仓库切片表的数据回溯方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008293318A (ja) * 2007-05-25 2008-12-04 Nec Biglobe Ltd トラックバック遮断システムおよびトラックバック遮断方法
JP4666314B2 (ja) * 2007-05-25 2011-04-06 Necビッグローブ株式会社 トラックバック遮断システムおよびトラックバック遮断方法
JP2009211352A (ja) * 2008-03-04 2009-09-17 Brother Ind Ltd 利用許諾依頼方法、利用許諾依頼サーバ、および利用許諾依頼プログラム
CN117520313A (zh) * 2024-01-02 2024-02-06 北京淇瑀信息科技有限公司 基于多维关联数据仓库切片表的数据回溯方法及装置
CN117520313B (zh) * 2024-01-02 2024-03-26 北京淇瑀信息科技有限公司 基于多维关联数据仓库切片表的数据回溯方法及装置

Similar Documents

Publication Publication Date Title
US7499940B1 (en) Method and system for URL autocompletion using ranked results
CN107660284B (zh) 基于机器学习的搜索改进
US8515954B2 (en) Displaying autocompletion of partial search query with predicted search results
US9251157B2 (en) Enterprise node rank engine
US8255386B1 (en) Selection of documents to place in search index
CA2747441C (en) Identifying comments to show in connection with a document
US8374975B1 (en) Clustering to spread comments to other documents
US8959062B2 (en) Data storage device with duplicate elimination function and control device for creating search index for the data storage device
CN1906612A (zh) 用于记录通信网络中跨一个或多个搜索引擎的搜索轨迹的方法和系统
US20120089619A1 (en) Systems and methods for determining document freshness
US20080172399A1 (en) System and method for automatically organizing bookmarks through the use of tag data
US20110023122A1 (en) Information providing support device and information providing support method
US9864768B2 (en) Surfacing actions from social data
CN102857572A (zh) 一种http访问请求处理方法、装置及网关设备
US8521746B1 (en) Detection of bounce pad sites
US8661069B1 (en) Predictive-based clustering with representative redirect targets
US8712992B2 (en) Method and apparatus for web crawling
US20090234830A1 (en) System and method for automatic detection of needy queries
JP2007087358A (ja) ウェブログにおいて自動でトラックバックを作成する装置
US20070078854A1 (en) Scoping and biasing search to user preferred domains or blogs
CN105653625B (zh) 一种异常数据分析方法及装置
JP2008234403A (ja) データ検索方法、プログラム及び装置
US11176312B2 (en) Managing content of an online information system
JP2005085113A (ja) 検索サーバ及び検索プログラム
US20230394014A1 (en) Method and system for retrieving data on a web page by performing a simulated user operation on a target web page