JP2009140089A - ウェブコンテンツに検索用キーワードを付加するシステムおよび方法 - Google Patents
ウェブコンテンツに検索用キーワードを付加するシステムおよび方法 Download PDFInfo
- Publication number
- JP2009140089A JP2009140089A JP2007313903A JP2007313903A JP2009140089A JP 2009140089 A JP2009140089 A JP 2009140089A JP 2007313903 A JP2007313903 A JP 2007313903A JP 2007313903 A JP2007313903 A JP 2007313903A JP 2009140089 A JP2009140089 A JP 2009140089A
- Authority
- JP
- Japan
- Prior art keywords
- web content
- keyword
- server
- web
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Abstract
【解決手段】ウェブコンテンツを取得するウェブコンテンツ取得部110と、ウェブコンテンツに対して任意に関連付けられたキーワードをSBM(ソーシャル・ブックマーク)サーバ300からキーワードを取得するキーワード取得部120と、このウェブコンテンツ取得部110により取得されたウェブコンテンツに、キーワード取得部120により取得されたキーワードを付加するキーワード付加部130と、キーワードが付加されたウェブコンテンツを、ウェブコンテンツの検索サービスを提供する検索サーバ400からのウェブコンテンツの取得要求に応じて送信する送信部140と、を備える。
【選択図】図3
Description
また、キーワード付加部は、ウェブコンテンツのヘッダに記載されるメタ情報として、キーワードを付加する。
<システム構成>
図1は、本実施形態によるウェブページの処理システムを概略的に示す図である。
図1において、処理サーバ100は、所定のウェブページに関連するキーワードを取得し、ウェブページに自動的に付加するサーバである。ウェブサーバ200は、ウェブコンテンツ(ウェブページを含む)を提供するサーバである。ウェブコンテンツは、ウェブサーバ200に設けられた磁気ディスク装置等の記憶手段に格納されていても良いし、アクセス要求を受け取った際に動的に生成されるものであっても良い。SBM(ソーシャル・ブックマーク)サーバ300は、インターネット上でブックマークを共有するソーシャル・ブックマーク・サービスを提供するサーバである。ソーシャル・ブックマーク・サービスにおいては、登録されたウェブコンテンツに対して登録者が任意の語句を関連付け、タグとして付加することができる。SBMサーバ300は、このタグをウェブコンテンツに関連するキーワードとして管理する。検索サーバ400は、検索エンジンにより任意の語句を検索キーとしてウェブコンテンツを検索するサービスを提供するサーバである。この検索サーバ400は、クローラ等の検索ロボットやウェブブラウザの機能によりインターネット上のサイトを巡回し、ウェブコンテンツの情報を収集している。
図2に示すコンピュータ10は、演算手段であるCPU(Central Processing Unit)10aと、記憶手段であるメイン・メモリ10cおよび磁気ディスク装置(HDD:Hard Disk Drive)10gを備える。また、ネットワークを介して外部装置に接続するためのネットワーク・インタフェース・カード10fと、表示出力を行うためのビデオ・カード10dおよび表示装置10jと、音声出力を行うための音声機構10hとを備える。さらに、キーボードやマウス等の入力デバイス10iを備える。
図3は、処理サーバ100の機能構成を示す図である。
図3に示すように、処理サーバ100は、ウェブコンテンツを取得するウェブコンテンツ取得部110と、キーワードを取得するキーワード取得部120とを備える。また、ウェブコンテンツに検索用キーワードを付加するキーワード付加部130とを備える。さらに、キーワードが埋め込まれたウェブコンテンツを検索サーバ400へ送信する送信部140と、ソーシャル・ブックマークのリストおよびキーワードを埋め込む対象のウェブコンテンツの管理情報を保持する記憶部150とを備える。記憶部150に保持されるウェブコンテンツの管理情報は、例えばウェブコンテンツのURLやウェブサーバ200のリストである。また、ウェブコンテンツ自体を蓄積しても良い。
1.ブックマークを作成したユーザと、そのブックマークに付加したタグの一覧
2.取得要求で指定されたURLに対して付加されたタグの一覧と、そのタグが付加された回数
1の場合であれば、タグごとにユーザ数を集計し、2の場合であれば、取得した情報をそのまま用いることで、取得要求で指定されるURLに関して{タグ、そのタグが付けられた回数}という形式のデータが得られる。
図4に示す例では、キーワード情報に、所定のウェブコンテンツに対してタグが付加された回数("count")とタグの一覧("bookmarks")が含まれている。タグの一覧には、コメント("comment")、タグが付加された日時("timestamp")、タグを付加したユーザ("user")、付加されたタグの語句("tags")の各項目が記録されている。
図5に示すように、キーワード付加部130は、まず処理対象のウェブコンテンツ(HTML文書)を解析し、<head>要素内の<meta>要素のうちでname属性の値が“Keywords”であるものを探す(ステップ501)。そのような<meta>要素が存在する場合(ステップ502でYes)、その<meta>要素のcontent属性に、SBMサーバ300から取得し加工したキーワード・リストを追加する(ステップ503)。このとき、<meta>要素に既に記載されている元のキーワードのリストに対して、新たなキーワード・リストをどのように統合するか(先頭に追加、末尾に追加、特定の方法(例えばアイウエオ順)で並べ替える等)は任意である。
図1においては、個々のサーバの役割を明確にするため、処理サーバ100を独立に記載した。しかし、実際のシステム構成としては、様々な態様で処理サーバ100を導入することができる。代表的な例としては、ウェブサーバ200のプラグイン機能として実現する場合と、ウェブサーバ200と検索サーバ400との間の送受信を中継するプロキシ・サーバの機能として実現する場合とがある。
図8に示す構成では、検索サーバ400のウェブブラウザや検索ロボットは、ウェブサーバ200に対して、URLを指定しウェブコンテンツを要求する。ウェブサーバ200は、ウェブコンテンツと提供するためのウェブコンテンツ提供部210を備えている。そして、検索サーバ400からの取得要求を受け付けると、ウェブコンテンツ提供部210が、取得要求において指定されたURLおよびこのURLのウェブコンテンツを処理サーバ100に渡す。このウェブコンテンツは、記憶装置から読み出しても良いし、検索サーバ400からの取得要求に応じて動的に生成しても良い。
図9に示す例では、検索サーバ400のウェブブラウザや検索ロボットから送信されたウェブコンテンツの取得要求は、プロキシ・サーバである処理サーバ100を介してウェブサーバ200に取得される。ウェブサーバ200は、この取得要求を受け付けると、指定されたURLおよびこのURLのウェブコンテンツを処理サーバ100へ返送する。このウェブコンテンツは、記憶装置から読み出しても良いし、動的に生成しても良い。
Claims (13)
- ウェブコンテンツを取得し記憶手段に格納するウェブコンテンツ取得部と、
前記ウェブコンテンツに対して任意に関連付けられたキーワードを管理する管理サーバから当該キーワードを取得するキーワード取得部と、
前記ウェブコンテンツ取得部により取得され前記記憶手段に格納された前記ウェブコンテンツに、前記キーワード取得部により取得された前記キーワードを付加するキーワード付加部と、
前記キーワード付加部により前記キーワードが付加されたウェブコンテンツを、ウェブコンテンツの検索サービスを提供する検索サーバからのウェブコンテンツの取得要求に応じて送信する送信部と、
を備えるシステム。 - 前記ウェブコンテンツ取得部、前記キーワード取得部、前記キーワード付加部、前記送信部は、前記ウェブコンテンツを提供するウェブサーバの機能として実現される、請求項1に記載のシステム。
- 前記ウェブコンテンツ取得部、前記キーワード取得部、前記キーワード付加部、前記送信部は、前記ウェブコンテンツを提供するウェブサーバと前記検索サーバとの間で行われるウェブコンテンツの取得要求および応答を中継する中継サーバの機能として実現され、
前記ウェブコンテンツ取得部は、前記ウェブサーバから前記ウェブコンテンツを取得する、請求項1に記載のシステム。 - 前記キーワード取得部は、前記管理サーバであるソーシャル・ブックマーク・サーバから、ソーシャル・ブックマークにおいて前記ウェブコンテンツに付加されているタグを前記キーワードとして取得する、請求項1に記載のシステム。
- 前記キーワード付加部は、ウェブコンテンツのヘッダに記載されるメタ情報として、前記キーワードを付加する、請求項1に記載のシステム。
- 前記キーワード取得部は、前記検索サーバからのウェブコンテンツの取得要求を受け付けた場合に、当該取得要求において指定されているウェブページに関連付けられた前記キーワードを前記管理サーバから取得する、請求項1に記載のシステム。
- 前記キーワード取得部は、所定のタイミングで、特定のウェブコンテンツに関連付けられた前記キーワードを前記管理サーバから取得し、
前記キーワード付加部は、所定のタイミングで、前記キーワード取得部により取得された前記キーワードを前記特定のウェブコンテンツに付加し、当該キーワードが付加されたウェブコンテンツを記憶手段に保持し、
前記送信部は、前記検索サーバからのウェブコンテンツの取得要求を受け付けた場合に、前記記憶手段に保持されている前記キーワードが付加されたウェブコンテンツを当該検索サーバへ送信する、請求項1に記載のシステム。 - ウェブコンテンツを提供するウェブサーバにおいて、
ウェブコンテンツの検索サービスを提供する検索サーバからのウェブコンテンツの取得要求に応じて、当該取得要求に係るウェブコンテンツを提供するウェブコンテンツ提供部と、
前記ウェブコンテンツ提供部により提供されたウェブコンテンツを取得し記憶手段に格納するウェブコンテンツ取得部と、
前記ウェブコンテンツに対して任意に関連付けられたキーワードを管理する管理サーバから当該キーワードを取得するキーワード取得部と、
前記ウェブコンテンツ取得部により取得され前記記憶手段に格納された前記ウェブコンテンツに、前記キーワード取得部により取得された前記キーワードを付加するキーワード付加部と、
前記キーワード付加部により前記キーワードが付加されたウェブコンテンツを前記検索サーバに送信する送信部と、
を備えるウェブサーバ。 - 前記キーワード取得部は、前記管理サーバであるソーシャル・ブックマーク・サーバから、ソーシャル・ブックマークにおいて前記ウェブコンテンツに付加されているタグを前記キーワードとして取得する、請求項8に記載のウェブサーバ。
- 前記キーワード付加部は、ウェブコンテンツのヘッダに記載されるメタ情報として、前記キーワードを付加する、請求項8に記載のウェブサーバ。
- ウェブコンテンツの処理方法であって、
ウェブコンテンツを取得し記憶手段に格納するステップと、
前記ウェブコンテンツに対して任意に関連付けられたキーワードを管理する管理サーバから当該キーワードを取得するステップと、
前記記憶手段に格納された前記ウェブコンテンツに対して、当該ウェブコンテンツのヘッダに記載されるメタ情報として、前記キーワードを付加するステップと、
前記キーワードが付加されたウェブコンテンツを、ウェブコンテンツの検索サービスを提供する検索サーバからのウェブコンテンツの取得要求に応じて送信するステップと、
を含む方法。 - 前記キーワードを取得するステップでは、前記管理サーバであるソーシャル・ブックマーク・サーバから、ソーシャル・ブックマークにおいて前記ウェブコンテンツに付加されているタグを前記キーワードとして取得する、請求項11に記載の方法。
- コンピュータを、
ウェブコンテンツを取得し記憶手段に格納するウェブコンテンツ取得手段と、
前記ウェブコンテンツに対して任意に関連付けられたキーワードを管理する管理サーバから当該キーワードを取得するキーワード取得手段と、
前記ウェブコンテンツ取得手段により取得され前記記憶手段に格納された前記ウェブコンテンツに、前記キーワード取得手段により取得された前記キーワードを付加するキーワード付加手段と、
前記キーワード付加手段により前記キーワードが付加されたウェブコンテンツを、ウェブコンテンツの検索サービスを提供する検索サーバからのウェブコンテンツの取得要求に応じて送信する送信手段として、
動作させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007313903A JP2009140089A (ja) | 2007-12-04 | 2007-12-04 | ウェブコンテンツに検索用キーワードを付加するシステムおよび方法 |
US12/325,593 US20090144231A1 (en) | 2007-12-04 | 2008-12-01 | System and Method for Adding Search Keywords to Web Content |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007313903A JP2009140089A (ja) | 2007-12-04 | 2007-12-04 | ウェブコンテンツに検索用キーワードを付加するシステムおよび方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009140089A true JP2009140089A (ja) | 2009-06-25 |
Family
ID=40676762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007313903A Pending JP2009140089A (ja) | 2007-12-04 | 2007-12-04 | ウェブコンテンツに検索用キーワードを付加するシステムおよび方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20090144231A1 (ja) |
JP (1) | JP2009140089A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014067374A (ja) * | 2012-09-27 | 2014-04-17 | Konami Digital Entertainment Co Ltd | 検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005071319A (ja) * | 2003-08-01 | 2005-03-17 | Toshiyuki Yamamoto | ホームページ用キーワード取得装置 |
JP2005209020A (ja) * | 2004-01-23 | 2005-08-04 | Sony Corp | 属性情報提供システム,属性情報管理装置,利用者端末,属性情報管理方法,およびコンピュータプログラム |
JP2007133809A (ja) * | 2005-11-14 | 2007-05-31 | Canon Inc | 情報処理装置、コンテンツ処理方法、記憶媒体およびプログラム |
JP2007272390A (ja) * | 2006-03-30 | 2007-10-18 | Sony Corp | リソース管理装置、タグ候補選定方法及びタグ候補選定プログラム |
JP2007286768A (ja) * | 2006-04-13 | 2007-11-01 | Shigetoshi Fumiki | 情報提供システム及び情報提供プログラム、並びにサーバ装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6725227B1 (en) * | 1998-10-02 | 2004-04-20 | Nec Corporation | Advanced web bookmark database system |
US7747937B2 (en) * | 2005-08-16 | 2010-06-29 | Rojer Alan S | Web bookmark manager |
US20070124208A1 (en) * | 2005-09-20 | 2007-05-31 | Yahoo! Inc. | Method and apparatus for tagging data |
JP2007233856A (ja) * | 2006-03-02 | 2007-09-13 | Sony Corp | 情報処理装置、情報処理システム、および方法、並びにコンピュータ・プログラム |
US8112703B2 (en) * | 2006-07-21 | 2012-02-07 | Yahoo! Inc. | Aggregate tag views of website information |
US9858341B2 (en) * | 2006-08-02 | 2018-01-02 | Jason Frankovitz | Method and apparatus for remotely monitoring a social website |
US20090063265A1 (en) * | 2007-09-04 | 2009-03-05 | Yahoo! Inc. | Information network for text ads |
US7953731B2 (en) * | 2007-11-19 | 2011-05-31 | Cisco Technology, Inc. | Enhancing and optimizing enterprise search |
-
2007
- 2007-12-04 JP JP2007313903A patent/JP2009140089A/ja active Pending
-
2008
- 2008-12-01 US US12/325,593 patent/US20090144231A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005071319A (ja) * | 2003-08-01 | 2005-03-17 | Toshiyuki Yamamoto | ホームページ用キーワード取得装置 |
JP2005209020A (ja) * | 2004-01-23 | 2005-08-04 | Sony Corp | 属性情報提供システム,属性情報管理装置,利用者端末,属性情報管理方法,およびコンピュータプログラム |
JP2007133809A (ja) * | 2005-11-14 | 2007-05-31 | Canon Inc | 情報処理装置、コンテンツ処理方法、記憶媒体およびプログラム |
JP2007272390A (ja) * | 2006-03-30 | 2007-10-18 | Sony Corp | リソース管理装置、タグ候補選定方法及びタグ候補選定プログラム |
JP2007286768A (ja) * | 2006-04-13 | 2007-11-01 | Shigetoshi Fumiki | 情報提供システム及び情報提供プログラム、並びにサーバ装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014067374A (ja) * | 2012-09-27 | 2014-04-17 | Konami Digital Entertainment Co Ltd | 検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20090144231A1 (en) | 2009-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9665642B2 (en) | Automatic identification of digital content related to a block of text, such as a blog entry | |
US8438469B1 (en) | Embedded review and rating information | |
KR100705411B1 (ko) | 로컬 컴퓨터 검색 시스템 및 이를 이용한 로컬 컴퓨터 검색방법 | |
AU2005231112B2 (en) | Methods and systems for structuring event data in a database for location and retrieval | |
JP6169764B2 (ja) | ユーザアクションに基づく演算デバイスへの実行可能コンテンツの提供 | |
US20160070797A1 (en) | Methods and systems for prioritizing a crawl | |
US7707142B1 (en) | Methods and systems for performing an offline search | |
JP4962945B2 (ja) | ブックマーク・タグ設定装置 | |
US20070094243A1 (en) | System and method of searching for previously visited website information | |
KR102197462B1 (ko) | 디바이스 상의 결합된 활동 히스토리 | |
US20100114914A1 (en) | Selective Home Page Manager | |
JP2006065395A (ja) | ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム | |
US20100077300A1 (en) | Computer Method and Apparatus Providing Social Preview in Tag Selection | |
RU2633180C2 (ru) | Система и способ управления браузерным приложением, постоянный машиночитаемый носитель и электронное устройство | |
JP5284064B2 (ja) | 商品idサーバ装置、および商品idサーバ装置の制御方法 | |
JP2005275488A (ja) | 入力支援方法およびプログラム | |
US20110072045A1 (en) | Creating Vertical Search Engines for Individual Search Queries | |
US10235459B1 (en) | Creating entries in at least one of a personal cache and a personal index | |
US9594836B2 (en) | Adjusting search level detail | |
JP2010231442A (ja) | 情報提供装置 | |
JP4602104B2 (ja) | サイト情報収集システム | |
JP2009140089A (ja) | ウェブコンテンツに検索用キーワードを付加するシステムおよび方法 | |
US20110208718A1 (en) | Method and system for adding anchor identifiers to search results | |
JP2006236221A (ja) | ウエブページ検索のための管理サーバ装置 | |
JP5386548B2 (ja) | 急上昇ワード抽出装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100723 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20111207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121218 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130521 |