JP2005071319A - ホームページ用キーワード取得装置 - Google Patents

ホームページ用キーワード取得装置 Download PDF

Info

Publication number
JP2005071319A
JP2005071319A JP2003408766A JP2003408766A JP2005071319A JP 2005071319 A JP2005071319 A JP 2005071319A JP 2003408766 A JP2003408766 A JP 2003408766A JP 2003408766 A JP2003408766 A JP 2003408766A JP 2005071319 A JP2005071319 A JP 2005071319A
Authority
JP
Japan
Prior art keywords
keyword
homepage
keywords
related keyword
acquisition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003408766A
Other languages
English (en)
Inventor
Toshiyuki Yamamoto
敏行 山本
Masaki Yamamoto
正喜 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2003408766A priority Critical patent/JP2005071319A/ja
Publication of JP2005071319A publication Critical patent/JP2005071319A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ホームページに関し、検索エンジンにおいてヒット率の高くなる可能性の高いキーワードを収集することを課題とする。
【解決手段】 インターネット上に存在する多数のホームページデータを記憶している一以上の検索サーバーに接続されるホームページ用キーワード取得装置であり、基準となるキーワードのテキストデータを基準キーワードとして、この基準キーワードの指定を受け付けるキーワード指定受付手段と、一以上の前記検索サーバーにアクセスして、前記基準キーワードに基づいて所定順位以内に抽出されるホームページデータから、メタタグ間のエリアにキーワードとして記録されているテキストデータを関連キーワードとして取得する関連キーワード取得手段と、取得された関連キーワードを記憶する関連キーワード記憶手段とを有する。
【選択図】 図3

Description

本発明はホームページのメタタグに設定するキーワードを取得する装置に関する。
インターネットの発展により、世界中の事業者や個人がホームページを公開するようになり、無数のホームページがインターネット上に存在する。このために、ホームページをキーワードによって検索する検索エンジンといわれるウエブサイトが多くの事業者により運営されている。検索エンジンにはインターネット上のホームページ情報を自動的に収集するロボット型の検索エンジンと、人間の検閲者が収集したホームページをカテゴリに分けて登録するディレクトリ型の検索エンジンがある。いずれの検索エンジンもホームページの全体に示される文字列およびメタタグといわれるホームページを作成する言語であるHTMLで定められたタグに挟まれたエリアに記憶した文字列を基準にホームページを検索している。ホームページの開設者は特にキーワードとして設定したい文字列はメタタグ間に記載することが一般的であり、検索エンジン側においてもキーワードとしてメタタグ間の文字列を重視することが多い。
ホームページのアクセスを向上させるためには検索エンジンでのヒット率を向上させることが重要であるが、閲覧者が検索エンジンに入力するキーワードとホームページ開設者が設定するキーワードは必ずしも一致するとは限らない。また、ホームページの開設者側からどのようなキーワードが実際には閲覧者に用いられているのかを知ることは容易ではない。このために、不適切な文字列をキーワードとしてメタタグ間に記載することが多く生じ、検索エンジンにおけるヒット率の低下を招いていた。
そこで本発明は、ホームページに関し、検索エンジンにおいてヒット率の高くなる可能性の高いキーワードを収集することを目的とする。
上記課題を解決するために本発明は次のような構成を有する。
請求項1に記載の発明は、インターネット上に存在する多数のホームページデータを記憶している一以上の検索サーバーに接続されるホームページ用キーワード取得装置であり、基準となるキーワードのテキストデータを基準キーワードとして、この基準キーワードの指定を受け付けるキーワード指定受付手段と、一以上の前記検索サーバーにアクセスして、前記基準キーワードに基づいて所定順位以内に抽出されるホームページデータから、メタタグ間のエリアにキーワードとして記録されているテキストデータを関連キーワードとして取得する関連キーワード取得手段と、取得された関連キーワードを記憶する関連キーワード記憶手段とを有する
請求項2に記載の発明は、前記キーワード取得装置において、さらに、関連キーワード取得手段が取得した関連キーワードから記録されていた数の多いものを順に抽出する関連キーワード出現頻度算出手段を有し、前記関連キーワード記憶手段は、前記関連キーワード出願頻度算出手段が抽出した所定順位内の関連キーワードを記憶する。
請求項3に記載の発明は、前記キーワード取得装置において、さらに、関連キーワード取得手段が取得した関連キーワードから記録されていた数の多いものを順に抽出する関連キーワード出現頻度算出手段を有し、前記関連キーワード記憶手段は、前記関連キーワード算出手段により抽出された順が識別できるように前記関連キーワードを記憶する。なお、順が識別できるように記憶するとは、この順に従って記憶したり順番を示すインデックスと関連付ける等により記憶することが例示される。
請求項4に記載の発明はコンピューターに前記キーワード取得装置としての機能を実現させるプログラムである。
本発明は次のような効果を奏する。
請求項1に記載の発明は、基準キーワードに基づいて検索サーバーにより所定順位以内に抽出されるホームページデータのメタタグ間にキーワードとして記録されているテキストデータが取得されることになる。所定順位以内に抽出されるホームページはキーワードの設定が優秀であると推測されることから、これらのキーワードは検索サーバーにおいてヒット率の高いキーワードであると考えられる。すなわち、検索サーバーにおいてヒット率の高いキーワードを収集することができることになる。
請求項2に記載の発明は、関連キーワードから記録されていた数の多いものを順に並べたときの所定順位内の関連キーワードが得られることになる。従って、関連キーワードの中でも特に重要度が高いと推測されるものを得ることができる。
請求項3に記載の発明は、関連キーワードから記録されたいた数の多いものの順番が識別できるので、キーワードを設定する際にこの順番を参考にすることができる。
請求項4に記載の発明は、一般的なコンピューターにより上記のキーワード取得装置を実現することができる。
以下、本発明の実施の形態について、図面を参照しながら説明する。
図1に本実施の形態に係るキーワード取得装置Aが属するネットワークを模式的に示す。図1においてキーワード取得装置Aはインターネットを経由して、複数の検索エンジンサイトを運営する検索サーバーXと、複数のホームページの管理者の端末コンピューターUとに接続されている。キーワード取得装置Aはサーバーであり、ホームページ管理者の端末コンピューターUからの指示を受け付ける。検索サーバーが運営するのはロボット型の検索エンジンであり、検索対象となるホームページデータを記憶している。
図2にキーワード取得装置Aのハードウエア構成を模式的に表すブロック図を示す。キーワード取得装置Aは一般的なコンピューターにより構成され、具体的には演算処理を行うCPU11、CPUの作業領域となるRAM12、基本的なプログラムやデータを記録するROM13、CPUの動作タイミングを取るためのクロック14、データやプログラムを記憶するためのハードディスク15、インターネットに接続するためのルーター等のネットワークインターフェース16などにより構成される。キーワード取得装置Aはこのような一般的なコンピューターに下記に示すような動作を行わせるプログラムを組み込むことにより実現される。
図3に本実施の形態に係るキーワード取得装置Aの機能を模式的に表す機能ブロック図を示す。本キーワード装置Aは機能的にHP記憶部101、HP送信部102、キーワード指定受付部103、関連キーワード取得部104、関連キーワード出現頻度算出部105、関連キーワード記憶部106、HP生成部107とを含む。
HP記憶部101は、ホームページ管理者の端末コンピューターUからの要求に応じて送信するホームページデータを記憶する。
HP送信部102は、端末コンピューターUからの要求に応じてHP記憶部101に記憶されたホームページデータを端末コンピューターUへ送信する。
キーワード指定受付部103は、端末コンピューターUへ送信されるホームページを経由して送信される基準となるキーワードのテキストデータを基準キーワードとして、この基準キーワードの指定を受け付ける。
関連キーワード取得部104は、一以上の前記検索サーバーXにアクセスして、前記基準キーワードに基づいて所定順位以内に抽出されるホームページデータから、メタタグ間のエリアにキーワードとして記録されているテキストデータを関連キーワードとして取得する。具体的にここでは基準キーワードから検索エンジンによって10位以内に抽出されるホームページデータから関連キーワードを取得する。
関連キーワード出現頻度算出部105は、関連キーワード取得手段が取得した関連キーワードから記録されていた数の多いものを順に抽出する。
関連キーワード記憶部106は、取得された関連キーワードのうち、前記関連キーワード出願頻度算出部105が抽出した所定順位内の関連キーワードを順位が上位のものから順に記憶する。具体的にここでは上位10位以内の関連キーワードを抽出する。なお、ここでは後述するHP生成部107により関連キーワードを表示するホームページデータが生成され、HP記憶部101も関連キーワードを所定順位内に入るものだけを順位に従って記憶することになるので、HP記憶部101を関連キーワード記憶部106として用いることも可能である。
HP生成部107は、キーワード取得装置Aの動作により更新されるHPを所定のプログラムに従って生成する。
次に、以上のような構成を有するキーワード取得装置Aの動作について説明する。図4にキーワード取得装置Aの動作を表すフローチャートを示す。最初に、関連キーワードを取得しようとするホームページの管理者は端末コンピューターUを通じて、基準キーワードの受付画面の送信を要求してくるのでHP送信部102はこれを受け付けて端末コンピューターUへ基準キーワード受付画面を送信する(s101)。図5(a)に基準キーワード受付画面500の例を示す。基準キーワード受付画面500は基準となるキーワードを入力する入力ボックス501と入力を確定しホームページ管理装置Aへ送信することを指示する実行ボタン502が含まれる。この基準キーワード受付画面500から管理者は基準キーワードを送信してくるので、キーワード指定受付部103はこれを受け付け(s102)、関連キーワード取得部104がそれぞれの検索サーバーXにアクセスして、この受け付けられた基準キーワードに基づいて10位以内に抽出されるホームページデータから、メタタグ間のエリアにキーワードとして記録されているテキストデータを関連キーワードとして取得する(s103)。そして、関連キーワード出現頻度算出部105が、取得された関連キーワードから記録されていた数の多いものを順に抽出し(s104)、関連キーワード記憶部106が出現頻度の上位10位以内に入る関連キーワードを出現頻度順に記憶する(s105)。それから、HP生成部107が関連キーワードを表示した関連キーワード表示画面を生成し、HP送信部102がこれを端末コンピューターUへ送信する(s106)。図5(b)に関連キーワード表示画面600の例を示す。関連キーワード表示画面は関連キーワード記憶部106に記憶された関連キーワードを出現頻度の順に上から表示するキーワード表示601を含む。以上で、キーワード取得装置Aの動作が完了する。
実施の形態に係るキーワード取得装置の属するネットワークを模式的に示す図である。 実施の形態に係るキーワード取得装置のハードウエア構成を模式的に示すブロック図である。 実施の形態に係るキーワード取得装置の機能を模式的に示す機能ブロック図である。 実施の形態に係るキーワード取得装置の動作を示すフローチャートである。 (a)は基準キーワード受付画面の例を示す図であり、(b)は関連キーワード表示画面の例を示す図である。
符号の説明
103 キーワード指定受付部
104 関連キーワード取得部
105 関連キーワード出現頻度算出部
106 関連キーワード記憶部

Claims (4)

  1. インターネット上に存在する多数のホームページデータを記憶している一以上の検索サーバーに接続されるホームページ用キーワード取得装置であって、
    基準となるキーワードのテキストデータを基準キーワードとして、この基準キーワードの指定を受け付けるキーワード指定受付手段と、
    一以上の前記検索サーバーにアクセスして、前記基準キーワードに基づいて所定順位以内に抽出されるホームページデータから、メタタグ間のエリアにキーワードとして記録されているテキストデータを関連キーワードとして取得する関連キーワード取得手段と、
    取得された関連キーワードを記憶する関連キーワード記憶手段と
    を有するホームページ用キーワード取得装置
  2. 前記キーワード取得装置において、さらに、
    関連キーワード取得手段が取得した関連キーワードから記録されていた数の多いものを順に抽出する関連キーワード出現頻度算出手段を有し、
    前記関連キーワード記憶手段は、前記関連キーワード出願頻度算出手段が抽出した所定順位内の関連キーワードを記憶する
    請求項1に記載のホームページ用キーワード取得装置。
  3. 前記キーワード取得装置において、さらに、
    関連キーワード取得手段が取得した関連キーワードから記録されていた数の多いものを順に抽出する関連キーワード出現頻度算出手段を有し、
    前記関連キーワード記憶手段は、前記関連キーワード算出手段により抽出された順が識別できるように前記関連キーワードを記憶する請求項1に記載のホームページ用キーワード取得装置。
  4. コンピューターに請求項1から3のいずれか1項に記載のキーワード取得装置としての機能を実現させるプログラム。
JP2003408766A 2003-08-01 2003-12-08 ホームページ用キーワード取得装置 Pending JP2005071319A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003408766A JP2005071319A (ja) 2003-08-01 2003-12-08 ホームページ用キーワード取得装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003284935 2003-08-01
JP2003408766A JP2005071319A (ja) 2003-08-01 2003-12-08 ホームページ用キーワード取得装置

Publications (1)

Publication Number Publication Date
JP2005071319A true JP2005071319A (ja) 2005-03-17

Family

ID=34425107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003408766A Pending JP2005071319A (ja) 2003-08-01 2003-12-08 ホームページ用キーワード取得装置

Country Status (1)

Country Link
JP (1) JP2005071319A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009140089A (ja) * 2007-12-04 2009-06-25 Internatl Business Mach Corp <Ibm> ウェブコンテンツに検索用キーワードを付加するシステムおよび方法
KR100929925B1 (ko) 2009-07-16 2009-12-04 주식회사 네오패드 홈페이지 통합 서비스 제공 시스템 및 방법
KR100945570B1 (ko) 2009-07-15 2010-03-08 주식회사 네오패드 홈페이지 등록, 관리 및 검색 서비스 제공 시스템 및 방법
JP2010244425A (ja) * 2009-04-08 2010-10-28 Canon Inc 情報処理装置、情報処理方法、プログラム及び記憶媒体
WO2011007935A1 (ko) * 2009-07-15 2011-01-20 주식회사 네오패드 홈페이지 통합 서비스 제공 시스템 및 방법
KR101040119B1 (ko) 2008-10-14 2011-06-09 한국전자통신연구원 콘텐츠 검색 장치 및 방법

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009140089A (ja) * 2007-12-04 2009-06-25 Internatl Business Mach Corp <Ibm> ウェブコンテンツに検索用キーワードを付加するシステムおよび方法
KR101040119B1 (ko) 2008-10-14 2011-06-09 한국전자통신연구원 콘텐츠 검색 장치 및 방법
JP2010244425A (ja) * 2009-04-08 2010-10-28 Canon Inc 情報処理装置、情報処理方法、プログラム及び記憶媒体
KR100945570B1 (ko) 2009-07-15 2010-03-08 주식회사 네오패드 홈페이지 등록, 관리 및 검색 서비스 제공 시스템 및 방법
WO2011007935A1 (ko) * 2009-07-15 2011-01-20 주식회사 네오패드 홈페이지 통합 서비스 제공 시스템 및 방법
CN102105875A (zh) * 2009-07-15 2011-06-22 呢哦派豆株式会社 用于提供全面主页服务的系统和方法
CN102105875B (zh) * 2009-07-15 2013-05-01 呢哦派豆株式会社 用于提供全面主页服务的系统和方法
US8892537B2 (en) 2009-07-15 2014-11-18 Neopad Inc. System and method for providing total homepage service
KR100929925B1 (ko) 2009-07-16 2009-12-04 주식회사 네오패드 홈페이지 통합 서비스 제공 시스템 및 방법

Similar Documents

Publication Publication Date Title
US6401118B1 (en) Method and computer program product for an online monitoring search engine
TW504624B (en) Method and apparatus for automatically processing acquired data and contextual information and associating the same with available multimedia resources
US8438469B1 (en) Embedded review and rating information
JP5084858B2 (ja) サマリ作成装置、サマリ作成方法及びプログラム
JP2004258911A (ja) サーバ、情報収集方法及びプログラム
JP2004206517A (ja) ホットキーワード提示方法及びホットサイト提示方法
JP2003178092A (ja) 情報検索システム、情報提供装置及び情報検索方法並びにプログラム
CN109101607B (zh) 用于搜索区块链数据的方法、装置及存储介质
JP2003076715A (ja) ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体
JP2009037501A (ja) 情報検索装置、情報検索方法およびプログラム
JP2011034399A (ja) Webページの関連性抽出方法、装置、及びプログラム
US8868551B2 (en) Method for storing bookmarks for search results from previously submitted search queries by a user and storing links to selected documents by the user
JP2008097259A (ja) アクセス解析を利用した営業支援システム及び営業支援方法
WO2014029358A1 (en) Method and apparatus for switching search engine to repeat search
US20060116992A1 (en) Internet search environment number system
JP2005071319A (ja) ホームページ用キーワード取得装置
JP5321258B2 (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
JP2004078689A (ja) 検索システム及び検索プログラム並びに検索方法
JP4653805B2 (ja) 意味検索プログラム
JP2006236221A (ja) ウエブページ検索のための管理サーバ装置
JP2003228584A (ja) サイト情報提供装置、サイト情報提供方法、サイト情報提供システム、プログラム及び記録媒体
JP2015069544A (ja) 医療情報提供システム、サーバ、医療情報提供方法、およびプログラム
JP2018072873A (ja) 情報処理装置、情報処理方法、およびプログラム
JP4996504B2 (ja) Sbmサーバ、登録用画面生成方法及びプログラム
JP6528341B1 (ja) 情報処理装置、情報処理方法及びプログラム