JP2008262559A - ディレクトリタグ付けサービスを提供する方法及びシステム - Google Patents

ディレクトリタグ付けサービスを提供する方法及びシステム Download PDF

Info

Publication number
JP2008262559A
JP2008262559A JP2008096688A JP2008096688A JP2008262559A JP 2008262559 A JP2008262559 A JP 2008262559A JP 2008096688 A JP2008096688 A JP 2008096688A JP 2008096688 A JP2008096688 A JP 2008096688A JP 2008262559 A JP2008262559 A JP 2008262559A
Authority
JP
Japan
Prior art keywords
tag
web page
directory
words
tagging service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008096688A
Other languages
English (en)
Other versions
JP4728364B2 (ja
Inventor
Chun Sik Kang
春 植 姜
Token Kim
到 妍 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NHN Corp
Original Assignee
NHN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NHN Corp filed Critical NHN Corp
Publication of JP2008262559A publication Critical patent/JP2008262559A/ja
Application granted granted Critical
Publication of JP4728364B2 publication Critical patent/JP4728364B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ディレクトリタグ付けサービスを提供する方法およびこの方法を実行するシステムを提供する。
【解決手段】ディレクトリタグ付けサービスを提供する方法は、ウェブページから現頻度順に所定の数の単語を抽出する段階と、抽出された単語を用いてウェブページのタグリストを生成および維持する段階と、ウェブページにアクセスしたユーザにタグリストを提供し、ユーザから選択されたタグを確認する段階と、選択されたタグをウェブページと連関してタグデータベースに保存および維持する段階とを含む。このとき、ディレクトリタグ付けサービスを提供する方法は、タグデータベースを用いてウェブページを露出させる段階をさらに含むことができる。
【選択図】図2

Description

本発明は、ディレクトリタグ付けサービス(directory tagging service)を提供する方法及びこの方法を実行するシステムに関し、より詳細には、ウェブページに対するタグを用いてユーザのディレクトリサービスへの参加を誘導して集団的知性を導き出すことによりディレクトリサービスに対するユーザの興味と関心を誘発させ、ウェブページを提供するサービスの正確度を高めることでユーザの満足度を高める方法及びシステムに関する。
ディレクトリサービスとは、インターネット情報資源を分類体系に組職化し、検索及びブラウジングできるようにすることで、ユーザが所望する情報を容易に探し出せるようにするサービスを意味する。図1は、従来技術におけるディレクトリサービスを説明するための一例である。
ポータルサイトなどを提供するサーバ101は、ディレクトリデータベース103を用いて、検索、ブラウジング、又は検索結果の詳細情報などのディレクトリサービス104をユーザ端末機102に提供することができる。このようなディレクトリサービス104は、効率的な情報検索、又はユーザにとって価値ある情報を収集及び組職化してユーザに提供するために用いられる。
しかし、既存のディレクトリサービスは、ディレクトリサービスに対する評価のように、ユーザによる単方向性の参加だけが可能であって積極的な参加通路は存在しない実情であり、これによってサービスが全般的に停滞するという問題点を抱えていた。
本発明は、前記のような問題点を解決するために案出されたものであって、ディレクトリタグ付けサービスを提供する方法およびこの方法を実行するシステムに関する新しい技術を提案する。
本発明は、ディレクトリサービスのウェブページに対するタグをユーザが選択できるようにすることで、ユーザのディレクトリサービスへの参加を誘導して集団的知性を導き出すことにより、ディレクトリサービスに対するユーザの興味と関心を誘発してディレクトリサービスを活性化させることを目的とする。
さらに、本発明は、ディレクトリデータベースに存在するURLを用い、このURLに該当するウェブページから所定の数の単語をタグとして抽出することで、ウェブページを提供するサービスの正確度を高めることにより、ユーザの満足度を高めることを他の目的とする。
前記の目的を達成し、上述した従来技術の問題点を解決するために、本発明の一実施形態に係るディレクトリタグ付けサービスを提供する方法は、ウェブページから出現頻度順に所定の数の単語を抽出する段階と、前記単語を用いて前記ウェブページのタグリストを生成および維持する段階と、前記ウェブページにアクセスしたユーザに前記タグリストを提供し、前記ユーザにより選択されたタグを確認する段階と、前記選択されたタグを前記ウェブページと連関してタグデータベースに保存および維持する段階とを含む。このとき、ディレクトリタグ付けサービスを提供する前記方法は、前記タグデータベースを用いて前記ウェブページを露出させる段階をさらに含むことができる。
本発明の一側面によれば、前記タグデータベースを用いて前記ウェブページを露出させる前記段階は、前記ユーザから前記ウェブページと連関して保存された同一タグの数に応じて、(1)前記タグを含む検索語に対する前記ウェブページの検索ランキングに前記タグ数を反映したり、(2)前記タグを検索キーワードとして追加したり、(3)前記タグを検索ページを介して提供したりすることで、前記ウェブページを露出させる段階であり得る。
本発明の他の側面によれば、ウェブページから出現頻度順に所定の数の単語を抽出する前記段階は、ディレクトリデータベースからURLを抽出する段階と、前記URLに該当するウェブページを巡回してテキスト内容を抽出する段階と、前記テキスト内容から単語を抽出し、前記単語別に前記出現頻度を集計する段階と、前記単語のうちから前記出現頻度順に前記所定の数の単語を抽出する段階とを含むことができる。
本発明のさらに他の側面によれば、前記単語を用いて前記ウェブページのタグリストを生成および維持する前記段階は、前記出現頻度順に整列された前記単語のリストを前記タグリストとして生成して維持する段階であり得る。また、前記ウェブページにアクセスしたユーザに前記タグリストを提供し、前記ユーザから選択されたタグを確認する前記段階は、前記ウェブページが含む詳細情報提供機能によって前記タグリストを提供し、前記タグリストのタグのうちから前記ユーザによって選択されたタグを確認する段階であり得る。
本発明の他の実施形態において、ディレクトリタグ付けサービスを提供するシステムは、ウェブページから出現頻度順に所定の数の単語を抽出する単語抽出部と、前記単語を前記ウェブページのタグとしてタグリストを生成および維持するタグリスト維持部と、前記ウェブページにアクセスしたユーザに前記タグリストを提供し、前記ユーザから選択されたタグを確認するタグ確認部と、前記選択されたタグを前記ウェブページと連関して保存および維持するタグデータベースとを含む。このとき、ディレクトリタグ付けサービス提供システムは、前記タグデータベースを用いて前記ウェブページを露出させるウェブページ露出部をさらに含むことができる。
本発明によれば、ディレクトリサービスのウェブページに対するタグをユーザが選択することで、ユーザのディレクトリサービスへの参加を誘導して集団的知性を導き出すことにより、ディレクトリサービスに対するユーザの興味と関心を誘発してディレクトリサービスを活性化することができる。
また、本発明によれば、ディレクトリデータベースに存在するURLを用い、このURLに該当するウェブページから所定の数の単語をタグとして抽出することで、ウェブページを提供するサービスの正確度を高めてユーザの満足度を高めることができる。
以下、添付の図面を参照しながら、本発明に係る多様な実施形態について詳しく説明する。
図2は、本実施形態に係るディレクトリタグ付けサービス提供システムを概括的に示した図である。
本実施形態に係るディレクトリタグ付けサービス提供システムは、ディレクトリデータベース201からURLを抽出(202)し、抽出されたURLに該当するウェブページを巡回(203)してテキスト内容を抽出する。この後、ディレクトリタグ付けサービス提供システムは、抽出されたテキスト内容から単語(例えば名詞)を抽出し、この出現頻度を集計(測定)することで、出現頻度順に所定の数の単語を抽出(204)する。
このようにして抽出された単語は、ウェブページのタグとして用いられる。すなわち、本実施形態のディレクトリタグ付けサービス提供システムは、このような抽出されたタグを出現頻度順に整列することで、ウェブページのタグリスト205を生成し、維持する。
また、本実施形態のディレクトリタグ付けサービス提供システムは、ウェブページにアクセスするユーザにタグリスト205を提供し、ユーザによりタグリスト205から選択されたタグを確認(206)する。このような選択されたタグは、ウェブページと連関してタグデータベース207に保存され、タグデータベース207は、検索、ブラウジング、またはウェブページの詳細情報に用いられる。
図3は、本発明の一実施形態において、ディレクトリタグ付けサービスを提供する方法を示したフローチャートである。
段階S301で、タグを用いてディレクトリサービスを提供する本実施形態のディレクトリタグ付けサービス提供システムは、ウェブページから出現頻度順に所定の数の単語を抽出する。具体的には、本実施形態のディレクトリタグ付けサービス提供システムは、ウェブページで多く出現する順に単語を所定の数だけ抽出する。このような単語を抽出する方法については、図4を参照しながらより詳しく説明する。
段階S302で、本実施形態のディレクトリタグ付けサービス提供システムは、抽出された単語を用いてウェブページのタグリストを生成および維持する。このとき、本実施形態のディレクトリタグ付けサービス提供システムは、出現頻度順に整列された単語のリストを、タグリストとして生成して維持する。
段階S303で、本実施形態のディレクトリタグ付けサービス提供システムは、ウェブページにアクセスしたユーザにタグリストを提供し、ユーザから選択されたタグを確認する。具体的には、本実施形態のディレクトリタグ付けサービス提供システムは、ウェブページが含んでいる詳細情報提供機能によってタグリストをユーザに提供し、提供されたタグリストのタグのうちからユーザによって選択されたタグを確認する。
例えば、本実施形態のディレクトリタグ付けサービス提供システムは、詳細情報提供機能によってタグそれぞれにチェックボックスが付されているタグリストをユーザに提供する。このとき、ユーザは、ディレクトリサービスの利用中に現在使用しているウェブページの詳細情報提供機能によって提供される詳細情報を介してタグリストの提供を受け、このタグリストが含んでいるタグのチェックボックスのうち特定のタグのチェックボックスにチェックすることでタグを選択することができる。すなわち、本実施形態のディレクトリタグ付けサービス提供システムは、ユーザによってチェックされたチェックボックスを参照することで、ユーザから選択されたタグを確認する。
また、本実施形態のディレクトリタグ付けサービス提供システムは、詳細情報提供機能によってタグリストを提供する場合に、タグ別統計をタグリストとともに提供することで、ユーザがタグを選択するときにウェブページにおけるタグ毎の出現頻度を参照できるようにする。
段階S304で、本実施形態のディレクトリタグ付けサービス提供システムは、選択されたタグをウェブページと連関してタグデータベースに保存および維持する。このとき、本実施形態のディレクトリタグ付けサービス提供システムは、タグデータベースに同一のウェブページと連関した同一のタグが既に存在するか否かを確認し、同一タグが存在するか否かに応じてタグをウェブページと連関して保存する。
すなわち、タグデータベースは、1つのウェブページと連関した同一タグの数が選択されたタグと連関して保存される。本実施形態のディレクトリタグ付けサービス提供システムは、同一タグが存在するか否かに応じてタグを保存するため、同一のタグが存在する場合には同一のタグの数を増加させ、同一タグが存在しない場合には選択されたタグをウェブページと連関して保存する。
より詳しく説明すれば、本実施形態のディレクトリタグ付けサービス提供システムは、同一のウェブページに対する同一のタグが既にタグデータベースに保存されている場合には、このような同一タグの数を増加させることによって、同一のウェブページに対する同一のタグの数を確認する。また、同一のタグがタグデータベースに保存されていない場合には、当該タグを抽出されたウェブページと連関して保存する。例えば、ウェブページ「A」に対するタグ「B」が存在している場合に、その数が「3」である場合には、数を増加させて「4」として保存する。また、ウェブページ「A」から抽出されたタグ「B」が存在しない場合には、タグ「B」をウェブページ「A」と連関して保存する。なお、このときの数は「1」となる。
段階S305で、本実施形態のディレクトリタグ付けサービス提供システムは、タグデータベースを用いてウェブページを露出させる。このとき、本実施形態のディレクトリタグ付けサービス提供システムは、ウェブページと連関してタグデータベースに保存されている同一タグの数に応じて、(1)タグを含む検索語に対するウェブページの検索ランキングにタグの数を反映したり、(2)タグを検索キーワードとして追加したり、(3)タグを検索ページを介して提供したりすることで、ウェブページを露出させる。
例えば、ウェブページと連関してタグデータベースに保存された同一タグの数が所定の数以上である場合には、ウェブページの検索ランキングを上げることができる。また、タグデータベースに保存された同一タグの数が所定の数未満である場合には、検索ランキングを下げることができる。また、同一タグの数が所定の数以上である場合には、当該タグを検索キーワードとして追加することによって、ウェブページが露出されるようにすることができる。また、タグを検索ページに露出させることによって、タグに対するブラウジングを介してウェブページが露出されるようにもすることができる。
このように、本実施形態のディレクトリタグ付けサービス提供システムによれば、ユーザの選択によって検索結果やブラウジングの構成が変化するようになるため、ディレクトリサービスへのユーザの関心および参加を誘導することができる。
図4は、本発明の一実施形態において、ウェブページから出現頻度順に所定の数の単語を抽出する方法を示したフローチャートである。図4に示されたように、図3を参照しながら説明した本発明の一実施形態であるディレクトリタグ付けサービスを提供する方法は、ウェブページから単語を抽出するために段階S301に段階S401ないし段階S404を含んで実行される。
段階S401で、本実施形態のディレクトリタグ付けサービス提供システムは、ディレクトリデータベースからURLを抽出する。すなわち、本実施形態のディレクトリタグ付けサービス提供システムは、ディレクトリサービス内に登録されたURLを抽出する。
段階S402で、本実施形態のディレクトリタグ付けサービス提供システムは、抽出されたURLに該当するウェブページを巡回してテキスト内容を抽出する。このようなテキスト内容は、クローラなどを用いて抽出することができる。ここで、クローラとは、ウェブ上の多様な情報を自動的に検索して索引に追加するために検索エンジンを運営するサイトで用いられるソフトウェアであって、スパイダ、ボット、知能エージェントとも呼ばれる。すなわち、本実施形態のディレクトリタグ付けサービス提供システムは、人間が該当するサイトの情報を検索するのではなく、コンピュータプログラムに予め入力された方式に従って常に新しいウェブページを探し出して総合し、これから得られた結果を用いてさらに新しい情報を探し出して索引に追加するという作業を繰り返し実行するクローラなどを用いてテキスト内容を抽出する。
段階S403で、本実施形態のディレクトリタグ付けサービス提供システムは、段階S402において抽出されたテキスト内容から単語を抽出し、単語別に出現頻度を測定する。例えば、テキスト内容から名詞抽出器を用いて名詞だけを単語として抽出し、抽出された単語の出現頻度をそれぞれ測定する。
段階S404で、本実施形態のディレクトリタグ付けサービス提供システムは、段階S403において抽出された単語のうちから、段階S403の測定結果に基づき出現頻度順に所定の数の単語を抽出する。例えば、本実施形態のディレクトリタグ付けサービス提供システムは、出現頻度が高い順に10個の単語を抽出する。このようにして抽出された単語は、それぞれがウェブページと連関したタグとなり、上述したように段階S302においてタグリストを生成するのに用いられる。
また、抽出された単語は、エディタ検収によって悪用(abusing)を取り除くことができる。すなわち、ウェブページが含んでいる単語によってウェブページの検索ランキングが変化するため、ウェブページに任意の特定単語を多数追加するという悪用が発生する恐れがある。これをエディタ検収によって取り除くことができる。
このように、本発明に係るディレクトリタグ付けサービス提供方法を用いれば、ディレクトリサービスのウェブページに対するタグをユーザが選択することでユーザの参加を誘導して集団的知性を導き出すことにより、ディレクトリサービスに対するユーザの興味と関心を誘発してディレクトリサービスを活性化することができる。また、ディレクトリデータベースに存在するURLを用い、このURLに該当するウェブページから所定の数の単語をタグとして抽出することで、ウェブページを提供するサービスの正確度を高めてユーザの満足度を高めることができる。
図5は、本発明の他の実施形態において、ディレクトリタグ付けサービス提供システムの内部構成を説明するためのブロック図である。図5に示されたように、本実施形態のディレクトリタグ付けサービス提供システム500は、単語抽出部501、タグリスト維持部502、タグ確認部503、タグデータベース504、およびウェブページ露出部505を含む。
単語抽出部501は、ウェブページから出現頻度順に所定の数の単語を抽出する。具体的には、単語抽出部501は、ウェブページで多く出現する順に単語を所定の数だけ抽出する。このようなウェブページから単語を抽出する単語抽出部501については、図6を参照しながらより詳しく説明する。
タグリスト維持部502は、抽出された単語を用いてウェブページのタグリストを生成および維持する。このとき、タグリスト維持部502は、出現頻度順に整列された単語のリストを、タグリストとして生成して維持する。
タグ確認部503は、ウェブページにアクセスしたユーザにタグリストを提供し、ユーザから選択されたタグを確認する。具体的には、タグ確認部503は、ウェブページが含む詳細情報提供機能によってユーザにタグリストを提供し、タグリストのタグのうちユーザによって選択されたタグを確認する。例えば、タグ確認部503は、詳細情報提供機能によってタグそれぞれのフィールドに発生するイベントを確認したり、タグリストをユーザに提供した後に、ユーザから発生したクリックなどのイベントによってユーザから選択されたタグを確認したりすることができる。
タグデータベース504は、選択されたタグをウェブページと連関して保存および維持する。このとき、本実施形態のディレクトリタグ付けサービス提供システム500は、タグデータベース504にウェブページと連関した同一のタグが存在するか否かを確認し、同一タグが存在するか否かに応じて選択されたタグをウェブページと連関して保存する。
すなわち、タグデータベース504は、1つのウェブページと連関した同一タグの数を選択されたタグと連関して保存する。本実施形態のディレクトリタグ付けサービス提供システム500は、同一タグが存在するか否か応じてタグを保存するため、同一タグが存在する場合には同一タグの数を増加させ、同一タグが存在しない場合には選択されたタグをウェブページと連関して保存する。
ウェブページ露出部505は、タグデータベース504を用いてウェブページを露出させる。このとき、ディレクトリタグ付けサービス提供システム500は、ウェブページと連関して保存された同一タグの数に応じて、(1)タグを含む検索語に対するウェブページの検索ランキングにタグの数を反映したり、(2)タグを検索キーワードとして追加したり、(3)タグを検索ページを介して提供したりすることで、ウェブページを露出させることができる。
図6は、本発明の他の実施形態において、単語抽出部の内部構成を説明するためのブロック図である。図6に示されたように、単語抽出部501は、URL抽出部601、ディレクトリデータベース602、テキスト内容抽出部603、出現頻度集計部604、および抽出部605を含むことができる。
URL抽出部601は、ディレクトリデータベース602からURLを抽出する。すなわち、URL抽出部601は、ディレクトリサービス内に登録されたURLを抽出する。
テキスト内容抽出部603は、抽出されたURLに該当するウェブページを巡回してテキスト内容を抽出する。このようなテキスト内容は、クローラなどを用いて抽出することができる。すなわち、テキスト内容抽出部603は、人間が該当するサイトの情報を検索するのではなく、コンピュータプログラムに予め入力された方式に従って常に新しいウェブページを探し出して総合し、これによって得られた結果を用いてさらに新しい情報を探し出して索引に追加するという作業を繰り返し実行するクローラを用いることで、テキスト内容を抽出することができる。
出現頻度集計部604は、抽出されたテキスト内容から単語を抽出し、単語別に出現頻度を集計(測定)する。例えば、テキスト内容から名詞抽出器を用いて名詞だけを単語として抽出し、抽出された単語の出現頻度をそれぞれ測定する。
抽出部605は、テキスト内容から抽出された単語の中から出現頻度順に所定の数の単語を抽出する。例えば、抽出部605は、出現頻度が高い順に10個の単語を抽出する。このように抽出された単語それぞれは、ウェブページと連関したタグとなり、上述したようにタグリスト維持部502においてタグリストを生成するのに用いられる。
このように、本発明に係るディレクトリタグ付けサービス提供システムを用いれば、ディレクトリサービスのウェブページに対するタグをユーザが選択することでユーザの参加を誘導して集団的知性を導き出すことにより、ディレクトリサービスに対するユーザの興味と関心を誘発してディレクトリサービスを活性化することができる。また、ディレクトリデータベースに存在するURLを用い、このURLに該当するウェブページから所定の数の単語をタグとして抽出することで、ウェブページを提供するサービスの正確度を高めてユーザの満足度を高めることができる。
なお、本発明に係るディレクトリタグ付けサービス提供システムは、コンピュータにより具現される多様な動作を実行するためのプログラム命令を含むコンピュータ読取可能な記録媒体を含む。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むこともでき、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光または金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるもののような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。前記したハードウェア要素は、本発明の動作を実行するために一以上のソフトウェアモジュールとして作動するように構成することができ、その逆もできる。
上述したように、本発明を好ましい実施形態に則して説明したが、本発明の属する技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の技術的思想およびその領域から逸脱しない範囲内で、本発明を多様に修正および変更させることができることを理解することができるであろう。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
従来技術において、ディレクトリサービスを説明するための一例である。 本発明に係るディレクトリタグ付けサービス提供システムを概括的に示した図である。 本発明の一実施形態において、ディレクトリタグ付けサービス提供方法を示したフローチャートである。 本発明の一実施形態において、ウェブページから出現頻度順に所定の数の単語を抽出する方法を示したフローチャートである。 本発明の他の実施形態において、ディレクトリタグ付けサービス提供システムの内部構成を説明するためのブロック図である。 本発明の他の実施形態において、単語抽出部の内部構成を説明するためのブロック図である。
符号の説明
500:ディレクトリタグ付けサービス提供システム
501:単語抽出部
502:タグリスト維持部
503:タグ確認部
504:タグデータベース
505:ウェブページ露出部
601:URL抽出部
602:ディレクトリデータベース
603:テキスト内容抽出部
604:出現頻度集計部
605:抽出部

Claims (18)

  1. ディレクトリタグ付けサービスを提供する方法であって、
    ウェブページから出現頻度順に所定の数の単語を抽出する段階と、
    前記単語を用いてウェブページのタグリストを生成および維持する段階と、
    前記ウェブページにアクセスしたユーザに前記タグリストを提供し、前記ユーザから選択されたタグを確認する段階と、
    を含むことを特徴とするディレクトリタグ付けサービス提供方法。
  2. 前記ウェブページから出現頻度順に所定の数の単語を抽出する段階は、
    ディレクトリデータベースからURLを抽出する段階と、
    前記URLに該当するウェブページを巡回してテキスト内容を抽出する段階と、
    前記テキスト内容から単語を抽出し、前記単語別に前記出現頻度を集計する段階と、
    前記単語のうちから前記出現頻度順に前記所定の数の単語を抽出する段階と、
    を含むことを特徴とする請求項1に記載のディレクトリタグ付けサービス提供方法。
  3. 前記単語を用いて前記ウェブページのタグリストを生成および維持する段階は、
    前記出現頻度順に整列された前記単語のリストを前記タグリストとして生成して維持することを特徴とする請求項1に記載のディレクトリタグ付けサービス提供方法。
  4. 前記ウェブページにアクセスしたユーザに前記タグリストを提供し、前記ユーザから選択されたタグを確認する段階は、
    前記ウェブページが含む詳細情報提供機能によって前記タグリストを提供し、前記タグリストのタグのうちから前記ユーザによって選択されたタグを確認することを特徴とする請求項1に記載のディレクトリタグ付けサービス提供方法。
  5. 前記選択されたタグを前記ウェブページと連関してタグデータベースに保存および維持する段階をさらに含むことを特徴とする請求項1に記載のディレクトリタグ付けサービス提供方法。
  6. 前記タグデータベースを用いて前記ウェブページを露出させる段階をさらに含むことを特徴とする請求項5に記載のディレクトリタグ付けサービス提供方法。
  7. 前記タグデータベースを用いて前記ウェブページを露出させる段階は、
    前記ウェブページと連関して保存された同一のタグの数に応じて、前記タグを含む検索語に対する前記ウェブページの検索ランキングに前記タグの数を反映して前記ウェブページを露出させることを特徴とする請求項6に記載のディレクトリタグ付けサービス提供方法。
  8. 前記タグデータベースを用いて前記ウェブページを露出する段階は、
    前記ウェブページと連関して保存された同一のタグの数に応じて、前記タグを検索キーワードとして追加して前記ウェブページを露出させることを特徴とする請求項6に記載のディレクトリタグ付けサービス提供方法。
  9. 前記タグデータベースを用いて前記ウェブページを露出させる段階は、
    前記ウェブページと連関して保存された同一のタグの数に応じて、前記タグを検索ページを介して提供して前記ウェブページを露出させることを特徴とする請求項6に記載のディレクトリタグ付けサービス提供方法。
  10. 前記選択されたタグを前記ウェブページと連関してタグデータベースに保存および維持する段階は、
    前記タグデータベースに前記ウェブページと連関された同一のタグが存在するか否かを確認する段階と、
    前記同一のタグが存在するか否かに応じて前記選択されたタグを前記ウェブページと連関して保存する段階と、
    を含むことを特徴とする請求項5に記載のディレクトリタグ付けサービス提供方法。
  11. 前記タグデータベースは、1つのウェブページと連関した同一のタグの数が前記選択されたタグと連関して保存され、
    前記同一のタグが存在するか否かに応じて前記選択されたタグを前記ウェブページと連関して保存する段階は、
    前記同一のタグが存在する場合には前記同一のタグの数を増加させ、前記同一のタグが存在しない場合には前記選択されたタグを前記ウェブページと連関して保存することを特徴とする請求項10に記載のディレクトリタグ付けサービス提供方法。
  12. 請求項1ないし11のいずれか一項の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  13. ディレクトリタグ付けサービスを提供するシステムであって、
    ウェブページから出現頻度順に所定の数の単語を抽出する単語抽出部と、
    前記単語を用いて前記ウェブページのタグリストを生成および維持するタグリスト維持部と、
    前記ウェブページにアクセスしたユーザに前記タグリストを提供し、前記ユーザから選択されたタグを確認するタグ確認部と、
    を含むことを特徴とするディレクトリタグ付けサービス提供システム。
  14. 前記選択されたタグを前記ウェブページと連関して保存および維持するタグデータベースをさらに含むことを特徴とする請求項13に記載のディレクトリタグ付けサービス提供システム。
  15. 前記タグデータベースを用いて前記ウェブページを露出させるウェブページ露出部をさらに含むことを特徴とする請求項14に記載のディレクトリタグ付けサービス提供システム。
  16. 前記タグデータベースは、
    前記ウェブページと連関した同一のタグが存在するか否かに応じて、前記選択されたタグを前記ウェブページと連関して保存、または前記同一のタグの数を増加させることを特徴とする請求項14に記載のディレクトリタグ付けサービス提供システム。
  17. 前記単語抽出部は、
    ディレクトリデータベースからURLを抽出するURL抽出部と、
    前記URLに該当するウェブページを巡回してテキスト内容を抽出するテキスト内容抽出部と、
    前記テキスト内容から単語を抽出し、前記単語別に前記出現頻度を集計する出現頻度集計部と、
    前記単語のうちから前記出現頻度順に前記所定の数の単語を抽出する抽出部と、
    を含むことを特徴とする請求項13に記載のディレクトリタグ付けサービス提供システム。
  18. 前記タグリスト維持部は、
    前記出現頻度順に整列された前記単語のリストを、前記タグリストとして生成して維持することを特徴とする請求項13に記載のディレクトリタグ付けサービス提供システム。
JP2008096688A 2007-04-10 2008-04-03 ディレクトリサービス提供方法及びシステム。 Active JP4728364B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070035157A KR100898475B1 (ko) 2007-04-10 2007-04-10 디렉터리 태깅 서비스를 제공하는 방법 및 상기 방법을수행하는 시스템
KR10-2007-0035157 2007-04-10

Publications (2)

Publication Number Publication Date
JP2008262559A true JP2008262559A (ja) 2008-10-30
JP4728364B2 JP4728364B2 (ja) 2011-07-20

Family

ID=39984950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008096688A Active JP4728364B2 (ja) 2007-04-10 2008-04-03 ディレクトリサービス提供方法及びシステム。

Country Status (2)

Country Link
JP (1) JP4728364B2 (ja)
KR (1) KR100898475B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101541177B1 (ko) * 2014-05-23 2015-08-03 주식회사 아이온커뮤니케이션즈 검색어 분석을 이용한, 검색어 통합 정보 제공 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002014996A (ja) * 2000-06-30 2002-01-18 Nec Corp ブックマークシステム及びブックマークを利用したドキュメント提案方法並びにプログラム記録媒体
JP2002215642A (ja) * 2001-01-23 2002-08-02 Ryosuke Okada フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体
JP2002245061A (ja) * 2001-02-14 2002-08-30 Seiko Epson Corp キーワード抽出
JP2005346598A (ja) * 2004-06-07 2005-12-15 Sangaku Renkei Kiko Kyushu:Kk ウェブ情報収集装置とウェブクローラープログラム、及びウェブ情報収集方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100303153B1 (ko) * 1997-12-27 2001-11-22 윤덕용 에이치티엠엘(html)문서저장및검색시스템
JP4365162B2 (ja) * 2003-08-20 2009-11-18 富士通株式会社 構造化文書のデータを検索する装置および方法
JP2006330995A (ja) * 2005-05-25 2006-12-07 Fuji Xerox Co Ltd 文書処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002014996A (ja) * 2000-06-30 2002-01-18 Nec Corp ブックマークシステム及びブックマークを利用したドキュメント提案方法並びにプログラム記録媒体
JP2002215642A (ja) * 2001-01-23 2002-08-02 Ryosuke Okada フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体
JP2002245061A (ja) * 2001-02-14 2002-08-30 Seiko Epson Corp キーワード抽出
JP2005346598A (ja) * 2004-06-07 2005-12-15 Sangaku Renkei Kiko Kyushu:Kk ウェブ情報収集装置とウェブクローラープログラム、及びウェブ情報収集方法

Also Published As

Publication number Publication date
KR20080091972A (ko) 2008-10-15
KR100898475B1 (ko) 2009-05-21
JP4728364B2 (ja) 2011-07-20

Similar Documents

Publication Publication Date Title
KR101527259B1 (ko) 검색 질의에 응답하여 디스커션 스레드에 대한 포스트를 제공하는 방법 및 시스템
US9251157B2 (en) Enterprise node rank engine
CN105431844B (zh) 用于搜索系统的第三方搜索应用
Li et al. Here's what I did: Sharing and reusing web activity with ActionShot
US20160335286A1 (en) State Deduplication for Automated and Semi-Automated Crawling Architecture
US20120011431A1 (en) Method and System of Retrieving Ajax Web Page Content
JP5452229B2 (ja) 検索機能を備えたバナー広告提供方法およびシステム、またはこの方法を実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体
KR100892842B1 (ko) 사용자 중심 정보탐색 방법 및 시스템
US9792370B2 (en) Identifying equivalent links on a page
US20160103913A1 (en) Method and system for calculating a degree of linkage for webpages
US20150302090A1 (en) Method and System for the Structural Analysis of Websites
JP5327784B2 (ja) 計算機システム、情報収集支援装置及び情報収集支援方法
KR20040087205A (ko) 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템
GB2569858A (en) Constructing content based on multi-sentence compression of source content
JP5221664B2 (ja) 情報マップ管理システムおよび情報マップ管理方法
CN113901169A (zh) 信息处理方法、装置、电子设备及存储介质
CN106326236A (zh) 一种网页内容识别方法和系统
JP2008299842A (ja) 広告執行による反応情報提供方法、コンピュータ読み取り可能な記録媒体、広告執行による反応情報提供システム
JP2007193697A (ja) 情報収集装置,情報収集方法およびプログラム
Gossen et al. Extracting event-centric document collections from large-scale web archives
JP4728364B2 (ja) ディレクトリサービス提供方法及びシステム。
JP2009211514A (ja) 関係情報取得システム、関係情報取得方法および関係情報取得用プログラム
RU2589856C2 (ru) Способ обработки целевого сообщения, способ обработки нового целевого сообщения и сервер (варианты)
KR100931772B1 (ko) 웹사이트 검색 서비스 제공 방법 및 그 시스템
Mattosinho Mining Product Opinions and Reviews on the Web

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110412

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110414

R150 Certificate of patent or registration of utility model

Ref document number: 4728364

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250