JP5216887B2 - 最新情報提供方法 - Google Patents

最新情報提供方法 Download PDF

Info

Publication number
JP5216887B2
JP5216887B2 JP2011055193A JP2011055193A JP5216887B2 JP 5216887 B2 JP5216887 B2 JP 5216887B2 JP 2011055193 A JP2011055193 A JP 2011055193A JP 2011055193 A JP2011055193 A JP 2011055193A JP 5216887 B2 JP5216887 B2 JP 5216887B2
Authority
JP
Japan
Prior art keywords
subject
type
word
subject word
web page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011055193A
Other languages
English (en)
Other versions
JP2011118946A (ja
JP2011118946A5 (ja
Inventor
秉 學 金
兌 榮 郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2011118946A publication Critical patent/JP2011118946A/ja
Publication of JP2011118946A5 publication Critical patent/JP2011118946A5/ja
Application granted granted Critical
Publication of JP5216887B2 publication Critical patent/JP5216887B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、インターネット上で情報を提供する方法に関するもので、より詳細には、インターネット上で各分野別に最新情報を収集して提供することができる最新情報提供方法及びそのシステムに関するものである。
最近、科学技術の発展及び経済水準の向上と伴い、超高速インターネットなどの通信網の普及と超高速通信網利用者の急激な増加がなされており、超高速通信網利用者の急激な増加により、通信網を通した新規サービスの開発及びサービスアイテムの多様化が可能になった。通信網を用いた検索サービスは、このような通信網を用いたサービスのうち最も一般的なサービスといえる。
検索サービスとは、使用者から入力されるクエリーに対して検索を行った後、入力されたクエリー(質疑語)に相応する検索結果文書(例えば、使用者から入力された検索クエリーを含むウェブサイト、記事、または、該当の検索クエリーを含むファイル名を有するイメージなど)を使用者に提供するサービスを意味する。
利用者たちは、このような検索サービスを用いて最新の情報を受けることを望んでいるが、最近では、コンテンツの量及びその種類の増加のために、検索サービスを提供する検索サイトが最新の情報を抽出するときに多くの時間が掛かるため、使用者たちが望む最新情報を効果的に提供できないという問題点がある。
また、使用者が特定の主題に対する最新情報を得ようとする場合、このような検索サービスを用いる方法の他に、特定の主題を取り扱っているウェブサイトを直接訪問することで最新の情報を獲得することもできる。しかしながら、このような方法による場合にも、同一の主題を取り扱うウェブサイトごとに互いに異なる最新情報を提供することが多いので、使用者たちは、特定の主題に対する最新の情報を獲得するために、特定の主題を取り扱っている全てのウェブサイトを訪問しなければならないという不便さがあった。
本発明は、上述した問題点を解決するためのもので、その技術的課題(目的)は、特定の主題に対して各ウェブサイトが提供する最新情報を統合し、これを使用者に提供することができる最新情報提供方法及びそのシステムを提供することにある。
本発明の他の技術的課題は、各分野別ウェブサイトから抽出された最新情報を出現回数の変化量の差によって一つ以上のタイプに分類し、これを使用者に提供することができる最新情報提供方法及びそのシステムを提供することにある。
本発明の更に他の技術的課題は、各分野別ウェブサイトから最新情報を一定周期ごとに抽出することで、使用者に提供される最新情報のアップデート周期を短縮させることができる最新情報提供方法及びそのシステムを提供することにある。
上述した目的を達成するための本発明の一側面による最新情報提供方法は、所定の主題に対するウェブサイトリストに含まれた少なくとも一つのウェブサイトから所定のウェブページを抽出する段階と;前記抽出されたウェブページから一つ以上の主題語を抽出する段階と;前記各主題語の出現回数をカウンティングする段階と;前記各段階を所定周期ごとに反復することで、前記各主題語のうち前記出現回数の変化量が第1基準値以上である第1タイプの主題語を選定する段階と;前記ウェブページのうち前記第1タイプの主題語が含まれた内容を前記第1タイプの主題語と一緒に使用者に提供する段階と;を含む。このとき、前記所定の主題に対するウェブサイトリストは、各ウェブサイトのディレクトリ情報から抽出される。
一方、上述した最新情報提供方法は、前記主題語のうち前記出現回数の変化量が第2基準値以上、第3基準値未満である第2タイプの主題語を選定する段階と;前記ウェブページのうち前記第2タイプの主題語が含まれた内容を前記第2タイプの主題語と一緒に使用者に提供する段階と;をさらに含むことができる。
一実施例において、前記所定のウェブページは、前記各ウェブサイトの最初のウェブページであり、前記各主題語は、前記各ウェブページに含まれたアンカーテキストから抽出される。このような実施例による場合、前記主題語抽出段階は、前記主題語が抽出された前記アンカーテキスト及び前記アンカーテキストとリンクされているURLアドレスを前記抽出された主題語と一緒に保存する段階を含み、前記第1タイプの主題語を提供する段階で、前記ウェブページのうち前記第1タイプの主題語が含まれた内容は、前記第1タイプの主題語が含まれているアンカーテキストである。
一方、前記第1タイプの主題語を提供する段階は、各主題別ディレクトリを生成する段階と;前記ディレクトリのうち前記第1タイプの主題語が属する主題領域に前記第1タイプの主題語を羅列することで、前記第1タイプの主題語を提供する段階と;をさらに含む。
上述した目的を達成するための本発明の他の側面による最新情報提供システムは、所定の主題に対するウェブサイトリストに含まれた少なくとも一つのウェブサイトから所定のウェブページを所定周期ごとに抽出するウェブページ抽出部と;前記ウェブページ抽出部によって抽出されたウェブページから一つ以上の主題語を抽出する主題語抽出部と;前記各主題語の出現回数をカウンティングするカウンターと;前記主題語のうち前記出現回数の変化量が第1基準値以上である主題語を選定し、これを第1タイプの主題語に分類する判断部と;前記ウェブページのうち前記第1タイプの主題語が含まれた内容を前記第1タイプの主題語と一緒に使用者に提供する情報提供部と;を含む。
本発明によると、特定の主題に対して各ウェブサイトごとに別途に提供されていた最新情報を統合して提供することができ、使用者の便宜性を増大させることができる。
また、本発明によると、各分野別ウェブサイトから抽出された最新情報をその出現回数の変化量の差によって一つ以上のタイプに分類して提供することができ、使用者たちの多様な要求に能動的に対処することができる。
また、本発明によると、各分野別ウェブサイトから最新情報を一定周期ごとに抽出して使用者に提供することで、使用者に提供される最新情報のアップデート周期を短縮させることができる。
本発明の一実施例に係る最新情報提供システムの概略的なブロック図である。 ポータルサイトのウェブサイトディレクトリ情報を示す画面をキャプチャーした図である。 ポータルサイトのウェブサイトディレクトリ情報を示す画面をキャプチャーした図である。 主題語保存部に保存されるデータテーブルの構造を示した図である。 本発明の一実施例に係る最新情報提供方法のフローチャートである。
以下、添付された図面を参照して本発明の実施例を詳細に説明する。
図1は、本発明の一実施例に係る最新情報提供システムの概略的なブロック図である。
図1に示すように、本発明の一実施例に係る最新情報提供システム10は、ウェブページ抽出部12、ウェブページ保存部14、主題語抽出部16、カウンター18、主題語保存部20、判断部22及び情報提供部24を含む。
ウェブページ抽出部12は、各主題別ウェブサイトリストに含まれた各ウェブサイトから所定のウェブページを抽出する。このとき、各主題別ウェブサイトリストは、各種のポータルサイトが提供しているディレクトリ情報から抽出される。例えば、図2Aに示すようなディレクトリ情報から図2Bに示すようなウェブサイトリストを抽出する。ここで、図2Bは、「映画」という主題に対するウェブサイトリストを示している。
一実施例において、ウェブページ抽出部12は、各主題別ウェブサイトリストに含まれた各ウェブサイトから最初のウェブページを抽出することができる。これは、各ウェブサイトの最初のウェブページに新規情報やコンテンツのアップデート情報が含まれている場合が多いためである。変形された実施例においては、各ウェブサイトの最初のウェブページのみならず、新規情報を提供するウェブページを抽出することもできる。
ウェブページ抽出部12は、ウェブサイトから上述したウェブページを所定の周期単位で抽出するが、このとき、所定の周期は一日(毎日)に設定することができる。
ウェブページ保存部14には、ウェブページ抽出部12によって抽出された各ウェブページが各分野別に保存される。ウェブページ保存部14に保存されている各ウェブページの場合、後述するカウンター18によってウェブページに含まれた主題語がカウンティングされた後には、ウェブページ保存部14の保存空間(記憶領域)を効率的に使用するために削除されるように構成してもよい。
主題語抽出部16は、ウェブページ抽出部12によって抽出されたウェブページから一つ以上の主題語を抽出する。一実施例において、主題語抽出部16は、各ウェブページに含まれたアンカーテキスト(AnchorText)から主題語を抽出する。アンカーテキストとは、特定のウェブページ内でクリックが可能な部分を意味するもので、このようなアンカーテキストは、リンクされた文書の題目などのように、リンクされた文書を代表する単語からなる。主題語抽出部16は、各ウェブページに含まれた全てのアンカーテキストから各主題語を抽出するようになる。
一実施例において、主題語抽出部16は、ウェブページのアンカーテキストから主題語を抽出するが、このとき、アンカーテキストに含まれた名詞または複合名詞を主題語として抽出することができる。また、アンカーテキストに含まれた名詞や複合名詞は、全てが主題語として抽出可能であるが、抽出された名詞や複合名詞からなるアンカーテキストが該当のウェブページまたは他のウェブページに存在しないときには、主題語から除外することもできる。
例えば、映画と関連したウェブページのうち、「華麗な休暇をどのようにご覧になったでしょうか?」というアンカーテキストが存在する場合、このようなアンカーテキストから「華麗な休暇」という複合名詞を主題語として抽出することができる。他の例として、「華麗な休暇を見てから毛骨が悚然とするような…」というアンカーテキストが存在する場合、このようなアンカーテキストから「華麗な休暇」、「毛骨」、「悚然」などの名詞または複合名詞が抽出される。このとき、該当のウェブページまたは他のウェブページで「華麗な休暇」という単語からなる(又は含む)アンカーテキストは存在するが、「毛骨」と「悚然」という単語からなる(又は含む)アンカーテキストが存在しない場合、「華麗な休暇」のみを該当のアンカーテキストの主題語として抽出することができる。
一方、イメージからなる文書に対するリンクのように、テキストが存在しないリンクの場合には、該当の文書の題目から主題語を抽出することができる。このとき、該当の文書の題目は、該当の文書自体をダウンロードすることで取得することができる。
カウンター18は、主題語抽出部16によって抽出された各主題語の出現回数をカウンティング(集計)し、これを主題語保存部20に各主題語別に保存する。一実施例において、カウンター18は、特定の主題に対して抽出された各ウェブページから抽出された各主題語の出現回数を、ウェブページが抽出される周期に合わせてカウンティングし、その結果を主題語保存部18に保存することができる。
例えば、ウェブサイトリストから一日単位でウェブページを抽出するように設定されており、ウェブサイトリストの主題が映画である場合、2007年8月1日に「映画」という主題に対して抽出されたウェブページの各主題語の出現回数をカウンティングし、これを各主題語別に保存し、2007年8月2日に抽出されたウェブページの各主題語の出現回数をカウンティングし、これを各主題語別に保存する。
主題語保存部20は、主題語抽出部16によって抽出された主題語を、カウンター18によって算出された各主題語の出現回数及び該当の主題語が含まれているアンカーテキストと一緒に保存する。一実施例において、主題語保存部20は、抽出された主題語を保存する場合において、抽出された主題語が含まれたアンカーテキストにマッピングされているURL(UniformResource Locator)アドレスを該当の主題語と一緒に保存することができる。
上述した各データが主題語保存部20に保存される形式を、図3を参照して説明する。図示したように、上述した各データは、テーブル形態で主題語保存部20に記録され。主題語フィールド26には、各ウェブページから抽出された各主題語が保存され、アンカーテキストフィールド28には、該当の主題語が含まれているアンカーテキストが保存され、URLフィールド30には、該当のアンカーテキストとリンクされているURLアドレス(URL住所)が保存される。また、カウンティング日付フィールド32には、該当の主題語がカウンティングされた日付が保存され、出現回数フィールド34には、抽出された主題語の出現回数が保存される。
再び図1を参照すると、判断部22は、主題語抽出部16によって抽出された主題語の出現回数を所定周期ごとに比較することで各主題語の出現回数の変化量を判断し、出現回数の変化量を用いて該当の主題語を第1タイプの主題語または第2タイプの主題語に分類する。具体的に、判断部22は、主題語の出現回数の変化量が第1基準値以上である場合、該当の主題語を第1タイプの主題語に分類する。
ここで、出現回数の変化量が第1基準値以上であることとは、以前の出現回数に比べて最近の出現回数が増加または減少したことを意味し、出現回数が増加したことは、最近、多くのウェブサイトが該当の主題語と関連した内容を含んでいることを意味するので、このような主題語は、最新情報を示すものと判断することができる。例えば、特定の映画が公開される場合、公開以前になされた該当の映画に対する評論や主演俳優などのインタビューによって、以前には出現されていない該当の映画と関連した主題語が多くのウェブサイトに含まれるようになる。
また、出現回数が減少したことは、以前までは多くのウェブサイトで取り扱っていた主題語であるが、最近、その内容が著しく減少したことを意味し、これ以上人々から関心を得られない主題語であると判断することで、このような主題語が最新情報として登録されていた場合、該当の主題語を削除することができる。
一方、出現回数は多いが、全てのウェブページに常に共通的に含まれているメニューなどの主題語の場合、以前に比べて出現回数の変化量がほぼないので、上述した過程を通して最新情報から除外される。例えば、映画と関連したウェブサイトで“前売り”という主題語は、常にウェブサイトに含まれている主題語であり、その出現回数が多いとしても、出現回数の変化量(増減量)が第1基準値未満であるので、最新情報から排除される。
一方、判断部22は、主題語の出現回数の変化量が第2基準値以上、第3基準値未満である場合、該当の主題語を第2タイプの主題語に分類する。具体的に、最新情報ではあるが、その出現回数の変化量が多くない主題語を第2タイプの主題語に分類する。すなわち、第2基準値は、該当の主題語が新しい情報であるかを判断する基準になるもので、第3基準値は、該当の主題語がイシュー(関心)性を持つ主題であるかを判断する基準になるものである。このとき、第3基準値は、第1基準値と同一、又は第1基準値未満に設定されることができる。
例えば、料理と関連したウェブサイトで食物情報がアップデートされた場合、アップデートされた食物情報は、以前には出現されていない最近に出現されたものであり、新しい情報ではあるが、人々にイシュー化されていないので、その出現回数の変化量が大きくなく、第2タイプの主題語に分類される。
一実施例において、判断部22は、各主題語の出現回数の変化量を1日単位、7日単位又は10日単位で判断することができる。
情報提供部22は、判断部20によって分類された第1タイプの主題語と第2タイプの主題語を、該当の主題語が含まれた内容と一緒に各タイプ別に使用者に提供する。このとき、第1タイプに分類された主題語は、第1タイプ同士のグルーピングによって使用者に提供され、第2タイプに分類された主題語は、第2タイプ同士のグルーピングによって使用者に提供される。一実施例において、情報提供部22は、該当の主題語が含まれた内容として、該当の主題語が含まれたアンカーテキストを提供できるが、使用者は、これを通して該当のアンカーテキストをクリックすることで、該当のアンカーテキストとリンクされたウェブページを閲覧できるようになる。
一方、情報提供部22は、第1タイプまたは第2タイプの主題語を使用者に提供する場合において、各主題別にディレクトリを生成し、第1タイプまたは第2タイプの主題語が属する主題のディレクトリに該当の主題語を羅列する方法で最新情報を提供することができる。例えば、第1タイプまたは第2タイプの主題語が映画と関連したものである場合、まず、各主題別にディレクトリを生成した後、第1タイプまたは第2タイプの主題語を生成されたディレクトリのうち、映画領域に主題語形式で羅列する。変形された実施例においては、別途のディレクトリを生成せずに、各ポータルサイトで提供されるディレクトリのうち該当の主題語が属する領域に第1タイプまたは第2タイプの主題語を含ませて、これを使用者に提供することもできる。
他の実施例においては、検索結果を通して第1タイプまたは第2タイプの主題語を提供することもできる。例えば、検索質疑語として第1タイプの主題語が入力される場合、第1タイプの主題語と一緒に保存されているアンカーテキストを検索結果として使用者に提供する。
以下、図4を参照して、本発明の一実施例に係る最新情報提供方法に対して説明する。図4は、本発明の一実施例に係る最新情報提供方法を示したフローチャートである。
図4に示すように、まず、特定の主題に対するウェブサイトリストに含まれた各ウェブサイトから所定のウェブページを抽出して保存する(第100段階)。このとき、各主題別ウェブサイトリストは、各種のポータルサイトが提供しているディレクトリ情報から抽出される。一実施例において、各主題別ウェブサイトリストに含まれた各ウェブサイトからウェブページを抽出する場合において、各ウェブサイトの最初のウェブページを抽出することができる。これは、各ウェブサイトの最初のウェブページに新規情報やコンテンツのアップデート情報が含まれている場合が多いためである。変形された実施例においては、ウェブサイトの最初のウェブページのみならず、新規情報を提供するウェブページを抽出することもできる。
次に、抽出されたウェブページから一つ以上の主題語を抽出して保存する(第110段階)。一実施例において、ウェブページから主題語を抽出するにおいて、各ウェブページに含まれたアンカーテキストから主題語を抽出することができる。このために、まず、各ウェブページから全てのアンカーテキストを抽出し、抽出された全てのアンカーテキストから各主題語を抽出する。
ウェブページのアンカーテキストから主題語を抽出するにおいて、アンカーテキストに含まれた名詞または複合名詞を主題語として抽出することができる。このとき、アンカーテキストに含まれた名詞や複合名詞は、全てが主題語として抽出可能であるが、抽出された名詞や複合名詞のうち該当の名詞や複合名詞からなるアンカーテキストが該当のウェブページまたは他のウェブページに存在しないときには、主題語から除外することができる。
上記のような過程を通して抽出された主題語は、該当の主題語が含まれたアンカーテキスト、該当のアンカーテキストとリンクされたURLアドレスと一緒に保存される。
その後、抽出された主題語の出現回数をカウンティング(集計)し、その結果を各主題語別に保存し(第130段階)、上述した第100段階乃至第130段階を所定周期ごとに反復する(第140段階)。例えば、所定周期が一日単位である場合、ウェブサイトリストから所定のウェブページを抽出し、抽出されたウェブページから主題語を抽出し、抽出された主題語の出現回数をカウンティングする過程を毎日反復的に行う。
次に、抽出された主題語の出現回数を所定周期ごとに比較し、各主題語の出現回数の変化量を判断する(第150段階)。一実施例において、各主題語の出現回数の変化量は、1日、7日または10日を周期にして判断することができる。
判断結果、出現回数の変化量が第1基準値以上である場合、該当の主題語を第1タイプの主題語に分類する(第160段階)。出現回数の変化量が第1基準値以上であることは、以前の出現回数に比べて最近の出現回数が増加または減少したことを意味し、出現回数が増加したことは、最近、多くのウェブサイトが該当の主題語と関連した内容を含んでいることを意味するので、このような主題語は、最新情報を示すものと判断することができる。
また、出現回数が減少したことは、以前までは多くのウェブサイトで取り扱っていた主題語であるが、最近、その内容が著しく減少したことを意味し、これ以上人々から関心を得られないので、このような主題語はもはや最新情報でないと判断し、該当の主題語が最新情報として登録されている場合、それを削除することができる。
一方、第150段階での判断結果、出現回数の変化量が第2基準値以上、第3基準値未満である場合、該当の主題語を第2タイプの主題語に分類する(第170段階)。このようなタイプに該当する主題語は、新しい情報ではあるものの、出現回数の変化量が多くなく、社会的に関心が寄せられている主題語でないと判断することができる。
最後に、第1タイプの主題語または第2タイプの主題語を、該当の主題語が含まれた内容と一緒に各タイプ別に使用者のユーザ端末装置に提供する(第180段階)。具体的に、第1タイプに分類された主題語は、第1タイプ同士のグルーピングによって使用者に提供され、第2タイプに分類された主題語は、第2タイプ同士のグルーピングによって使用者に提供される。使用者のユーザ端末装置に提供される主題語等は、ブラウザ等の情報閲覧プログラムを通じてユーザ端末装置の表示装置に表示される。
このとき、該当の主題語が含まれた内容としては、該当の主題語を含んでいるアンカーテキストを提供することができる。使用者は、これを通して該当のアンカーテキストをクリックすることで、該当のアンカーテキストとリンクされたウェブページを閲覧することができる。
一実施例において、第1タイプまたは第2タイプの主題語を使用者に提供するにおいて、各主題別にディレクトリを生成し、第1タイプまたは第2タイプの主題語が属する主題のディレクトリに第1タイプまたは第2タイプの主題語を羅列して提供したり、検索結果を通して第1タイプまたは第2タイプの主題語を含むアンカーテキストを提供することができる。
上述した最新情報提供方法は、多様なコンピュータ装置を用いて実行されるプログラムの形態で具現化することが可能であり、このとき、最新情報提供方法を行うためのプログラムは、ハードディスク、CD-ROM、DVD、ROM、RAMまたはフラッシュメモリなどのコンピュータ読取り可能な記録媒体に保存される。また、当該プログラムがインストールされたコンピュータ装置は、本発明の最新情報提供方法を遂行するコンピュータ装置として動作することが可能である。例えば、不図示の補助記憶装置に当該プログラムが格納され、CPU等の制御部が補助記憶装置に格納されたプログラムを主記憶装置に読み出し、主記憶装置に読み出された該プログラムを制御部が実行し、コンピュータに本発明の最新情報提供方法を動作させることができる。
本発明の属する技術分野における通常の知識を有する者であれば、本発明がその技術的思想や必須的な特徴を変更せずに他の具体的な形態によって実施できることを理解することができる。
したがって、以上説明した各実施例は、全ての面で例示的なものであり、限定的なものでないことを理解すべきである。本発明の技術的範囲は、上述した詳細な説明より特許請求の範囲によって示されており、特許請求の範囲の意味、範囲及びその均等の概念から導出される全ての変更または変形形態は、本発明の技術的範囲に含まれるものと解されるべきである。
10 最新情報提供システム
12 ウェブページ抽出部
14 ウェブページ保存部
16 主題語抽出部
18 カウンター
20 主題語保存部
22 判断部
24 情報提供部

Claims (18)

  1. 最新情報提供方法であって、コンピュータによって実行されるステップが、
    所定の主題に対するウェブサイトリストに含まれた各ウェブサイトから複数の所定のウェブページを抽出する段階と、
    前記抽出された所定の各ウェブページから一つ以上の主題語を抽出する段階と、
    前記抽出された主題語の出現回数を前記主題語別にカウンティングする段階と、
    前記各段階を所定周期ごとに反復することで、前記各主題語のうち前記所定周期前後の前記出現回数の変化量が第1基準値以上である第1タイプの主題語を選定する段階と、
    前記ウェブページのうち前記第1タイプの主題語が含まれた内容を前記第1タイプの主題語と一緒に使用者に提供する段階と、
    を含むことを特徴とする最新情報提供方法。
  2. 前記所定の主題に対するウェブサイトリストは、各ウェブサイトのディレクトリ情報から抽出されることを特徴とする請求項1に記載の最新情報提供方法。
  3. 前記所定のウェブページは、前記各ウェブサイトの最初のウェブページであることを特徴とする請求項1又は2に記載の最新情報提供方法。
  4. 前記主題語を抽出する段階は、
    前記各ウェブページに含まれたアンカーテキスト及び前記アンカーテキストとリンクされているURL(UniformResource Locator)を、前記抽出された主題語と一緒に保存する段階を含むことを特徴とする請求項1から3のいずれか1つに記載の最新情報提供方法。
  5. 前記主題語は、前記各ウェブページに含まれた名詞または複合名詞から抽出されることを特徴とする請求項1から4のいずれか1つに記載の最新情報提供方法。
  6. 前記ウェブページのうち前記第1タイプの主題語が含まれた内容は、前記第1タイプの主題語が含まれているアンカーテキストであり、
    前記使用者に提供する段階は、
    前記第1タイプの主題語が含まれているアンカーテキストを前記第1タイプの主題語と一緒に使用者に提供することを特徴とする請求項1から5のいずれか1つに記載の最新情報提供方法。
  7. 前記使用者に提供する段階は、
    前記所定の主題に対するウェブサイトリストが抽出される各ウェブサイトのディレクトリ情報に基づいて、前記所定の主題別ディレクトリを生成する段階と、
    前記生成された各主題のディレクトリのうち、前記第1タイプの主題語が抽出された前記ウェブページが属する前記ウェブサイトリストに該当する主題のディレクトリに、当該第1タイプの主題語を羅列することで、前記第1タイプの主題語を前記使用者に提供する段階と、
    をさらに含むことを特徴とする請求項1から6のいずれか1つに記載の最新情報提供方法。
  8. 前記主題語のうち前記所定周期前後の前記出現回数の変化量が第2基準値以上、第3基準値未満である第2タイプの主題語を選定する段階と、
    前記ウェブページのうち前記第2タイプの主題語が含まれた内容を前記第2タイプの主題語と一緒に使用者に提供する段階と、
    をさらに含むことを特徴とする請求項1から7のいずれか1つに記載の最新情報提供方法。
  9. 前記ウェブページのうち前記第2タイプの主題語が含まれた内容は、前記第2タイプの主題語が含まれているアンカーテキストであり、
    前記ウェブページのうち第2タイプの主題語が含まれた内容を前記第2タイプの主題語と一緒に使用者に提供する段階は、
    前記第2タイプの主題語が含まれているアンカーテキストを前記第2タイプの主題語と一緒に使用者に提供することを特徴とする請求項8に記載の最新情報提供方法。
  10. 請求項1乃至9のうちいずれか1項に記載された最新情報提供方法をコンピュータに実行させるためのプログラムが記録されたコンピュータ読取り可能な記録媒体。
  11. 所定の主題に対するウェブサイトリストに含まれた各ウェブサイトから複数の所定のウェブページを所定周期ごとに抽出するウェブページ抽出部と、
    前記抽出された所定の各ウェブページから一つ以上の主題語を抽出する主題語抽出部と、
    前記各主題語の出現回数を前記主題語別にカウンティングするカウンターと、
    前記主題語のうち前記所定周期前後の前記出現回数の変化量が第1基準値以上である主題語を選定し、これを第1タイプの主題語に分類する判断部と、
    前記ウェブページのうち前記第1タイプの主題語が含まれた内容を前記第1タイプの主題語と一緒に使用者に提供する情報提供部と、
    を含むことを特徴とする最新情報提供システム。
  12. 前記所定の主題に対するウェブサイトリストは、各ウェブサイトのディレクトリ情報から抽出されることを特徴とする請求項11に記載の最新情報提供システム。
  13. 前記所定のウェブページは、前記各ウェブサイトの最初のウェブページであることを特徴とする請求項11又は12に記載の最新情報提供システム。
  14. 前記主題語抽出部は、前記抽出された主題語を、前記主題語が抽出された前記各ウェブページに含まれたアンカーテキスト及び前記アンカーテキストとリンクされているURLと一緒に保存することを特徴とする請求項11から13のいずれか1つに記載の最新情報提供システム。
  15. 前記情報提供部は、前記第1タイプの主題語が含まれた内容として、前記第1タイプの主題語が含まれているアンカーテキストを提供することを特徴とする請求項11から14のいずれか1つに記載の最新情報提供システム。
  16. 前記主題語は、前記各ウェブページに含まれたアンカーテキストに含まれた名詞または複合名詞から抽出されることを特徴とする請求項11から15のいずれか1つに記載の最新情報提供システム。
  17. 前記情報提供部は、
    前記所定の主題に対するウェブサイトリストが抽出される各ウェブサイトのディレクトリ情報に基づいて前記所定の主題別ディレクトリを生成し、前記生成された各主題のディレクトリのうち、前記第1タイプの主題語が抽出された前記ウェブページが属する前記ウェブサイトリストに該当する主題のディレクトリに、当該第1タイプの主題語を羅列することで、前記第1タイプの主題語を前記使用者に提供することを特徴とする請求項11から16のいずれか1つに記載の最新情報提供システム。
  18. 前記判断部は、前記主題語のうち前記所定周期前後の前記出現回数の変化量が第2基準値以上、第3基準値未満である主題語を選定し、これを第2タイプの主題語に分類し、
    前記情報提供部は、前記第2タイプの主題語が含まれているアンカーテキストを前記第2タイプの主題語と一緒に使用者に提供することを特徴とする請求項11から17のいずれか1つに記載の最新情報提供システム。
JP2011055193A 2007-09-06 2011-03-14 最新情報提供方法 Active JP5216887B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070090462A KR100953491B1 (ko) 2007-09-06 2007-09-06 최신정보 제공 방법 및 시스템
KR10-2007-0090462 2007-09-06

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008218391A Division JP4751430B2 (ja) 2007-09-06 2008-08-27 最新情報提供方法及びそのシステム

Publications (3)

Publication Number Publication Date
JP2011118946A JP2011118946A (ja) 2011-06-16
JP2011118946A5 JP2011118946A5 (ja) 2012-07-05
JP5216887B2 true JP5216887B2 (ja) 2013-06-19

Family

ID=40558928

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008218391A Active JP4751430B2 (ja) 2007-09-06 2008-08-27 最新情報提供方法及びそのシステム
JP2011055193A Active JP5216887B2 (ja) 2007-09-06 2011-03-14 最新情報提供方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008218391A Active JP4751430B2 (ja) 2007-09-06 2008-08-27 最新情報提供方法及びそのシステム

Country Status (2)

Country Link
JP (2) JP4751430B2 (ja)
KR (1) KR100953491B1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5679400B2 (ja) * 2010-01-22 2015-03-04 日本電信電話株式会社 カテゴリ主題語句抽出装置及び階層的タグ付与装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体
JP5852327B2 (ja) 2011-05-27 2016-02-03 デルタ工業株式会社 シートスライドロック装置
JP6908308B2 (ja) * 2019-08-27 2021-07-21 ククレブ・アドバイザーズ株式会社 営業支援装置および営業支援プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141396A (ja) * 1993-11-17 1995-06-02 Hitachi Ltd 情報ウォッチングシステム
KR19990069010A (ko) * 1998-02-03 1999-09-06 김덕중 웹 페이지 접속 정보 서비스 장치 및 그 서비스 방법
KR100621737B1 (ko) * 1999-12-27 2006-09-06 학교법인 포항공과대학교 웹사이트 자동 분류방법
KR20000071937A (ko) * 2000-03-31 2000-12-05 임구영 사이트 정보 데이터베이스 구축을 통한 인터넷 상에서의정보 검색 방법
JP2001306596A (ja) * 2000-04-17 2001-11-02 Sharp Corp ネットワーク情報の表示方法およびその方法をプログラムとして格納した記録媒体ならびにそのプログラムを実行するコンピュータ
JP3606556B2 (ja) * 2000-05-16 2005-01-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報整理方法、情報処理装置、記憶媒体、およびプログラム伝送装置
JP2002092025A (ja) * 2000-09-18 2002-03-29 Sanyo Electric Co Ltd サービスプロバイダ・サーバ
JP2004206211A (ja) * 2002-12-24 2004-07-22 Casio Comput Co Ltd 情報検索装置、情報検索方法、プログラム及びそのプログラムを格納した記録媒体
JP2006139716A (ja) * 2004-11-15 2006-06-01 Nippon Telegr & Teleph Corp <Ntt> 話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体
KR100850776B1 (ko) * 2006-07-24 2008-08-06 한국과학기술정보연구원 트리구조를 이용한 무 검색어 검색 시스템 및 그에 따른검색방법

Also Published As

Publication number Publication date
KR100953491B1 (ko) 2010-04-16
JP2011118946A (ja) 2011-06-16
JP2009064435A (ja) 2009-03-26
KR20090025536A (ko) 2009-03-11
JP4751430B2 (ja) 2011-08-17

Similar Documents

Publication Publication Date Title
US8347231B2 (en) Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content
US20090094189A1 (en) Methods, systems, and computer program products for managing tags added by users engaged in social tagging of content
US20100313149A1 (en) Aggregating dynamic visual content
US8589390B2 (en) Data creating apparatus and data creating method
KR20170091142A (ko) 웹 콘텐츠 태깅 및 필터링
US20070288477A1 (en) Information processing apparatus, information processing system, information processing method, and computer program
TW201514845A (zh) 從網頁擷取標題及主體
JP2013519932A (ja) 共有可能なユーザインタフェースで情報を構造化するための方法およびシステム
JP2010538386A (ja) クエリ別検索コレクション生成方法およびシステム
JP2017535860A (ja) マルチメディア内容の提供方法および装置
KR20080040064A (ko) 사진 기반 통합 컨텐츠 생성 및 제공 시스템 그리고 그방법.
KR100853308B1 (ko) 항목 타입별 구조화된 검색
RU2562397C2 (ru) Способ и устройство для добавления адреса гиперссылки в закладку
JP2008176782A (ja) 関心事を反映して抽出した情報提供方法及びシステム
JP5216887B2 (ja) 最新情報提供方法
CN110955855B (zh) 一种信息拦截的方法、装置及终端
CN108108381B (zh) 页面的监测方法及装置
JP5000801B2 (ja) インターネット補助システム
JP2004341942A (ja) コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類用プログラムおよびコンテンツ分類用プログラムを記憶した記憶媒体
JP2014157542A (ja) 端末装置および装置のプログラム
US20120330953A1 (en) Document taxonomy generation from tag data using user groupings of tags
JP6260347B2 (ja) プログラム、情報処理装置、電子コンテンツ表示システムおよび表示抑制方法
KR101083669B1 (ko) 인터넷을 활용한 전문가 웹사이트 검색시스템 및 그 방법
KR20090053109A (ko) 이미지 시맨틱 메타데이터 생성 장치 및 그 방법과 그를이용한 이미지 시맨틱 메타데이터 제공 시스템 및 그 방법
JP2004088454A (ja) 画像情報表示システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130304

R150 Certificate of patent or registration of utility model

Ref document number: 5216887

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250